Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6158736B2 - Information processing apparatus, information processing system, and information processing program - Google Patents
[go: Go Back, main page]

JP6158736B2 - Information processing apparatus, information processing system, and information processing program - Google Patents

Information processing apparatus, information processing system, and information processing program Download PDF

Info

Publication number
JP6158736B2
JP6158736B2 JP2014072104A JP2014072104A JP6158736B2 JP 6158736 B2 JP6158736 B2 JP 6158736B2 JP 2014072104 A JP2014072104 A JP 2014072104A JP 2014072104 A JP2014072104 A JP 2014072104A JP 6158736 B2 JP6158736 B2 JP 6158736B2
Authority
JP
Japan
Prior art keywords
character
data
font
unit
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014072104A
Other languages
Japanese (ja)
Other versions
JP2015194873A (en
Inventor
原 博幸
博幸 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2014072104A priority Critical patent/JP6158736B2/en
Priority to CN201510111871.5A priority patent/CN104954605B/en
Priority to US14/665,015 priority patent/US9514394B2/en
Priority to EP15161595.2A priority patent/EP2927843B1/en
Publication of JP2015194873A publication Critical patent/JP2015194873A/en
Application granted granted Critical
Publication of JP6158736B2 publication Critical patent/JP6158736B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、情報処理装置、情報処理システム、及び情報処理プログラムに係り、特に画像データを文書データに変更可能な情報処理装置、情報処理システム、及び情報処理プログラムに関する。   The present invention relates to an information processing apparatus, an information processing system, and an information processing program, and more particularly to an information processing apparatus, an information processing system, and an information processing program that can change image data into document data.

従来から、文書や画像を印刷可能な複合機(Multifunctional Peripheral, MFP)等の画像形成装置(情報処理装置)が存在する。
これらの画像形成装置には、スキャナー等で取得された画像データを、PDF(Portable Document Format)等の文書データに変換する機能を備えるものが存在する。
2. Description of the Related Art Conventionally, there are image forming apparatuses (information processing apparatuses) such as multifunction peripherals (MFPs) capable of printing documents and images.
Some of these image forming apparatuses have a function of converting image data acquired by a scanner or the like into document data such as PDF (Portable Document Format).

このような装置の例として、特許文献1を参照すると、画像データから、少なくとも文字属性を含む属性データを抽出する属性分離手段と、属性分離手段により抽出された属性データのうち文字属性については、予め記憶された文字フォントのいずれに対応するかを判定し、当該判定されたフォントに対応するアウトラインを用いてベクトル化し、文字属性以外の属性については、線画としてアウトラインをとってベクトル化するベクトル化処理手段と、ベクトル化処理手段によりベクトル化されたベクトル化属性データを、画像データとともに他の装置に送信する送信手段とを備えることを特徴とする画像処理装置が開示されている。   As an example of such an apparatus, referring to Patent Literature 1, attribute separation means for extracting attribute data including at least a character attribute from image data, and character attributes among attribute data extracted by the attribute separation means, Vectorization that determines which character font is stored in advance, vectorizes it using the outline corresponding to the determined font, and vectorizes by taking the outline as a line drawing for attributes other than character attributes There is disclosed an image processing apparatus comprising: a processing unit; and a transmission unit that transmits vectorized attribute data vectorized by the vectorization processing unit together with image data to another device.

特開2009−284171号公報JP 2009-284171 A

しかしながら、特許文献1の技術では、文字をベクトル化するだけなので、その文字のフォントの種類や文字サイズのようなフォント情報を取得することができなかった。
つまり、画像データの元となる、ワードプロセッサーソフトウェア等で作成したときのフォント情報が分からないため、画像データを、元の原稿と同様の文書データに変換することはできなかった。
However, since the technique of Patent Document 1 only vectorizes a character, it cannot acquire font information such as the font type and character size of the character.
That is, since the font information when the image data is created by word processor software or the like is unknown, the image data cannot be converted into the same document data as the original document.

本発明は、このような状況に鑑みてなされたものであって、上述の問題点を解消する画像形成装置を提供することを課題とする。   The present invention has been made in view of such a situation, and an object thereof is to provide an image forming apparatus that solves the above-described problems.

本発明の情報処理装置は、取得した画像データを文書データに変更し出力する情報処理装置において、前記画像データと、複数のフォント及び文字サイズのフォントのフォント照合データとを記憶する記憶手段と、前記記憶手段に記憶された前記画像データから文字を認識する文字認識手段と、前記文字認識手段により前記文字と認識された前記画像データの領域について、認識された前記文字が、前記記憶手段に記憶された前記フォント照合データ内の複数のフォント及び複数の文字サイズのいずれに該当するか照合するフォント照合手段と、前記フォント照合手段で照合された前記フォント及び前記文字サイズを文字属性データとして前記文書データに対して設定し、且つ、前記文字の描画位置を前記画像データに対応するよう前記文字属性データとして前記文書データに対して設定する文字属性データ設定手段とを備え、前記文字属性データ設定手段は、(1)照合された前記フォント照合データ内の前記フォント及び前記文字サイズと、前記文書データの前記文字の画像とを比較して、一番一致する座標を算出し、この座標に基づいて前記文字の原点を算出する原点算出処理を行い、(2)照合された前記フォント照合データ内の前記フォントと前記文字サイズとを指定して、少なくとも、前記文章データの前記文字の描画領域であるバウンディングボックスと、前記原点算出処理で算出された前記文字の原点及び次の文字の原点である次原点と、前記文字のサイドベアリングと、前記文字の文字幅とを含む描画データを前記文字属性データとして前記文書データに対して設定する文字描画位置補正設定処理を行い、(3)前記文書データ中の隣り合う文字について、前記原点と前記次原点とが一致するか否かを判定し、一致すると判定された場合、前記隣り合う文字を同一の文章内の文字であることを示す前記文字属性データとして前記文書データに対して設定する同一文章設定処理を行うことを特徴とする。
本発明の情報処理装置は、前記フォント照合手段は、(1)前記文字認識手段により認識された前記文字に対応する前記フォント照合データ内の前記フォントの前記バウンディングボックスの大きさを算出して、認識された前記文字の文字サイズを推定し、(2)前記フォント照合データ内の複数の前記フォント又は複数の前記文字サイズが推定された場合、認識された前記文字と複数の前記フォント及び複数の前記文字サイズのいずれか又は両方とを画像比較して類似度を算出し、(3)前記類似度が最も高い前記フォント及び前記文字サイズを選択し、選択された前記フォント及び前記文字サイズの、認識された前記文字に対する前記類似度が所定の閾値以上の場合に前記フォント及び前記文字サイズに該当し照合されたと判定し、前記類似度が前記所定の閾値よりも低い場合に該当する前記フォント及び前記文字サイズがなく照合されなかったと判定することを特徴とする。
本発明の情報処理装置は、前記フォント照合手段により該当する前記フォント及び前記文字サイズがなく照合されなかったと判定された場合、前記文字と認識された前記画像データの領域について、前記文書データ内の前記文字の情報を削除して、線画のデータに置き換える文字画像切換手段を更に備えることを特徴とする。
本発明の情報処理システムは、画像形成装置において入力された画像データと、前記画像データを文書データに変更するサーバーとを備えた情報処理システムにおいて、前記サーバーは、前記画像データと、複数のフォント及び文字サイズのフォントのフォント照合データとを記憶する記憶手段と、前記記憶手段に記憶された前記画像データから文字を認識する文字認識手段と、前記文字認識手段により前記文字と認識された前記画像データの領域について、認識された前記文字が、前記記憶手段に記憶された前記フォント照合データ内の複数のフォント及び複数の文字サイズのいずれに該当するか照合するフォント照合手段と、前記フォント照合手段で照合された前記フォント及び前記文字サイズを文字属性データとして前記文書データに対して設定し、且つ、前記文字の描画位置を前記画像データに対応するよう前記文字属性データとして前記文書データに対して設定する文字属性データ設定手段とを備え、前記文字属性データ設定手段は、(1)照合された前記フォント照合データ内の前記フォント及び前記文字サイズと、前記文書データの前記文字の画像とを比較して、一番一致する座標を算出し、この座標に基づいて前記文字の原点を算出する原点算出処理を行い、(2)照合された前記フォント照合データ内の前記フォントと前記文字サイズとを指定して、少なくとも、前記文章データの前記文字の描画領域であるバウンディングボックスと、前記原点算出処理で算出された前記文字の原点及び次の文字の原点である次原点と、前記文字のサイドベアリングと、前記文字の文字幅とを含む描画データを前記文字属性データとして前記文書データに対して設定する文字描画位置補正設定処理を行い、(3)前記文書データ中の隣り合う文字について、前記原点と前記次原点とが一致するか否かを判定し、一致すると判定された場合、前記隣り合う文字を同一の文章内の文字であることを示す前記文字属性データとして前記文書データに対して設定する同一文章設定処理を行うことを特徴とする。
The information processing apparatus of the present invention, the image data obtained in the information processing apparatus to change the document data output, and the image data, storage means for storing a font matching data of the plurality of fonts and font size font , a character recognizing section for recognizing characters from the image data stored in the storage means, the area of the image data is recognized as the character by the character recognition means, it is recognized the character, in the storage means wherein a font matching means for matching or corresponding to any of the stored plurality of fonts and a plurality of character sizes of the font in the verification data, the font and the character size is matched with the font verification unit as character attribute data set for the document data, and, the sentence so as to correspond to drawing position location of the characters on the image data And a character attribute data setting means for setting as attribute data to the document data, the character attribute data setting means (1) collated the font and said character size, the document of the font in the matching data Compare the image of the character with the image of the character, calculate the best matching coordinate, perform an origin calculation process to calculate the origin of the character based on this coordinate, and (2) within the collated font verification data Designating the font and the character size, and at least a bounding box that is a drawing area of the character of the text data, and the origin of the character and the origin of the next character calculated in the origin calculation process Drawing data including a next origin, a side bearing of the character, and a character width of the character is used as the character attribute data for the document data. A character drawing position correction setting process to be set is performed. (3) For adjacent characters in the document data, it is determined whether or not the origin and the next origin coincide with each other. The same sentence setting process is performed in which the document data is set as the character attribute data indicating that matching characters are characters in the same sentence .
In the information processing apparatus of the present invention, the font collating unit calculates (1) the size of the bounding box of the font in the font collation data corresponding to the character recognized by the character recognizing unit, Estimating the character size of the recognized character; (2) when the plurality of fonts or the plurality of character sizes in the font collation data are estimated, the recognized character, the plurality of fonts, and the plurality of characters Image similarity is calculated by comparing either or both of the character sizes, and (3) the font and the character size having the highest similarity are selected, and the selected font and the character size are selected. When the similarity with respect to the recognized character is equal to or greater than a predetermined threshold, it is determined that the font and the character size are matched, and Similarity score is equal to or determines that said font and the character size corresponding to when the predetermined lower than the threshold value has not been collated without.
In the information processing apparatus according to the present invention, when it is determined by the font collating means that the corresponding font and the character size are not collated, the area of the image data recognized as the character is included in the document data. Character image switching means for deleting the character information and replacing it with line drawing data is further provided.
The information processing system of the present invention includes an image data input in the image forming apparatus, an information processing system including a server for changing the image data to the document data, the server, and the image data, a plurality of fonts and storage means for storing the font of font matching data character size, a character recognizing section for recognizing characters from the image data stored in the storage means, the image that has been recognized as the characters by the character recognition means the region of the data, recognized the character, and font matching means for matching or corresponding to any of a plurality of fonts and a plurality of character sizes of the font within the collation data stored in said storage means, said font verification unit wherein the document data in collated the font and the character size was as character attribute data And configure, and the drawing position location of the character and a character attribute data setting means for setting to the document data as the character attribute data so as to correspond to the image data, the character attribute data setting means (1) The font and the character size in the collated font collation data are compared with the image of the character of the document data to calculate the best matching coordinates, and based on the coordinates, Performing origin calculation processing for calculating the origin of the character; (2) specifying the font and the character size in the collated font collation data, and at least a bounding area that is a drawing area of the character data in the text data A box, a next origin which is the origin of the character and the origin of the next character calculated in the origin calculation process, a side bearing of the character, and the sentence A character drawing position correction setting process for setting the drawing data including the character width of the character data as the character attribute data for the document data. (3) For the adjacent characters in the document data, the origin and the next origin Is set to the document data as the character attribute data indicating that the adjacent character is a character in the same sentence. It is characterized by performing processing .

本発明によれば、照合されたフォント及び文字サイズを文書データに設定し、文字の描画位置を設定することで、元の原稿と同様の文書データを作成可能な情報処理装置を提供することができる。   According to the present invention, it is possible to provide an information processing apparatus capable of creating document data similar to the original document by setting the collated font and character size in the document data and setting the character drawing position. it can.

本発明の実施の形態に係る画像形成システムの構成を示すブロック図である1 is a block diagram illustrating a configuration of an image forming system according to an embodiment of the present invention. 図1に示す画像形成装置の全体構成を示すブロック図である。It is a block diagram which shows the whole structure of the image forming apparatus shown in FIG. 図1に示す画像形成装置の概略図である。FIG. 2 is a schematic diagram of the image forming apparatus illustrated in FIG. 1. 図1に示すサーバーの概略図である。It is the schematic of the server shown in FIG. 図1に示すサーバーの制御構成を示すブロック図である。It is a block diagram which shows the control structure of the server shown in FIG. 本発明の実施の形態に係る画像ファイル化処理のフローチャートである。It is a flowchart of the image file formation process which concerns on embodiment of this invention. 図6に示す文字認識処理の概念図である。It is a conceptual diagram of the character recognition process shown in FIG. 図6に示す文字サイズ推定処理及び一致フォント算出処理の概念図である。FIG. 7 is a conceptual diagram of character size estimation processing and matching font calculation processing shown in FIG. 6. 図6に示す原点算出処理及び文字描画位置補正処理の概念図である。FIG. 7 is a conceptual diagram of an origin calculation process and a character drawing position correction process shown in FIG. 6. 図6に示す文字描画位置補正処理に係る描画データの概念図である。It is a conceptual diagram of the drawing data which concern on the character drawing position correction process shown in FIG. 図6に示す同一文章設定処理の概念図である。It is a conceptual diagram of the same sentence setting process shown in FIG.

<実施の形態>
〔画像形成システムXの構成〕
<Embodiment>
[Configuration of image forming system X]

まず、図1により、画像形成システムXの構成について説明する。画像形成システムXは、例えば、画像形成装置1及びサーバー2を含んで構成される。
画像形成装置1は、スキャナー等を備えたMFP等であり、サーバー2に対して画像データ200(図5)を送信する。
サーバー2は、データセンター等に載置されたPC/AT互換機等のPCサーバーやARM(登録商標)サーバー等の情報処理装置である。また、サーバー2は、ユーザーのPC(Personal Computer)、スマートフォン、携帯電話、PDA(Personal Digital Assistant)等の端末であり、インストールされたサーバープログラムを実行して情報処理装置として機能する構成であってもよい。サーバー2は、画像形成装置1から取得した画像データについて、後述する画像ファイル化処理を行う。
画像形成装置1、及びサーバー2は、LAN(Local Area Network)、無線LAN、WAN(Wide Area Network)、携帯電話網等であるネットワーク5に接続されている。
First, the configuration of the image forming system X will be described with reference to FIG. The image forming system X includes, for example, an image forming apparatus 1 and a server 2.
The image forming apparatus 1 is an MFP or the like equipped with a scanner or the like, and transmits image data 200 (FIG. 5) to the server 2.
The server 2 is an information processing apparatus such as a PC server such as a PC / AT compatible machine or an ARM (registered trademark) server installed in a data center or the like. The server 2 is a terminal such as a user's PC (Personal Computer), a smartphone, a mobile phone, or a PDA (Personal Digital Assistant), and is configured to execute an installed server program and function as an information processing apparatus. Also good. The server 2 performs image file conversion processing described later on the image data acquired from the image forming apparatus 1.
The image forming apparatus 1 and the server 2 are connected to a network 5 such as a LAN (Local Area Network), a wireless LAN, a WAN (Wide Area Network), and a mobile phone network.

〔画像形成装置1の全体の構成〕
次に、図2により、画像形成装置1の全体の構成について説明する。画像形成装置1は、画像処理部11、原稿読取部12、原稿給送部13、搬送部(給紙ローラー42b、搬送ローラー対44、排出ローラー対45)、ネットワーク送受信部15、操作パネル部16、画像形成部17(画像形成手段)、及び記憶部19等が、制御部10に接続されている。各部は、制御部10によって動作制御される。
[Entire Configuration of Image Forming Apparatus 1]
Next, the overall configuration of the image forming apparatus 1 will be described with reference to FIG. The image forming apparatus 1 includes an image processing unit 11, a document reading unit 12, a document feeding unit 13, a conveyance unit (a paper feed roller 42 b, a conveyance roller pair 44, a discharge roller pair 45), a network transmission / reception unit 15, and an operation panel unit 16. The image forming unit 17 (image forming unit), the storage unit 19 and the like are connected to the control unit 10. The operation of each unit is controlled by the control unit 10.

制御部10は、GPP(General Purpose Processor)、CPU(Central Processing Unit、中央処理装置)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor)、GPU(Graphics Processing Unit)、ASIC(Application Specific Processor、特定用途向けプロセッサー)等の情報処理手段である。
制御部10は、記憶部19のROMやHDDに記憶されている制御プログラムを読み出して、この制御プログラムをRAMに展開させて実行することで、後述する機能ブロックの各手段として動作させられる。また、制御部10は、図示しない外部の端末や操作パネル部16から入力された所定の指示情報に応じて、装置全体の制御を行う。
The control unit 10 includes a general purpose processor (GPP), a central processing unit (CPU), a micro processing unit (MPU), a digital signal processor (DSP), a graphics processing unit (GPU), and an application specific processor (ASIC). Information processing means such as a processor for a specific application)
The control unit 10 reads out a control program stored in the ROM or HDD of the storage unit 19, develops the control program in the RAM, and executes it to operate as each unit of a functional block described later. Further, the control unit 10 controls the entire apparatus in accordance with predetermined instruction information input from an external terminal (not shown) or the operation panel unit 16.

画像処理部11は、DSP(Digital Signal Processor)やGPU(Graphics Processing Unit)等の制御演算手段である。画像処理部11は、各種の画像のデータに対して所定の画像処理を行う手段であり、例えば、拡大縮小、濃度調整、階調調整、画像改善等の各種画像処理を行う。
画像処理部11は、原稿読取部12で読み取られた画像を、記憶部19に印刷データとして記憶する。この際、画像処理部11は、印刷データをPDFやTIFF等のフォーマットのファイル単位に変換することも可能である。
The image processing unit 11 is control arithmetic means such as a DSP (Digital Signal Processor) or a GPU (Graphics Processing Unit). The image processing unit 11 is a unit that performs predetermined image processing on various types of image data, and performs various types of image processing such as enlargement / reduction, density adjustment, gradation adjustment, and image improvement.
The image processing unit 11 stores the image read by the document reading unit 12 in the storage unit 19 as print data. At this time, the image processing unit 11 can also convert the print data into a file unit in a format such as PDF or TIFF.

原稿読取部12は、セットされた原稿を読み取る(スキャン)手段である。
原稿給送部13は、原稿読取部12で読み取られる原稿を搬送する手段である。
画像形成部17は、ユーザーの出力指示により、記憶部19に記憶され、原稿読取部12で読み取られ、又は外部の端末から取得されたデータから記録紙への画像形成を行わせる手段である。
搬送部は、給紙カセット42a(図3)から記録紙を搬送し、画像形成部17で画像形成させ、その後にスタックトレイ50へ搬送する。
なお、原稿読取部12、原稿給送部13、搬送部、画像形成部17の動作については後述する。
The document reading unit 12 is a (scan) unit that reads a set document.
The document feeding unit 13 is a unit that transports a document read by the document reading unit 12.
The image forming unit 17 is a unit that forms an image on a recording sheet from data stored in the storage unit 19 and read by the document reading unit 12 or acquired from an external terminal according to a user output instruction.
The transport unit transports the recording paper from the paper feed cassette 42a (FIG. 3), causes the image forming unit 17 to form an image, and then transports the recording paper to the stack tray 50.
The operations of the document reading unit 12, the document feeding unit 13, the transport unit, and the image forming unit 17 will be described later.

ネットワーク送受信部15は、LAN、無線LAN、WAN、携帯電話網等の外部ネットワークに接続するためのLANボードや無線送受信機等を含むネットワーク接続手段である。
ネットワーク送受信部15は、データ通信用の回線ではデータを送受信し、音声電話回線では音声信号を送受信する。
ネットワーク送受信部15は、ネットワークを介して、図示しないPC(Personal Computer)やスマートフォンやPDA(Personal Data Assistant)や携帯電話等の外部の端末、サーバー等に接続されていてもよい。
The network transmission / reception unit 15 is a network connection unit including a LAN board, a wireless transceiver, and the like for connecting to an external network such as a LAN, a wireless LAN, a WAN, and a mobile phone network.
The network transmission / reception unit 15 transmits / receives data on a data communication line and transmits / receives voice signals on a voice telephone line.
The network transmission / reception unit 15 may be connected to an external terminal such as a PC (Personal Computer), a smartphone, a PDA (Personal Data Assistant), a mobile phone, or a server (not shown) via a network.

操作パネル部16は、LCD等の表示部と、テンキー、スタート、キャンセル、複写やFAX送信やスキャナー等の動作モードの切り換えのボタンと、選択された文書の印刷や送信や保存や記録等に関するジョブの実行に係る指示を行うためのボタンやタッチパネル等の入力部とを備えている。
操作パネル部16は、画像形成装置1へユーザーの指示を取得する。このユーザーの指示により、後述する画像ファイル化処理が開始される。また、ユーザーの指示により、各ユーザーの情報を入力、変更することも可能である。
また、操作パネル部16には、USBメモリーやフラッシュメモリーカードや外部機器等の画像データ200(図5)を記憶した記録媒体を接続するための接続部が備えられていてもよい。
The operation panel unit 16 includes a display unit such as an LCD, a numeric keypad, a start button, a cancel button, a button for switching an operation mode such as copying, FAX transmission, and a scanner, and a job related to printing, transmission, storage, and recording of a selected document. And an input unit such as a button or a touch panel for giving an instruction related to the execution of.
The operation panel unit 16 acquires a user instruction to the image forming apparatus 1. In response to the user's instruction, an image filing process described later is started. It is also possible to input and change information of each user according to user instructions.
Further, the operation panel unit 16 may include a connection unit for connecting a recording medium storing the image data 200 (FIG. 5) such as a USB memory, a flash memory card, or an external device.

記憶部19は、ROM(Read Only Memory)、RAM(Random Access Memory)等の半導体メモリーやHDD(Hard Disk Drive)等の記録媒体を用いた記憶手段である。
記憶部19のRAMは、省電力状態であっても、セルフリフレッシュ等の機能により、記憶内容が保持される。
記憶部19のROMやHDDには画像形成装置1の動作制御を行うための制御プログラムが記憶されている。これに加えて、記憶部19は、ユーザーのアカウント設定も記憶している。また、記憶部19には、ユーザー毎の保存フォルダーの領域301が含まれていてもよい。
The storage unit 19 is a storage unit that uses a semiconductor memory such as a ROM (Read Only Memory) or a RAM (Random Access Memory) or a recording medium such as an HDD (Hard Disk Drive).
Even if the RAM of the storage unit 19 is in a power saving state, the stored contents are held by a function such as self-refresh.
A control program for controlling the operation of the image forming apparatus 1 is stored in the ROM and HDD of the storage unit 19. In addition to this, the storage unit 19 also stores user account settings. The storage unit 19 may include a storage folder area 301 for each user.

なお、画像形成装置1において、制御部10及び画像処理部11は、GPU内蔵CPU等やチップ・オン・モジュールパッケージのように、一体的に形成されていてもよい。
また、制御部10及び画像処理部11は、RAMやROMやフラッシュメモリー等を内蔵していてもよい。
また、画像形成装置1は、ファクシミリの送受信を行うFAX送受信部を備えていてもよい。
In the image forming apparatus 1, the control unit 10 and the image processing unit 11 may be integrally formed, such as a CPU with a built-in GPU or a chip-on-module package.
The control unit 10 and the image processing unit 11 may include a RAM, a ROM, a flash memory, and the like.
Further, the image forming apparatus 1 may include a FAX transmission / reception unit that performs facsimile transmission / reception.

〔画像形成装置1の動作〕
次に、図3を参照して、本発明の実施の形態に係る画像形成装置1の動作について説明する。
原稿読取部12は、本体部14の上部に配設され、原稿給送部13は、原稿読取部12の上部に配設されている。スタックトレイ50は、本体部14に形成された記録紙の排出口41側に配設され、また、操作パネル部16は、画像形成装置1のフロント側に配設されている。
[Operation of Image Forming Apparatus 1]
Next, the operation of the image forming apparatus 1 according to the embodiment of the present invention will be described with reference to FIG.
The document reading unit 12 is arranged on the upper part of the main body unit 14, and the document feeding unit 13 is arranged on the upper side of the document reading unit 12. The stack tray 50 is disposed on the recording paper discharge port 41 side formed in the main body unit 14, and the operation panel unit 16 is disposed on the front side of the image forming apparatus 1.

原稿読取部12は、スキャナー12aと、プラテンガラス12bと、原稿読取スリット12cとを備えている。スキャナー12aは、露光ランプ、及びCCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)撮像センサー等から構成され、原稿給送部13による原稿の搬送方向に移動可能に構成されている。
プラテンガラス12bは、ガラス等の透明部材により構成された原稿台である。原稿読取スリット12cは、原稿給送部13による原稿の搬送方向と直交方向に形成されたスリットを有する。
The document reading unit 12 includes a scanner 12a, a platen glass 12b, and a document reading slit 12c. The scanner 12 a includes an exposure lamp, a CCD (Charge Coupled Device), a CMOS (Complementary Metal Oxide Semiconductor) imaging sensor, and the like, and is configured to be movable in the document transport direction by the document feeder 13.
The platen glass 12b is an original table made of a transparent member such as glass. The document reading slit 12 c has a slit formed in a direction orthogonal to the document transport direction by the document feeding unit 13.

プラテンガラス12bに載置された原稿を読み取る場合には、スキャナー12aは、プラテンガラス12bに対向する位置に移動され、プラテンガラス12bに載置された原稿を走査しながら原稿を読み取って画像データ200を取得して、取得した画像データ200を本体部14に備わる制御部10(図2)に出力する。
また、原稿給送部13により搬送された原稿を読み取る場合には、スキャナー12aは、原稿読取スリット12cと対向する位置に移動され、原稿読取スリット12cを介し、原稿給送部13による原稿の搬送動作と同期して原稿を読み取って画像データ200を取得し、取得した画像データ200を本体部14に備わる制御部10に出力する。
When reading a document placed on the platen glass 12b, the scanner 12a is moved to a position facing the platen glass 12b, and reads the document while scanning the document placed on the platen glass 12b, thereby obtaining image data 200. And the acquired image data 200 is output to the control unit 10 (FIG. 2) provided in the main body unit 14.
When reading the document conveyed by the document feeding unit 13, the scanner 12a is moved to a position facing the document reading slit 12c, and the document feeding unit 13 conveys the document through the document reading slit 12c. The document is read in synchronization with the operation to acquire the image data 200, and the acquired image data 200 is output to the control unit 10 provided in the main body unit 14.

原稿給送部13は、原稿載置部13aと、原稿排出部13bと、原稿搬送機構13cとを備えている。原稿載置部13aに載置された原稿は、原稿搬送機構13cによって、1枚ずつ順に繰り出されて原稿読取スリット12cに対向する位置へ搬送され、その後、原稿排出部13bに排出される。
なお、原稿給送部13は、可倒式に構成され、原稿給送部13を上方に持ち上げることで、プラテンガラス12bの上面を開放させることができる。
The document feeding unit 13 includes a document placement unit 13a, a document discharge unit 13b, and a document transport mechanism 13c. The originals placed on the original placement unit 13a are sequentially fed out one by one by the original conveyance mechanism 13c, conveyed to a position facing the original reading slit 12c, and then discharged to the original discharge unit 13b.
The document feeding unit 13 is configured to be retractable, and the upper surface of the platen glass 12b can be opened by lifting the document feeding unit 13 upward.

本体部14は、画像形成部17を備えると共に、給紙部42と、用紙搬送路43と、搬送ローラー対44と、排出ローラー対45とを備えている。給紙部42は、それぞれサイズ又は向きが異なる記録紙を収納する複数の給紙カセット42aと、給紙カセット42aから記録紙を1枚ずつ用紙搬送路43に繰り出す給紙ローラー42bとを備えている。給紙ローラー42b、搬送ローラー対44、及び排出ローラー対45は、搬送部として機能する。記録紙は、この搬送部により搬送される。
給紙ローラー42bによって用紙搬送路43に繰り出された記録紙は、搬送ローラー対44によって画像形成部17に搬送される。そして、画像形成部17によって記録が施された記録紙は、排出ローラー対45によってスタックトレイ50に排出される。
The main body unit 14 includes the image forming unit 17, and includes a paper feeding unit 42, a paper conveyance path 43, a conveyance roller pair 44, and a discharge roller pair 45. The paper feed unit 42 includes a plurality of paper feed cassettes 42 a that store recording papers of different sizes or orientations, and a paper feed roller 42 b that feeds the recording papers one by one from the paper feed cassette 42 a to the paper transport path 43. Yes. The paper feed roller 42b, the transport roller pair 44, and the discharge roller pair 45 function as a transport unit. The recording paper is conveyed by this conveyance unit.
The recording paper fed to the paper transport path 43 by the paper feed roller 42 b is transported to the image forming unit 17 by the transport roller pair 44. Then, the recording paper on which recording is performed by the image forming unit 17 is discharged to the stack tray 50 by the discharge roller pair 45.

画像形成部17は、感光体ドラム17aと、露光部17bと、現像部17cと、転写部17dと、定着部17eとを備えている。露光部17bは、レーザー装置やミラーやレンズやLEDアレイ等を備えた光学ユニットであり、図示しない帯電部により一次帯電された感光体ドラム17aに対して、画像データに基づいて光等を出力して露光し、感光体ドラム17aの表面に静電潜像を形成する。現像部17cは、トナーを用いて感光体ドラム17aに形成された静電潜像を現像する現像ユニットであり、静電潜像に基づいたトナー像を感光体ドラム17a上に形成させる。転写部17dは、現像部17cによって感光体ドラム17a上に形成されたトナー像を記録紙に転写させる。定着部17eは、転写部17dによってトナー像が転写された記録紙を加熱してトナー像を記録紙に定着させる。   The image forming unit 17 includes a photosensitive drum 17a, an exposure unit 17b, a developing unit 17c, a transfer unit 17d, and a fixing unit 17e. The exposure unit 17b is an optical unit including a laser device, a mirror, a lens, an LED array, and the like, and outputs light or the like based on image data to a photosensitive drum 17a that is primarily charged by a charging unit (not shown). And an electrostatic latent image is formed on the surface of the photosensitive drum 17a. The developing unit 17c is a developing unit that develops the electrostatic latent image formed on the photosensitive drum 17a using toner, and forms a toner image based on the electrostatic latent image on the photosensitive drum 17a. The transfer unit 17d transfers the toner image formed on the photosensitive drum 17a by the developing unit 17c to a recording sheet. The fixing unit 17e heats the recording paper on which the toner image is transferred by the transfer unit 17d to fix the toner image on the recording paper.

〔サーバー2の全体の構成〕
次に、図4を参照して、サーバー2(情報処理装置)の全体構成について説明する。
サーバー2は、制御部20、ネットワーク送受信部25、記憶部29を備えている。各部は、制御部20によって動作制御される。
[Entire configuration of server 2]
Next, the overall configuration of the server 2 (information processing apparatus) will be described with reference to FIG.
The server 2 includes a control unit 20, a network transmission / reception unit 25, and a storage unit 29. The operation of each unit is controlled by the control unit 20.

制御部20は、GPP、CPU、MPU、DSP、GPU(Graphics Processing Unit)、ASIC等である演算・制御能力を備えた情報処理部である。制御部20は、記憶部29に記憶されたプログラムを、ハードウェア資源を用いて実行する。   The control unit 20 is an information processing unit having calculation / control capabilities such as GPP, CPU, MPU, DSP, GPU (Graphics Processing Unit), ASIC, and the like. The control unit 20 executes the program stored in the storage unit 29 using hardware resources.

ネットワーク送受信部25は、ネットワーク5に接続するための、例えば1000BASE−T/100BASE−TX等の規格のLANインターフェイスや無線LANインターフェイスや携帯電波送受信デバイス等である。サーバー2は、ネットワーク送受信部25を介して、各種データを送受信可能である。
なお、ネットワーク送受信部25は、外部のハブやルータ等に接続され、ネットワーク5に接続されていてもよい。
The network transmitting / receiving unit 25 is a standard LAN interface such as 1000BASE-T / 100BASE-TX, a wireless LAN interface, a portable radio wave transmitting / receiving device, or the like for connecting to the network 5. The server 2 can transmit / receive various data via the network transmitting / receiving unit 25.
The network transmitting / receiving unit 25 may be connected to an external hub, router, or the like and connected to the network 5.

記憶部29は、RAM、SSD(Solid State Drive)等のフラッシュメモリーディスク、HDD(Hard Disk Drive)、磁気テープ装置、光ディスク装置等を含む記憶手段である。記憶部29は、サーバー2を機能させるためのOS(Operating System)やサーバーの各種プログラム及びデータを記憶している。これらのプログラム及びデータの詳細については後述する。   The storage unit 29 is a storage means including a RAM, a flash memory disk such as an SSD (Solid State Drive), an HDD (Hard Disk Drive), a magnetic tape device, an optical disk device, and the like. The storage unit 29 stores an OS (Operating System) for causing the server 2 to function and various programs and data of the server. Details of these programs and data will be described later.

〔サーバー2の制御構成〕
ここで、図5により、サーバー2の制御構成について説明する。
サーバー2の制御部20は、画像データ取得部100(画像データ取得手段)、文字認識部110(文字認識手段)、フォント照合部120(フォント照合手段)、文字属性データ設定部130(文字属性データ設定手段)、文字画像切換部140(文字画像切換手段)を備えている。
記憶部29は、画像データ200、文書データ210、及びフォント照合データ220を記憶する。
ネットワーク送受信部25は、画像データ200を受信し、変換された文書データ210を送信する。
[Control configuration of server 2]
Here, the control configuration of the server 2 will be described with reference to FIG.
The control unit 20 of the server 2 includes an image data acquisition unit 100 (image data acquisition unit), a character recognition unit 110 (character recognition unit), a font collation unit 120 (font collation unit), and a character attribute data setting unit 130 (character attribute data). Setting means) and a character image switching unit 140 (character image switching means).
The storage unit 29 stores image data 200, document data 210, and font collation data 220.
The network transmission / reception unit 25 receives the image data 200 and transmits the converted document data 210.

画像データ取得部100は、OCR(Optical Character Recognition、光学文字認識)等を行うための画像データ200を取得する。
画像データ取得部100は、画像形成装置1から送信され、ネットワーク5を介してネットワーク送受信部25で受信した画像データ200を取得して、記憶部29に記憶する。
この際、画像データ取得部100は、ユーザーの「ネットワークスキャン」等の指示により、印刷された文字を含む原稿を原稿読取部12でスキャンさせ、画像データ200としてサーバー2に送信させてもよい。
なお、画像データ取得部100は、画像形成装置1の操作パネル部16を操作可能なユーザーの指示により、原稿読取部12でスキャンされた画像データ200や、文書ボックス中の画像データ200を、サーバー2に送信させてもよい。
また、画像データ取得部100は、接続された記録媒体や外部の端末やサーバー等から画像データ200を取得してもよい。
The image data acquisition unit 100 acquires image data 200 for performing OCR (Optical Character Recognition) or the like.
The image data acquisition unit 100 acquires the image data 200 transmitted from the image forming apparatus 1 and received by the network transmission / reception unit 25 via the network 5 and stores it in the storage unit 29.
At this time, the image data acquisition unit 100 may cause the document reading unit 12 to scan a document including printed characters and transmit the image data 200 to the server 2 according to a user's instruction such as “network scan”.
The image data acquisition unit 100 stores the image data 200 scanned by the document reading unit 12 or the image data 200 in the document box in accordance with a user instruction that can operate the operation panel unit 16 of the image forming apparatus 1. 2 may be transmitted.
Further, the image data acquisition unit 100 may acquire the image data 200 from a connected recording medium, an external terminal, a server, or the like.

文字認識部110は、画像データ取得部100により取得された画像データ200を光学文字認識等して文字を認識する。
文字認識部110は、例えば、画像データ200から文字が描画されている領域301を認識し、文字の線画のベクトル等を算出し、このベクトルについて、人工ニューラルネット等により、文字コードを判別する。この上で、文字認識部110は、文書データ210に、文字属性データ211として判別された文字コードを設定する。
また、文字認識部110は、例えば、光学文字認識の際に、画像データ200内で文字と認識された領域301の座標、文字の線画のベクトル等のデータについても、記憶部29に記憶してもよい。
The character recognition unit 110 recognizes characters by optical character recognition or the like of the image data 200 acquired by the image data acquisition unit 100.
For example, the character recognition unit 110 recognizes a region 301 in which a character is drawn from the image data 200, calculates a line drawing vector of the character, and the like, and determines a character code by using an artificial neural network or the like. Then, the character recognition unit 110 sets the character code determined as the character attribute data 211 in the document data 210.
In addition, the character recognition unit 110 also stores in the storage unit 29 data such as the coordinates of the area 301 recognized as a character in the image data 200 and the vector of the line drawing of the character during optical character recognition, for example. Also good.

フォント照合部120は、文字認識部110により文字と認識された画像データ200の領域301について、認識された文字が、フォント照合データ220に含まれる複数のフォント及び複数の文字サイズのいずれに該当するか照合する。
フォント照合部120は、例えば、文字認識部110により出力された文字コードに対応するフォント照合データ220のフォントの描画データの描画領域である「バウンディングボックス」の大きさを算出して、文字サイズを推定する。フォント照合部120は、複数のフォント又は文字サイズが推定された場合、このフォント及び文字サイズのいずれか又は両方を画像比較し、類似度を算出することで照合を行う。フォント照合部120は、類似度が最も高いフォント及び文字サイズを選択する。フォント照合部120は、この選択されたフォント及び文字サイズが所定の閾値以上の類似度であった場合、このフォント及び文字サイズに該当し、照合されたと判断する。また、フォント照合部120は、所定の閾値よりも類似度が低い場合には、該当するフォント及び文字サイズがなく、照合されなかったと判断する。
The font collation unit 120 corresponds to any of a plurality of fonts and a plurality of character sizes included in the font collation data 220 for the region 301 of the image data 200 recognized as a character by the character recognition unit 110. Or collate.
For example, the font collation unit 120 calculates the size of the “bounding box” that is the drawing area of the drawing data of the font of the font collation data 220 corresponding to the character code output by the character recognition unit 110, and sets the character size. presume. When a plurality of fonts or character sizes are estimated, the font collation unit 120 performs image collation by comparing one or both of the fonts and character sizes and calculating a similarity. The font collation unit 120 selects a font and a character size having the highest similarity. If the selected font and character size have a similarity equal to or greater than a predetermined threshold, the font collation unit 120 determines that the font and character size correspond to each other and have been collated. Further, when the similarity is lower than a predetermined threshold, the font collation unit 120 determines that there is no corresponding font and character size and the collation has not been performed.

文字属性データ設定部130は、フォント照合部120で照合されたフォント及び文字サイズを文書データ210に設定し、文字の描画位置も画像データ200に対応するよう設定する。
文字属性データ設定部130は、例えば、文書データ210の文字属性データ211の各文字について、フォント照合部120により該当すると判断されたフォント及び文字サイズに設定する。また、文字属性データ設定部130は、この文字が閲覧や印刷される際に、画像データ200と対応する描画位置になるように設定する。このため、文字属性データ設定部130は、文字の描画位置として、描画の原点401(図8)、文字幅404、及び左サイドベアリング403を画像データ200に対応するよう設定する。なお、文字属性データ設定部130は、右、上、下等のサイドベアリングが設定されている文書データ210についても、画像データ200に対応するよう設定してもよい。
また、文字属性データ設定部130は、フォント照合部120で照合された文字に対応して算出された原点401に対応して次に文字が描画される次原点402を算出し、当該次原点402と次の文字の原点401とが一致した場合、同一の文章321(図11)内の文字として文書データ210に設定する。
これにより、文書データ210が閲覧されたり画像形成部17で出力されたりした場合に、画像データとほぼ同じ位置に文字が描画される。また、画像データ200の元になった原稿と同様の文毎に文字をまとめることができ、ユーザーの利便性が高まる。
The character attribute data setting unit 130 sets the font and character size collated by the font collation unit 120 in the document data 210, and sets the character drawing position so as to correspond to the image data 200.
For example, the character attribute data setting unit 130 sets, for each character of the character attribute data 211 of the document data 210, a font and a character size determined to be applicable by the font collation unit 120. Also, the character attribute data setting unit 130 sets the drawing position corresponding to the image data 200 when the character is browsed or printed. Therefore, the character attribute data setting unit 130 sets the drawing origin 401 (FIG. 8), the character width 404, and the left side bearing 403 to correspond to the image data 200 as the character drawing position. Note that the character attribute data setting unit 130 may also set the document data 210 in which the side bearings such as right, upper, and lower are set so as to correspond to the image data 200.
In addition, the character attribute data setting unit 130 calculates a next origin 402 where the next character is drawn corresponding to the origin 401 calculated corresponding to the character collated by the font collation unit 120, and the next origin 402 And the origin 401 of the next character coincide with each other, it is set in the document data 210 as a character in the same sentence 321 (FIG. 11).
Thereby, when the document data 210 is browsed or output by the image forming unit 17, characters are drawn at substantially the same position as the image data. In addition, characters can be grouped for each sentence similar to the original document from which the image data 200 is based, and the convenience for the user is enhanced.

文字画像切換部140は、画像データ200の領域301に対応する文書データ210の描画位置に対して、フォント照合部120により、フォント照合データ220に含まれる複数のフォント及び複数の文字サイズのいずれにも該当しないとして照合されなかった場合は、文字を含まない線画又は画像の描画データを文書データ210に設定する。
なお、文字画像切換部140は、フォント照合部120により、フォント照合データ220に含まれる複数のフォント及び複数の文字サイズのいずれかに該当すると照合された場合は、認識された文字の描画データが文字属性データ211として文書データ210に設定されたままにしてもよい。
The character image switching unit 140 causes the font collation unit 120 to select any of a plurality of fonts and a plurality of character sizes included in the font collation data 220 with respect to the drawing position of the document data 210 corresponding to the region 301 of the image data 200. If the image data is not matched, the drawing data of the line drawing or image that does not include characters is set in the document data 210.
Note that the character image switching unit 140, when the font collation unit 120 collates with one of a plurality of fonts and a plurality of character sizes included in the font collation data 220, draws the recognized character drawing data. The character attribute data 211 may be left set in the document data 210.

画像データ200は、光学文字認識が可能な解像度の文字の画像を含むデータである。画像データ200は、例えば、原稿読取部12で読み取られ画像処理部11で画像処理されたデータであってもよい。
また、画像データ200は、RGBカラーやCMYKカラーやモノクロやグレースケールのビットマップ画像のファイルや、ランレングスやLZW等で軽度に圧縮されたファイル等であってもよい。
また、画像データ200は、サーバー2の制御部20、画像形成装置1の制御部10や画像処理部11で既にPDFやJPG(Joint Photographic Experts Group)やPNG(Portable Network Graphics)やBMP(Bitmap Image)やTIFF(Tagged Image File Format)等の形式に変換されたファイルであってもよい。
また、画像データ200は、記憶部29の文書ボックス、接続された記録媒体、外部の端末や他のサーバー等から取得された画像を含むJPGやPDF等の画像のファイルであってもよい。
また、画像データ200がPDFの場合、既に文字認識された文字属性データ211が含まれていてもよい。
また、画像データ200は、ファクシミリ受信されたJBIG等の画像のデータであってもよい。
The image data 200 is data including a character image having a resolution that enables optical character recognition. The image data 200 may be, for example, data read by the document reading unit 12 and image processed by the image processing unit 11.
Further, the image data 200 may be a RGB image, a CMYK color, a monochrome or grayscale bitmap image file, a file that is lightly compressed with a run length, LZW, or the like.
Further, the image data 200 is already transferred to PDF, JPG (Joint Photographic Experts Group), PNG (Portable Network Graphics), BMP (Bitmap Image) by the control unit 20 of the server 2, the control unit 10 of the image forming apparatus 1, and the image processing unit 11. ) Or TIFF (Tagged Image File Format) or the like.
The image data 200 may be an image file such as JPG or PDF including an image acquired from a document box in the storage unit 29, a connected recording medium, an external terminal, another server, or the like.
In addition, when the image data 200 is a PDF, character attribute data 211 that has already been recognized may be included.
The image data 200 may be image data such as JBIG received by facsimile.

文書データ210は、文字を含む文書用のデータである。
文書データ210は、例えば、PDF、PS(PostScript(登録商標))、PDL(Page Description Language)等の電子文書や印刷データに近い形式のファイルであってもよい。また、文書データ210は、HTML(Hyper Text Markup Language)等のハイパーテキストのファイルであってもよい。また、文書データ210は、ワードプロセッサー、表計算ソフトウェア、描画ソフトウェア等の各種アプリケーション・ソフトウェア(以下「アプリケーション」という。)のファイルであってもよい。この場合、文書データ210は、例えば、「.docx(Microsoft(登録商標)Word(登録商標))」、「.xlsx(Microsoft(登録商標)Excel(登録商標))」、SVG(Scalable Vector Graphics)のファイル等であってもよい。また、文書データ210は、印刷用のページファイル等であってもよい。
なお、文書データ210は、PDFの場合、文字属性データ211と画像データ200を含んでいても、文字属性データ211のみを含んでいてもよい。
また、本実施形態においては、文書データ210がPDF又はPSである場合の例について説明する。
The document data 210 is data for a document including characters.
The document data 210 may be, for example, an electronic document such as PDF, PS (PostScript (registered trademark)), PDL (Page Description Language), or a file having a format close to print data. The document data 210 may be a hypertext file such as HTML (Hyper Text Markup Language). The document data 210 may be a file of various application software (hereinafter referred to as “application”) such as a word processor, spreadsheet software, and drawing software. In this case, the document data 210 includes, for example, “.docx (Microsoft (registered trademark) Word (registered trademark))”, “.xlsx (Microsoft (registered trademark) Excel (registered trademark))”, SVG (Scalable Vector Graphics). Or other files. The document data 210 may be a page file for printing.
In the case of PDF, the document data 210 may include the character attribute data 211 and the image data 200, or may include only the character attribute data 211.
In the present embodiment, an example in which the document data 210 is PDF or PS will be described.

文字属性データ211は、文書データ210に含まれる文字コード及び文字の属性のデータである。
文字属性データ211は、文字認識部110により画像データ200が文字認識されて文書データが作成された際には、文字コードと、大まかな文字の描画位置のデータのみが含まれていてもよい。
また、文字属性データ211は、文字属性データ設定部130により、各文字のフォント及び文字サイズ、文字の描画位置等のデータが設定されてもよい。文字属性データ211は、文字の描画位置のデータとして、描画の原点401(図8)、次原点402、左サイドベアリング403、及び文字幅404等が設定されていてもよい。この際、左サイドベアリング403以外のサイドベアリング(Side Bearing)が設定されていてもよい。また、文字属性データ211は、バウンディングボックスやフォントボックス等として、文字のまとまりである文章321(図11)のような文章のデータを設定してもよい。
また、文字属性データ211は、文書データ210がPSやPDFやPDL等の場合には、フォント辞書データのオブジェクトのデータが含まれていてもよい。
The character attribute data 211 is character code and character attribute data included in the document data 210.
When the image data 200 is recognized by the character recognition unit 110 and the document data is created, the character attribute data 211 may include only the character code and data of a rough character drawing position.
In the character attribute data 211, data such as the font and character size of each character and the character drawing position may be set by the character attribute data setting unit 130. In the character attribute data 211, a drawing origin 401 (FIG. 8), a next origin 402, a left side bearing 403, a character width 404, and the like may be set as data of a character drawing position. At this time, a side bearing other than the left side bearing 403 may be set. In addition, the character attribute data 211 may be set as text data such as text 321 (FIG. 11), which is a group of characters, as a bounding box, font box, or the like.
Further, the character attribute data 211 may include font dictionary data object data when the document data 210 is PS, PDF, PDL, or the like.

フォント照合データ220は、文字コードを検索キーとして、当該文字コードが描画された際の画像データ200を照合するためのデータである。
フォント照合データ220は、例えば、例えば0.1ポイント刻みで作成した複数のフォントの各文字のビットマップデータを文字テーブル等として含んでいてもよい。フォント照合データ220の各フォントとして、標準的なPC、画像形成装置1の自社製の機器、印刷物用の標準フォント等が含まれていてもよい。また、フォント照合データ220の文字サイズとして、画像データ200のdpi(dot per inch)等に対応して、例えば、8ポイント〜96ポイント等のサイズのデータが含まれていてもよい。また、フォント照合データ220は、各フォントの各文字サイズについて、ボールド、イタリック、下線、網掛け等の文字修飾が行われた際のデータが含まれていてもよい。また、フォント照合データ220は、各フォント、各文字サイズについて、文字テーブルの文字毎に、文字が描画されるバウンディングボックスの座標を含んでいてもよい。
なお、フォント照合データ220は、ビットマップデータではなく、複数のフォントのベクトル(線画)データであってもよい。この場合、画像データ200の領域について、文字サイズを変更したビットマップを各々描画して比較を行ってもよい。
The font collation data 220 is data for collating the image data 200 when the character code is drawn using the character code as a search key.
For example, the font collation data 220 may include, as a character table or the like, bitmap data of each character of a plurality of fonts created in increments of 0.1 points, for example. Each font of the font collation data 220 may include a standard PC, an in-house device of the image forming apparatus 1, a standard font for printed matter, and the like. Further, as the character size of the font collation data 220, for example, data having a size of 8 points to 96 points may be included corresponding to the dpi (dot per inch) of the image data 200 or the like. In addition, the font collation data 220 may include data when character modification such as bold, italic, underline, and shading is performed for each character size of each font. Further, the font collation data 220 may include the coordinates of the bounding box in which the character is drawn for each character in the character table for each font and each character size.
The font collation data 220 may be vector (line drawing) data of a plurality of fonts instead of bitmap data. In this case, for the area of the image data 200, each bit map with a changed character size may be drawn for comparison.

ここで、サーバー2の制御部20は、記憶部29に記憶された制御プログラムを実行することで、画像データ取得部100、文字認識部110、フォント照合部120、文字属性データ設定部130、文字画像切換部140として機能させられる。
また、上述のサーバー2の各部は、本発明のプログラムを実行するハードウェア資源となる。
Here, the control unit 20 of the server 2 executes the control program stored in the storage unit 29, whereby the image data acquisition unit 100, the character recognition unit 110, the font collation unit 120, the character attribute data setting unit 130, the character It is made to function as the image switching unit 140.
Moreover, each part of the above-mentioned server 2 becomes a hardware resource which executes the program of this invention.

〔画像形成装置1による画像ファイル化処理〕
次に、図6〜図11により、本発明の実施の形態に係る画像形成装置1による画像ファイル化処理の説明を行う。
本実施形態の画像ファイル化処理では、まず、画像データ200を取得して、光学文字認識を行い、文書データ210を作成する。そして、この光学文字認識により出力された文字コードにより、画像データ200の文字と認識された領域301が、どのフォントのどの文字サイズで出力されたものであるか照合する。照合できた文字の箇所については、文書データ210の文字の描画位置を補正して、画像データ200の元になった文書と同様の文字情報を書き込む。この際、描画の原点、文字幅、及びサイドベアリングを設定する。照合できなかった箇所については、文書データ210の文字を削除して、ベクトルの描画データに置き換える。
本実施形態の画像ファイル化処理は、主に制御部20が、記憶部29に記憶されたプログラムを、各部と協働し、ハードウェア資源を用いて実行する。
以下で、図6のフローチャートを参照して、画像ファイル化処理の詳細をステップ毎に説明する。
[Image File Processing by Image Forming Apparatus 1]
Next, an image filing process by the image forming apparatus 1 according to the embodiment of the present invention will be described with reference to FIGS.
In the image filing process of this embodiment, first, image data 200 is acquired, optical character recognition is performed, and document data 210 is created. Based on the character code output by the optical character recognition, it is verified whether the region 301 recognized as the character of the image data 200 is output with which character size of which font. For character portions that can be collated, the character drawing position of the document data 210 is corrected, and the same character information as that of the original document of the image data 200 is written. At this time, the origin of drawing, character width, and side bearing are set. For portions that could not be collated, the characters in the document data 210 are deleted and replaced with vector drawing data.
In the image filing process of the present embodiment, the control unit 20 mainly executes a program stored in the storage unit 29 using hardware resources in cooperation with each unit.
Hereinafter, the details of the image filing process will be described step by step with reference to the flowchart of FIG.

(ステップS100)
まず、制御部20が、画像データ取得部100として、画像データ取得処理を行う。
また、制御部20は、ネットワーク送受信部25を介して、画像形成装置1等から画像データ200を取得して、記憶部29に記憶する。
また、制御部20は、画像データ200に対応する文書データ210のファイルも作成する。この時点では、文書データ210には、まだ文字が設定されていないものの、画像データ200に含まれる画像がコピーされていてもよい。
なお、制御部20は、画像形成装置1にネットワーク5経由でリモートスキャンのコマンドを送信して、文字の印刷された原稿を原稿読取部12でスキャンさせてもよい。この場合、画像形成装置1の制御部10は、スキャンされた画像データ200を、サーバー2へ送信する。この際、制御部10は、本等の見開き原稿の場合は、端部を変形する等の処理を行ってもよい。また、制御部10は、画像のゴミを除去したり、モアレを除去したり、画像のシャープネスを上げたり、DPI変換する処理を行ったりしてもよい。また、制御部10は、これらの画像処理について、画像処理部11のGPU等で高速化して行ってもよい。
また、制御部20は、図示しない記録媒体、外部の端末やサーバー等から画像データ200を取得して、記憶部29に記憶してもよい。
また、制御部20は、画像形成装置1の図示しないFAX送受信部で受信した画像データ200を取得して、記憶部29に記憶してもよい。
また、制御部20は、取得した画像データ200を、特定の形式のデータに変換してもよい。
(Step S100)
First, the control unit 20 performs an image data acquisition process as the image data acquisition unit 100.
Further, the control unit 20 acquires the image data 200 from the image forming apparatus 1 or the like via the network transmission / reception unit 25 and stores it in the storage unit 29.
The control unit 20 also creates a document data 210 file corresponding to the image data 200. At this point, the text included in the image data 200 may be copied to the document data 210, although no characters have been set yet.
Note that the control unit 20 may transmit a remote scan command to the image forming apparatus 1 via the network 5 and cause the document reading unit 12 to scan a document on which characters are printed. In this case, the control unit 10 of the image forming apparatus 1 transmits the scanned image data 200 to the server 2. At this time, the control unit 10 may perform processing such as deforming an end portion of a spread document such as a book. In addition, the control unit 10 may remove dust from the image, remove moire, increase the sharpness of the image, or perform processing for DPI conversion. Further, the control unit 10 may perform these image processes at a high speed using the GPU of the image processing unit 11 or the like.
Further, the control unit 20 may acquire the image data 200 from a recording medium (not shown), an external terminal, a server, or the like and store the image data 200 in the storage unit 29.
Further, the control unit 20 may acquire the image data 200 received by a FAX transmission / reception unit (not shown) of the image forming apparatus 1 and store it in the storage unit 29.
The control unit 20 may convert the acquired image data 200 into data of a specific format.

(ステップS101)
次に、制御部20が、文字認識部110として、文字認識処理を行う。
図7(a)によると、制御部20は、画像データ200内で文字が描画された箇所を検索し、この検索された箇所について一文字毎に文字認識を行う。制御部20は、認識された文字の文字描画領域311のようなデータを文字属性データ211に含めて、文書データ210に設定する。
図7(b)によると、文字描画領域311は、文書データ210内で大まかに画像データ200と同じ位置で閲覧又は印刷される位置となるような描画位置が設定されている。文字描画領域311は、例えば、文書データ210がPSやPDFやPDL等の場合、文字描画領域311の原点とUTF8等のエンコード形式の文字コードを含むフォントボックス410の集合体として定義されていてもよい。
この時点での文字描画領域311は、各フォントボックス410の原点400と、デフォルト(既定)のフォントのみ設定されていてもよい。よって、この時点の文字描画領域311の描画データを描画すると、画像データ200の元になった原稿とは異なった描画結果となる。
(Step S101)
Next, the control unit 20 performs character recognition processing as the character recognition unit 110.
According to FIG. 7A, the control unit 20 searches the image data 200 for a portion where a character is drawn, and performs character recognition for each character in the searched portion. The control unit 20 includes data such as the character drawing area 311 of the recognized character in the character attribute data 211 and sets it in the document data 210.
According to FIG. 7B, a drawing position is set in the character drawing area 311 so that the character drawing area 311 is roughly viewed or printed at the same position as the image data 200 in the document data 210. For example, when the document data 210 is PS, PDF, PDL or the like, the character drawing area 311 may be defined as a collection of font boxes 410 including the origin of the character drawing area 311 and character codes in an encoding format such as UTF8. Good.
In the character drawing area 311 at this time, only the origin 400 of each font box 410 and a default font may be set. Therefore, when drawing data in the character drawing area 311 at this time is drawn, a drawing result different from that of the original document from which the image data 200 is based is obtained.

また、制御部20は、認識された文字コードと、文字と認識された画像データ200の領域301の座標とを記憶部29に一時データとして記憶してもよい。なお、制御部20は、文字認識の際に算出された文字のベクトルデータ等も、記憶部29に一時データとして記憶してもよい。
また、制御部20は、文字以外の図形等を認識してもよい。また、画像データ200に既に文字認識された文字属性データ211が含まれていた場合、この文字認識処理をスキップすることも可能である。
The control unit 20 may store the recognized character code and the coordinates of the area 301 of the image data 200 recognized as a character in the storage unit 29 as temporary data. Note that the control unit 20 may also store character vector data calculated during character recognition in the storage unit 29 as temporary data.
Moreover, the control part 20 may recognize figures other than a character. If the image data 200 includes character attribute data 211 that has already been recognized, this character recognition process can be skipped.

(ステップS102)
次に、制御部20が、フォント照合部120として文字サイズ推定処理を行う。
図8(a)によると、本処理〜ステップS104の一致フォント算出処理において、制御部20は、OCRされた各文字について、フォントの種類及び文字サイズを算出する。また、制御部20は、文字毎の描画領域であるバウンディングボックス411、フォントの描画の原点401、次の文字の原点である次原点402、文字描画における左側の余白である左サイドベアリング403、文字幅404等の描画データを設定する。この際、制御部20は、原点401、文字幅404、及び左サイドベアリング403を、画像データ200と一致する座標になるよう算出する。このため、まず、本処理において、制御部20は、文字サイズを推定する。
図8(b)によると、制御部20は、フォント照合データ220のうち、上述の文字認識処理で算出された画像データ200の文字と認識された領域301の各文字の領域302の大きさと、各文字サイズにおける各フォントのバウンディングボックスの大きさ等を比較して文字サイズを推定する。制御部20は、この比較の際、バウンディングボックス411に対応して実際に文字が描画される座標の大きさを考慮して、領域302の大きさと比較する。また、この際、制御部20は、文字修飾が行われた際のデータのバウンディングボックスについても比較する。加えて、制御部20は、画像データ200自体の大きさ、dpi、解像度等の情報についても比較の際に参照してもよい。
制御部20は、比較によりバウンディングボックスの大きさが一致したものを、フォントの種類、文字サイズと推定する。この際、複数のフォント及び複数の文字サイズが推定されてもよい。制御部20は、推定されたフォントの種類、文字サイズを記憶部29に一時的に記憶する。
なお、制御部20は、検索する際に、上述の文字認識処理により算出された文字描画領域311のFontBBox情報等について、文字サイズを参照して比較してもよい。
(Step S102)
Next, the control unit 20 performs a character size estimation process as the font collation unit 120.
Referring to FIG. 8A, in the matched font calculation process from this process to step S104, the control unit 20 calculates the font type and the character size for each OCR character. The control unit 20 also includes a bounding box 411 that is a drawing area for each character, a font drawing origin 401, a next origin 402 that is the next character origin, a left side bearing 403 that is a left margin in character drawing, a character Drawing data such as width 404 is set. At this time, the control unit 20 calculates the origin 401, the character width 404, and the left side bearing 403 so that the coordinates coincide with the image data 200. For this reason, first, in this process, the control unit 20 estimates the character size.
According to FIG. 8B, the control unit 20 includes the size of each character area 302 of the area 301 recognized as the character of the image data 200 calculated by the character recognition process described above in the font collation data 220, and The character size is estimated by comparing the size of the bounding box of each font at each character size. In this comparison, the control unit 20 compares the size of the region 302 in consideration of the size of coordinates where characters are actually drawn corresponding to the bounding box 411. At this time, the control unit 20 also compares the bounding box of the data when the character modification is performed. In addition, the control unit 20 may refer to information such as the size, dpi, and resolution of the image data 200 itself in the comparison.
The control unit 20 estimates that the size of the bounding box matches by the comparison as the font type and the character size. At this time, a plurality of fonts and a plurality of character sizes may be estimated. The control unit 20 temporarily stores the estimated font type and character size in the storage unit 29.
When searching, the control unit 20 may compare the FontBBox information of the character drawing area 311 calculated by the character recognition process described above with reference to the character size.

(ステップS103)
次に、制御部20が、フォント照合部120として、複数のフォント及び複数の文字サイズが推定されたか否かについて判定する。制御部20は、上述の文字サイズ推定処理で、複数のフォントの種類又は文字サイズが推定された場合、Yesと判定する。制御部20は、それ以外の場合、つまりフォントの種類並びに文字サイズが一致したものが一つだけ推定され、又は一致したものがなかった場合、Noと判定する。
Yesの場合、制御部20は、処理をステップS104に進める。
Noの場合、制御部20は、処理をステップS105に進める。
(Step S103)
Next, the control unit 20 determines whether a plurality of fonts and a plurality of character sizes are estimated as the font collation unit 120. The control unit 20 determines Yes when a plurality of font types or character sizes are estimated in the character size estimation process described above. In other cases, that is, if only one font type and character size is estimated or matched, the control unit 20 determines No.
In the case of Yes, the control part 20 advances a process to step S104.
In No, the control part 20 advances a process to step S105.

(ステップS104)
複数のフォントの種類又は文字サイズが推定された場合、制御部20が、フォント照合部120として、一致フォント算出処理を行う。
図8(c)によると、制御部20は複数のフォントの種類又は文字サイズの各ビットマップ画像と、領域302内の実際の文字の画像とを比較して、一番一致しているものを検索する照合を行う。制御部20は、この比較として、例えば、上下左右8〜192ドット等のウィンドウを設定し、動的プログラミング等を用いて、各ピクセルの暗点の明度の類似度を算出してもよい。この際、制御部20は、印刷された原稿では文字の輪郭が太くなる傾向がある等の印刷条件を配慮した類似度を算出したり、白黒2値に変更してビット加算等を用いて高速に類似度を算出したりしてもよい。制御部20は、例えば、このような類似度が最も高くなったものを一番近い画像として選択してもよい。また、制御部20は、この際のウィンドウ上の座標を算出してもよい。
制御部20は、選択された一番近い画像のフォント、ウィンドウ上の座標、類似度等を記憶部29に一時的に記憶する。
このように、複数のフォントの種類又は文字サイズが算出された場合のみ、文字が一致するかどうか比較を行うことで、高速にフォント及び文字サイズの検索を行うことができる。
(Step S104)
When a plurality of font types or character sizes are estimated, the control unit 20 performs matching font calculation processing as the font collation unit 120.
According to FIG. 8C, the control unit 20 compares each bitmap image of a plurality of font types or character sizes with an actual character image in the region 302, and finds the best match. Matches to search. For this comparison, for example, the control unit 20 may set windows such as 8 to 192 dots in the upper, lower, left, and right directions, and may calculate the lightness similarity of the dark spots of each pixel using dynamic programming or the like. At this time, the control unit 20 calculates the similarity considering the printing conditions such that the outline of the character tends to be thick in the printed document, or changes to black and white binary and uses bit addition or the like for high speed. The degree of similarity may be calculated. For example, the control unit 20 may select the image having the highest similarity as the closest image. Further, the control unit 20 may calculate coordinates on the window at this time.
The control unit 20 temporarily stores the font of the selected closest image, coordinates on the window, similarity, and the like in the storage unit 29.
Thus, only when a plurality of font types or character sizes are calculated, the font and character size can be searched at high speed by comparing whether or not the characters match.

(ステップS105)
ここで、制御部20が、フォント照合部120として、照合に成功したか否かを判定する。制御部20は、例えば、上述の文字サイズ推定処理でフォントの種類並びに文字サイズが一致したものが一つだけ推定された場合、又は、上述の一致フォント算出処理で類似度が所定の閾値以上であった場合に、認識された文字が、フォント照合データ220内のいずれかのフォント及び文字サイズに該当する、つまり照合に成功したと判断し、Yesと判定する。制御部20は、それ以外の場合、例えば、文字サイズ推定処理でフォントの種類並びに文字サイズとして一致したものが算出されなかった場合、又は、一致フォント算出処理で類似度が所定の閾値未満であった場合等に、該当するフォント及び文字サイズがなかった、つまり照合に失敗したとして、Noと判定する。
Yesの場合、制御部20は、処理をステップS106に進める。
Noの場合、制御部20は、処理をステップS110に進める。
(Step S105)
Here, the control unit 20 determines whether the collation is successful as the font collation unit 120. For example, when only one font type and character size matching is estimated in the character size estimation process described above, or when the similarity is equal to or greater than a predetermined threshold value in the matching font calculation process. If there is, it is determined that the recognized character corresponds to one of the fonts and the character size in the font collation data 220, that is, the collation is successful, and the decision is Yes. In other cases, for example, when the character size estimation process does not calculate a matching font type and character size, or the matching font calculation process indicates that the similarity is less than a predetermined threshold. In such a case, it is determined that the corresponding font and character size were not found, that is, the collation failed, No.
In the case of Yes, the control part 20 advances a process to step S106.
In No, the control part 20 advances a process to step S110.

(ステップS106)
照合に成功した場合、制御部20は、文字属性データ設定部130として、原点算出処理を行う。
図9によると、制御部20は、推定されたフォント及び文字サイズを使用して、領域302内の実際の文字の画像とを比較して、一番一致する座標を算出し、この座標に基づいて原点401を算出する。この比較は、例えば、上下左右8〜192ドット等のウィンドウを設定し、動的プログラミング等を用いて、各ピクセルの暗点の明度の類似度を算出して、最も一致する座標を算出してもよい。この際、制御部20は、上述の一致フォント算出処理と同様に、印刷条件を配慮した類似度を算出したり、白黒2値に変更してビット加算等を用いて高速に類似度を算出したりしてもよい。また、制御部20は、この際に、次原点402(図8)についても、原点401に基づいて算出してもよい。
なお、制御部20は、例えば、上述の照合処理のウィンドウ上の座標と、画像データ200の文字と認識された領域301の座標とから、この描画位置を算出してもよい。また、制御部20は、この文字が描画された際に、画像データ200の領域301の画像と実際に重なるか否かを確認して類似度を算出してもよい。
(Step S106)
When the collation is successful, the control unit 20 performs origin calculation processing as the character attribute data setting unit 130.
According to FIG. 9, the control unit 20 compares the actual character image in the region 302 using the estimated font and character size, calculates the best matching coordinate, and based on this coordinate The origin 401 is calculated. For this comparison, for example, a window such as 8 to 192 dots in the vertical and horizontal directions is set, and by using dynamic programming or the like, the similarity of the lightness of the dark spot of each pixel is calculated, and the most coincident coordinate is calculated. Also good. At this time, the control unit 20 calculates the degree of similarity in consideration of the printing conditions, or calculates the degree of similarity at high speed using bit addition or the like after changing to black and white binary, as in the above-described matching font calculation process. Or you may. At this time, the control unit 20 may also calculate the next origin point 402 (FIG. 8) based on the origin point 401.
Note that the control unit 20 may calculate the drawing position from, for example, the coordinates on the above-described collation processing window and the coordinates of the area 301 recognized as the character of the image data 200. In addition, when the character is drawn, the control unit 20 may calculate the degree of similarity by checking whether or not the image actually overlaps the image in the region 301 of the image data 200.

(ステップS107)
次に、制御部20は、文字属性データ設定部130として、文字描画位置補正設定処理を行う。
制御部20は、上述の原点算出処理で算出した原点401を指定して、文字サイズ推定処理又は一致フォント算出処理のフォントと文字サイズとを指定して、文書データ210に文字属性データ211を設定する。
この際、制御部20は、例えば、文書データ210のフォント並びに文字サイズ、及びフォントの描画位置を変更する。制御部20は、文書データ210がPSやPDFやPDL等であった場合、文字属性データ211として、類似度が閾値以上になったフォント及び文字サイズのフォント辞書を登録し、描画位置を「書き出し位置」の情報として設定する。制御部20は、ここでは、算出された画像データ200上の正確な描画位置に対応するよう、文書データ210の文字属性データ211中の文字の描画位置の設定を行う。制御部20は、例えば、図8(a)で示したような、バウンディングボックス411、フォントの描画の原点401、次の文字の原点である次原点402、左サイドベアリング403、文字幅404等の描画データを、文書データ210の文字属性データ211に設定する。
(Step S107)
Next, the control unit 20 performs a character drawing position correction setting process as the character attribute data setting unit 130.
The control unit 20 specifies the origin 401 calculated in the above-described origin calculation process, specifies the font and character size of the character size estimation process or the matching font calculation process, and sets the character attribute data 211 in the document data 210 To do.
At this time, for example, the control unit 20 changes the font and character size of the document data 210 and the drawing position of the font. When the document data 210 is PS, PDF, PDL, or the like, the control unit 20 registers a font dictionary having a font and a character size with a similarity equal to or greater than the threshold as the character attribute data 211, and sets the drawing position to “write”. Set as "Position" information. Here, the control unit 20 sets the drawing position of characters in the character attribute data 211 of the document data 210 so as to correspond to the accurate drawing position on the calculated image data 200. For example, the control unit 20 includes a bounding box 411, a font drawing origin 401, a next origin 402 that is the origin of the next character, a left side bearing 403, a character width 404, and the like as shown in FIG. Drawing data is set in the character attribute data 211 of the document data 210.

図10は、この描画データを、PSである文書データ210の文字属性データ211のフォント辞書内に登録した例を示す。
描画データ501は、例えば、フォントとして「type3」を指定し、グリフ座標系とフォント境界を指定した例である。
描画データ502は、文字コードを文字名に変換する配列の定義の例である。この例では、コード「80」が「P」と変換される。
描画データ503は、グリフ記述(ベクトル化文字)格納用の辞書の例である。
描画データ504は、グリフ作成手続きの指定を示すコードの例である。このコードでは、文字境界、辞書の取得等を示している。
描画データ505は、文字描画に必要なフォント辞書取得、フォントサイズ指定、位置指定、文字表示等を示すコードの例である。
FIG. 10 shows an example in which this drawing data is registered in the font dictionary of the character attribute data 211 of the document data 210 that is PS.
The drawing data 501 is an example in which “type 3” is designated as a font and a glyph coordinate system and a font boundary are designated.
The drawing data 502 is an example of an array definition for converting a character code into a character name. In this example, the code “80” is converted to “P”.
The drawing data 503 is an example of a dictionary for storing glyph descriptions (vectorized characters).
The drawing data 504 is an example of a code indicating designation of a glyph creation procedure. This code indicates character boundaries, dictionary acquisition, and the like.
The drawing data 505 is an example of a code indicating font dictionary acquisition, font size designation, position designation, character display, and the like necessary for character drawing.

(ステップS108)
次に、制御部20が、文字属性データ設定部130として、原点401と次原点402とが一致する文字があるか否かについて判定する。制御部20は、文書データ210に設定された文字属性データ211内に複数の文字があった場合、隣り合う文字について、原点401と次原点402との距離が所定の閾値以下であるか否かを判別する。制御部20は、このような閾値以下の文字ペアがあった場合、Yesと判定する。つまり、制御部20は、照合された文字に対応して算出された原点401に対応して算出された次原点402と、次の文字の原点401とが一致した場合、Yesと判定する。制御部20は、図11の例では、「gakpylp」の文字のそれぞれの前の文字の次原点402と、次の文字の原点401とが一致しているため、Yesと判定する。制御部20は、それ以外の場合は、Noと判定する。
Yesの場合、制御部20は、処理をステップS109に進める。
Noの場合、制御部20は、画像ファイル化処理を終了する。
(Step S108)
Next, the control unit 20 determines whether there is a character whose origin 401 and the next origin 402 match as the character attribute data setting unit 130. When there are a plurality of characters in the character attribute data 211 set in the document data 210, the control unit 20 determines whether the distance between the origin 401 and the next origin 402 is equal to or less than a predetermined threshold for adjacent characters. Is determined. The control part 20 determines with Yes, when there exists such a character pair below a threshold value. That is, the control unit 20 determines Yes when the next origin 402 calculated corresponding to the origin 401 calculated corresponding to the collated character matches the origin 401 of the next character. In the example of FIG. 11, the control unit 20 determines Yes because the next origin 402 of the character preceding “gakpylp” and the origin 401 of the next character match. In other cases, the control unit 20 determines No.
In the case of Yes, the control part 20 advances a process to step S109.
In No, the control part 20 complete | finishes an image file formation process.

(ステップS109)
文字属性データ211内に隣り合う文字について、原点401と次原点402とが一致するものがあった場合、制御部20が、文字属性データ設定部130として、同一文章設定処理を行う。
図11によると、前の文字の次原点402と、次の文字の原点401とが一致した場合は、画像データ200の元になった原稿の同一文章内の文字の可能性が高い。このため、図11の例では、制御部20は、文字属性データ211に、当該文字同士を、同一の文章321内の文字として設定する。
その後、制御部20は、画像ファイル化処理を終了する。
(Step S109)
When there is an adjacent character in the character attribute data 211 where the origin 401 and the next origin 402 match, the control unit 20 performs the same sentence setting process as the character attribute data setting unit 130.
According to FIG. 11, when the next origin 402 of the previous character matches the origin 401 of the next character, there is a high possibility of a character in the same sentence of the original document from which the image data 200 is based. Therefore, in the example of FIG. 11, the control unit 20 sets the characters as characters in the same sentence 321 in the character attribute data 211.
Thereafter, the control unit 20 ends the image file processing.

(ステップS110)
画像データ200の文字と認識された領域に対して、フォント及び文字サイズの照合に成功しなかった場合、制御部20は、文字画像切換部140として、文字画像切換処理を行う。
制御部20は、文字と認識された画像データ200の領域301について、文書データ210内の文字の情報を削除して、ベクトル(線画)のデータに置き換える。この置き換えのベクトルデータは、上述の文字認識処理で算出した文字の線画のベクトルのデータ等を使用してもよい。また、制御部20は、領域301の画像をそのまま文書データ210に出力してもよい。
以上により、本発明の実施の形態に係る画像ファイル化処理を終了する。
(Step S110)
When the font and the character size are not successfully verified for the area recognized as the character of the image data 200, the control unit 20 performs a character image switching process as the character image switching unit 140.
The control unit 20 deletes the character information in the document data 210 and replaces it with vector (line drawing) data for the region 301 of the image data 200 recognized as a character. As the replacement vector data, the character line drawing vector data calculated by the above-described character recognition processing may be used. Further, the control unit 20 may output the image of the area 301 to the document data 210 as it is.
Thus, the image filing process according to the embodiment of the present invention is completed.

以上のように構成することで、以下のような効果を得ることができる。
従来の文字認識を行う装置では、画像データを文書データに変換する際に、文字のフォント及び文字サイズを正確に設定することができなかった。このため、画像データを、元の原稿と同様の文書データに変換することはできなかった。
これに対して、本発明の実施の形態に係るサーバー2は、画像データ200を文書データ210に変更可能な情報処理装置であり、画像データ200を取得する画像データ取得部100と、画像データ取得部100により取得された画像データ200から文字を認識する文字認識部110と、文字認識部110により文字と認識された画像データ200の領域301について、認識された文字が複数のフォント及び複数の文字サイズのいずれに該当するか照合するフォント照合部120と、フォント照合部120で照合されたフォント及び文字サイズを文書データ210に設定し、文字の描画位置として、描画の原点401、文字幅404、及び左サイドベアリング403を画像データ200に対応するよう設定する文字属性データ設定部130とを備えることを特徴とする。
このように構成することで、画像データ200の元になった原稿に印刷されている文字のフォーマットを復元することが可能となる。これにより、画像データ200から文字認識した文書データ210を、各種アプリケーションのファイルと同様のファイルになるよう変換することが可能となる。つまり、元の原稿と同様の文書データ210に変換することが可能となる。
このように変換された文書データ210を対応するアプリケーションで読み込むと、文字のフォントの種類、文字サイズ、ボールド/イタリック等の文字修飾情報、文字の描画位置等を、ほぼ確実に再現することが可能となる。このため、文書データ210のフォント情報を再現することができ、各種アプリケーションで容易に文字の修正等を行うことができる。これにより、ユーザーの利便性が高まる。
特に、描画の原点401、文字幅404、及び左サイドベアリング403を設定することで、文字の位置を容易に文書データ210に設定可能となり、描画データの構造も簡潔にすることができる。このため、文書データ210の汎用性を高めることができる。
With the configuration described above, the following effects can be obtained.
A conventional character recognition apparatus cannot accurately set the font and size of characters when converting image data into document data. For this reason, the image data cannot be converted into document data similar to the original document.
On the other hand, the server 2 according to the embodiment of the present invention is an information processing apparatus that can change the image data 200 to the document data 210, the image data acquisition unit 100 that acquires the image data 200, and the image data acquisition The character recognition unit 110 that recognizes characters from the image data 200 acquired by the unit 100 and the region 301 of the image data 200 recognized as characters by the character recognition unit 110 include a plurality of fonts and a plurality of characters. Font collation unit 120 for collating which size corresponds, font and character size collated by font collation unit 120 are set in document data 210, and drawing origin 401, character width 404, And the character attribute data setting unit 1 for setting the left side bearing 403 to correspond to the image data 200 Characterized in that it comprises a 0 and.
With this configuration, it is possible to restore the format of characters printed on the original document from which the image data 200 is based. As a result, it is possible to convert the document data 210 that has been character-recognized from the image data 200 into a file similar to the files of various applications. That is, it can be converted into document data 210 similar to the original document.
When the converted document data 210 is read by the corresponding application, the character font type, the character size, the character modification information such as bold / italic, the character drawing position, etc. can be almost surely reproduced. It becomes. For this reason, the font information of the document data 210 can be reproduced, and characters can be easily corrected by various applications. Thereby, the convenience of the user is increased.
In particular, by setting the drawing origin 401, the character width 404, and the left side bearing 403, the character position can be easily set in the document data 210, and the drawing data structure can be simplified. For this reason, the versatility of the document data 210 can be improved.

また、特許文献1のような技術では、文書データ210にベクトルで描画されたデータが含まれているため、読み込んだアプリケーションで文字の修正等ができないことがあるという問題があった。画像データ200の文字部分は、あくまでも文字情報としてファイル内になければ元の文書を復元できなかった。
これに対して、本実施形態のサーバー2は、文字認識部110で検出した文字コードで、フォント照合データ220に含まれる全てのフォント及び文字サイズについて設定された画像テーブルと照合を行うため、作成したフォント及び文字サイズをほぼ確実に抽出することが可能となる。
また、検出した文字の画像が画像データ200と合っているか比較し、文字認識手段で文書データ210に設定された文字の描画位置を、正確な値に補正する。
このように構成することで、原稿の元となった文書をほぼ確実に再現することが可能となる。また、この変換された文書データ210は、この元となった文書と同様の状態になるよう印刷させることができる。この際、文書データ210には、文字の属性が文字属性データ211に設定されているため、スキャンに由来するボケやにじみ等が少なくなり、高品位な印刷を行うことができる。
Further, in the technique such as Patent Document 1, since the document data 210 includes data drawn in vectors, there is a problem that the read application may not be able to correct characters. If the character portion of the image data 200 is not in the file as character information, the original document cannot be restored.
On the other hand, the server 2 according to the present embodiment collates with the image table set for all fonts and character sizes included in the font collation data 220 with the character code detected by the character recognition unit 110. It is possible to almost certainly extract the font and character size.
Further, the detected character image is compared with the image data 200, and the character drawing position set in the document data 210 by the character recognition means is corrected to an accurate value.
With this configuration, it is possible to almost certainly reproduce the original document. Further, the converted document data 210 can be printed so as to be in the same state as the original document. At this time, since the character attribute is set in the character attribute data 211 in the document data 210, blurring and blurring resulting from scanning are reduced, and high-quality printing can be performed.

また、本発明の実施の形態に係るサーバー2は、文字属性データ設定部130は、フォント照合部120で照合された文字に対応して算出された原点401に対応して次に文字が描画される次原点402を算出し、当該次原点402と次の文字の原点401とが一致した場合、同一の文章321内の文字として文書データ210に設定することを特徴とする。つまり、前の文字の次原点402と、次の文字の原点401の距離が所定値以下であった場合には、同一の文章321に属することを文書データ210の文字属性データ211に設定する。
このように構成することで、OCR等により文字が別々の文章の一部として認識されてしまった場合でも、まとまった文章として再結合することができる。このため、文書データ210から文を抽出しやすくなり、ユーザーの使い勝手がよくなる。
In the server 2 according to the embodiment of the present invention, the character attribute data setting unit 130 causes the character to be drawn next corresponding to the origin 401 calculated corresponding to the character collated by the font collation unit 120. The next origin 402 is calculated, and when the next origin 402 and the origin 401 of the next character coincide with each other, it is set in the document data 210 as a character in the same sentence 321. In other words, if the distance between the next origin 402 of the previous character and the origin 401 of the next character is equal to or less than a predetermined value, it is set in the character attribute data 211 of the document data 210 that it belongs to the same sentence 321.
With this configuration, even when a character is recognized as a part of a separate sentence by OCR or the like, it can be recombined as a unified sentence. For this reason, it becomes easy to extract a sentence from the document data 210, and user convenience is improved.

また、本発明の実施の形態に係るサーバー2は、画像データ200の領域301に対応する文書データ210の描画位置に対して、フォント照合部120により複数のフォント及び複数の文字サイズのいずれかに該当すると照合された場合は、認識された文字の描画データを設定し、照合されなかった場合は、文字を含まない線画又は画像の描画データを設定する文字画像切換部140を備えることを特徴とする。
このように構成することで、文字認識において誤認識された箇所を検出することが可能となる。これにより、変換後の文書データ210に含まれる誤認識された文字属性データ211を削除することで、ユーザーが文書データ210を編集しやすくなり、ユーザーの利便製を高めることが可能となる。また、例えば、会社のロゴ等、図案化されたデータが混じっており、文字認識が失敗した箇所等についての、文字を削除して完全な状態の文書データ210を作成できる。
また、フォント及び文字サイズについて照合に失敗した場合であっても、文字の箇所について、ベクトルの描画データを設定することで、高品位な印刷が可能な文書データ210を取得することができる。また、文章の途中で文字認識が失敗していた場合でも、その箇所を閲覧や印刷した際の違和感を少なくすることができる。
The server 2 according to the embodiment of the present invention uses the font collation unit 120 to select one of a plurality of fonts and a plurality of character sizes with respect to the drawing position of the document data 210 corresponding to the area 301 of the image data 200. The character image switching unit 140 sets line drawing data of recognized characters when collated as appropriate, and sets line data or image drawing data not including characters when not collated. To do.
By comprising in this way, it becomes possible to detect the location misrecognized in character recognition. Thus, by deleting the misrecognized character attribute data 211 included in the converted document data 210, the user can easily edit the document data 210, and the user's convenience can be improved. Further, for example, the document data 210 in a complete state can be created by deleting characters in a portion where character recognition has failed, such as a company logo.
Further, even when the collation fails for the font and the character size, the document data 210 capable of high-quality printing can be obtained by setting vector drawing data for the character portion. Further, even when character recognition fails in the middle of a sentence, it is possible to reduce a sense of discomfort when browsing or printing the part.

また、本実施の形態では、文書データ210がPDFの場合、文字認識で作成されたフォントのバウンディングボックスについて、照合されたフォント及び文字サイズでフォントに関する情報を設定する。
このように構成することで、PDFに含まれる文字属性データ211のフォントや書き出し位置等の情報が正確となり、PDFから容易にスタイル対応した文字情報を抽出することが可能となる。また、PDFから、ワードプロセッサーや表計算ソフトウェア等のアプリケーションのファイルへの変換が容易となる。
In the present embodiment, when the document data 210 is PDF, information about the font is set with the collated font and character size for the bounding box of the font created by character recognition.
With this configuration, information such as the font and writing position of the character attribute data 211 included in the PDF becomes accurate, and character information corresponding to the style can be easily extracted from the PDF. In addition, conversion from PDF to a file of an application such as a word processor or spreadsheet software becomes easy.

なお、上述の実施形態のフォント照合処理の説明では、文字サイズを推定してから照合を行った。
しかしながら、制御部20は、先に文字サイズを推定せずに、フォント照合データ220の文字テーブルを総当たりで検索してもよい。また、フォント照合データ220として、ベクトルデータのみを記憶している場合、当該文字を一次データとして描画した際に、画像データ200の領域301と一致するピクセル数の割合等を算出して、照合を行ってもよい。また、制御部20は、GPU演算機能等を用いて、照合を高速に行ってもよい。また、制御部20は、上述の文字認識処理で作成された文字の線画のベクトル等のデータを、照合の際に利用してもよい。
このように構成することで、記憶部29の記憶容量を削減し、又は照合を高速化することが可能となる。
In the description of the font collation process of the above-described embodiment, collation is performed after estimating the character size.
However, the control unit 20 may search the character table of the font collation data 220 by brute force without estimating the character size first. Further, when only vector data is stored as the font collation data 220, when the character is rendered as primary data, the ratio of the number of pixels that match the region 301 of the image data 200 is calculated, and collation is performed. You may go. Moreover, the control part 20 may perform collation at high speed using a GPU calculating function etc. Further, the control unit 20 may use data such as a character line drawing vector created by the above character recognition processing at the time of collation.
With this configuration, it is possible to reduce the storage capacity of the storage unit 29 or speed up the collation.

また、上述の実施形態では、PDF又はPSに変換する例について説明したものの、これに限られず、各種の文書フォーマットに変換可能である。
また、画像ファイルをワードプロセッサーの文書ファイルや表計算ソフトウェアのファイルやHTMLファイル等に変換した場合、制御部20は、修正した文字の描画位置の情報をページ単位で計算して、標準フォント、行送り、文字間隔、余白、ヘッダー/フッター等の設定についても算出し、文書データ210に設定してもよい。これにより、原稿の元となったファイルと同様のページ設定等を復元することができ、文書ファイルを修正しやすくなり、ユーザーの利便性を高めることができる。
In the above-described embodiment, an example of conversion to PDF or PS has been described. However, the present invention is not limited to this, and conversion to various document formats is possible.
In addition, when the image file is converted into a word processor document file, a spreadsheet software file, an HTML file, or the like, the control unit 20 calculates information on the drawing position of the corrected character in units of pages, and calculates the standard font and line feed. Also, settings such as character spacing, margins, header / footer, etc. may be calculated and set in the document data 210. As a result, the same page settings as the original file can be restored, the document file can be easily modified, and the convenience for the user can be improved.

また、上述の本実施形態では、照合に失敗した場合は、文書データ210から該当する文字属性データ211を削除するように記載したが、残してもよい。
また、サーバー2は、フォント照合部120により複数のフォント及び複数の文字サイズのいずれかと照合されなかった文字について、周囲の照合された文字と同じフォント又は文字サイズを指定して再度文字認識を行う文字再認識部を備えていてもよい。このように構成することで、文字認識の精度を高めることが可能となる。また、下線が引かれた文字等、従来の文字認識方式では認識に失敗しやすい箇所でも、確実に文字認識させることが可能になる。
また、上述の実施の形態では、先に文字認識部110が文書データ210に文字属性データ211を出力するように記載したものの、これに限られない。つまり、文字認識部110は一時データとして文字コード等を記憶部29に出力し、文字属性データ設定部130が文書データに文字コード等を設定するような構成であってもよい。
このように構成することで処理を簡略化でき、文書データ210の修正を少なくして、処理を高速化できる。
Further, in the above-described embodiment, it is described that the corresponding character attribute data 211 is deleted from the document data 210 when collation fails, but it may be left.
In addition, the server 2 performs character recognition again by designating the same font or character size as the surrounding collated characters for the characters that have not been collated by the font collation unit 120 with any of the plurality of fonts and the plurality of character sizes. You may provide the character re-recognition part. With this configuration, the accuracy of character recognition can be increased. In addition, it is possible to reliably recognize a character even in a portion where recognition is likely to fail in the conventional character recognition method, such as an underlined character.
Further, in the above-described embodiment, the character recognition unit 110 is described to output the character attribute data 211 to the document data 210 first, but the present invention is not limited to this. That is, the character recognition unit 110 may output a character code or the like as temporary data to the storage unit 29, and the character attribute data setting unit 130 may set the character code or the like in the document data.
With this configuration, the processing can be simplified, the correction of the document data 210 can be reduced, and the processing can be speeded up.

また、本実施形態の画像ファイル化処理を、画像形成装置1で実行してもよい。また、画像ファイル化処理のうち、文字認識処理、照合処理のように演算性能が必要な処理については、サーバー2で実行し、それ以外の処理は画像形成装置1で実行するように構成してもよい。また、このような処理を、ユーザーの端末から指示して、GPU等を多数備えた、いわゆる「クラウド」上のサーバー2で実行してもよい。
このように構成することで、画像形成装置1の制御部10、画像処理部11、及び記憶部19のコストを削減できる。また、処理を短時間で完了し、消費電力を削減することができる。
また、本実施形態の画像ファイル化処理は、画像形成装置1を用いないシステムにも
適用できる。つまり、ネットワークスキャナー、スキャナーをUSB等で別途接続したサーバー2を情報処理装置として用いる構成であってもよい。
Further, the image filing process of the present embodiment may be executed by the image forming apparatus 1. Of the image filing processing, processing that requires computing performance, such as character recognition processing and collation processing, is executed by the server 2, and other processing is executed by the image forming apparatus 1. Also good. Further, such processing may be executed by a server 2 on a so-called “cloud” having a large number of GPUs or the like, instructed from a user terminal.
With this configuration, the costs of the control unit 10, the image processing unit 11, and the storage unit 19 of the image forming apparatus 1 can be reduced. Further, the processing can be completed in a short time, and power consumption can be reduced.
Further, the image filing process of the present embodiment can be applied to a system that does not use the image forming apparatus 1. In other words, a configuration may be used in which the network scanner and the server 2 to which the scanner is separately connected by USB or the like are used as the information processing apparatus.

また、上記実施の形態の構成及び動作は例であって、本発明の趣旨を逸脱しない範囲で適宜変更して実行することができることは言うまでもない。   Further, the configuration and operation of the above-described embodiment are examples, and it goes without saying that they can be appropriately modified and executed without departing from the gist of the present invention.

1 画像形成装置
2 サーバー
5 ネットワーク
10、20 制御部
11 画像処理部
12 原稿読取部
12a スキャナー
12b プラテンガラス
12c 原稿読取スリット
13 原稿給送部
13a 原稿載置部
13b 原稿排出部
13c 原稿搬送機構
14 本体部
15、25 ネットワーク送受信部
16 操作パネル部
17 画像形成部
17a 感光体ドラム
17b 露光部
17c 現像部
17d 転写部
17e 定着部
19、29 記憶部
41 排出口
42 給紙部
42a 給紙カセット
42b 給紙ローラー
43 用紙搬送路
44 搬送ローラー対
45 排出ローラー対
50 スタックトレイ
100 画像データ取得部
110 文字認識部
120 フォント照合部
130 文字属性データ設定部
140 文字画像切換部
200 画像データ
210 文書データ
211 文字属性データ
220 フォント照合データ
301、302 領域
311 文字描画領域
321 文章
400、401 原点
402 次原点
403 左サイドベアリング
404 文字幅
410 フォントボックス
411 バウンディングボックス
420 文字
501、502、503、504、505 描画データ
X 画像形成システム
DESCRIPTION OF SYMBOLS 1 Image forming apparatus 2 Server 5 Network 10, 20 Control part 11 Image processing part 12 Original reading part 12a Scanner 12b Platen glass 12c Original reading slit 13 Original feeding part 13a Original placing part 13b Original discharge part 13c Original conveyance mechanism 14 Main body Sections 15 and 25 Network transmission / reception section 16 Operation panel section 17 Image forming section 17a Photosensitive drum 17b Exposure section 17c Development section 17d Transfer section 17e Fixing sections 19 and 29 Storage section 41 Discharge port 42 Paper feed section 42a Paper feed cassette 42b Paper feed Roller 43 Paper transport path 44 Transport roller pair 45 Discharge roller pair 50 Stack tray 100 Image data acquisition unit 110 Character recognition unit 120 Font collation unit 130 Character attribute data setting unit 140 Character image switching unit 200 Image data 210 Document data 211 Character attribute data 22 Font verification data 301, 302 area 311 character drawing region 321 sentences 400, 401 home 402 primary origin 403 left side bearing 404 character width 410 Font box 411 bounding box 420 characters 501,502,503,504,505 drawing data X imaging system

Claims (4)

取得した画像データを文書データに変更し出力する情報処理装置において、
前記画像データと、複数のフォント及び文字サイズのフォントのフォント照合データとを記憶する記憶手段と、
前記記憶手段に記憶された前記画像データから文字を認識する文字認識手段と、
前記文字認識手段により前記文字と認識された前記画像データの領域について、認識された前記文字が、前記記憶手段に記憶された前記フォント照合データ内の複数のフォント及び複数の文字サイズのいずれに該当するか照合するフォント照合手段と、
前記フォント照合手段で照合された前記フォント及び前記文字サイズを文字属性データとして前記文書データに対して設定し、且つ、前記文字の描画位置を前記画像データに対応するよう前記文字属性データとして前記文書データに対して設定する文字属性データ設定手段とを備え
前記文字属性データ設定手段は、
(1)照合された前記フォント照合データ内の前記フォント及び前記文字サイズと、前記文書データの前記文字の画像とを比較して、一番一致する座標を算出し、この座標に基づいて前記文字の原点を算出する原点算出処理を行い、
(2)照合された前記フォント照合データ内の前記フォントと前記文字サイズとを指定して、少なくとも、前記文章データの前記文字の描画領域であるバウンディングボックスと、前記原点算出処理で算出された前記文字の原点及び次の文字の原点である次原点と、前記文字のサイドベアリングと、前記文字の文字幅とを含む描画データを前記文字属性データとして前記文書データに対して設定する文字描画位置補正設定処理を行い、
(3)前記文書データ中の隣り合う文字について、前記原点と前記次原点とが一致するか否かを判定し、一致すると判定された場合、前記隣り合う文字を同一の文章内の文字であることを示す前記文字属性データとして前記文書データに対して設定する同一文章設定処理を行う
ことを特徴とする情報処理装置。
The acquired image data, the information processing apparatus for outputting change in the document data,
Storage means for storing the image data and font collation data of a plurality of fonts and fonts of character sizes;
Character recognition means for recognizing characters from the image data stored in the storage means ;
The area of the image data is recognized as the character by the character recognition means, recognized the character, fall into one of a plurality of fonts and a plurality of character sizes of the font within the collation data stored in said storage means Font matching means for checking or matching,
The font set for the document data to the font and the character size is verified by collating means as character attribute data, and said drawing position location of the character as the character attribute data so as to correspond to the image data Character attribute data setting means for setting the document data ,
The character attribute data setting means includes:
(1) The font and the character size in the collated font collation data are compared with the image of the character of the document data to calculate the best matching coordinate, and the character is based on the coordinate. Perform the origin calculation process to calculate the origin of
(2) Designating the font and the character size in the collated font collation data, at least a bounding box that is a drawing area of the character of the sentence data, and the origin calculation process Character drawing position correction that sets drawing data including the character origin and the next origin which is the origin of the next character, the side bearing of the character, and the character width of the character as the character attribute data for the document data. Perform the setting process,
(3) For adjacent characters in the document data, it is determined whether or not the origin and the next origin match. If it is determined that they match, the adjacent characters are characters in the same sentence. An information processing apparatus that performs the same sentence setting process for setting the document data as the character attribute data indicating the above .
前記フォント照合手段は、
(1)前記文字認識手段により認識された前記文字に対応する前記フォント照合データ内の前記フォントの前記バウンディングボックスの大きさを算出して、認識された前記文字のフォントの種類及び文字サイズを推定し、
(2)前記フォント照合データ内の複数の前記フォント又は複数の前記文字サイズが推定された場合、認識された前記文字と複数の前記フォント及び複数の前記文字サイズのいずれか又は両方とを画像比較して類似度を算出し、
(3)前記類似度が最も高い前記フォント及び前記文字サイズを選択し、選択された前記フォント及び前記文字サイズの、認識された前記文字に対する前記類似度が所定の閾値以上の場合に前記フォント及び前記文字サイズに該当し照合されたと判定し、前記類似度が前記所定の閾値よりも低い場合に該当する前記フォント及び前記文字サイズがなく照合されなかったと判定する
ことを特徴とする請求項1に記載の情報処理装置。
The font collation means
(1) The size of the bounding box of the font in the font collation data corresponding to the character recognized by the character recognition means is calculated, and the font type and character size of the recognized character are estimated. And
(2) When the plurality of fonts or the plurality of character sizes in the font collation data are estimated, the recognized character is compared with one or both of the plurality of fonts and the plurality of character sizes. To calculate the similarity,
(3) The font and the character size having the highest similarity are selected, and the font and the character size when the similarity of the selected font and the character size with respect to the recognized character is equal to or greater than a predetermined threshold value. 2. The method according to claim 1, wherein it is determined that the character size is matched and collated, and when the similarity is lower than the predetermined threshold, it is determined that the corresponding font and the character size are absent and the character is not collated. The information processing apparatus described.
前記フォント照合手段により該当する前記フォント及び前記文字サイズがなく照合されなかったと判定された場合、前記文字と認識された前記画像データの領域について、前記文書データ内の前記文字の情報を削除して、線画のデータに置き換える文字画像切換手段を更に備えるWhen it is determined by the font collating means that the corresponding font and the character size are not present and collation is not performed, the character information in the document data is deleted for the area of the image data recognized as the character. And character image switching means for replacing with line drawing data.
ことを特徴とする請求項2に記載の情報処理装置。  The information processing apparatus according to claim 2.
画像形成装置において入力された画像データと、前記画像データを文書データに変更するサーバーとを備えた情報処理システムにおいて、
前記サーバーは、
前記画像データと、複数のフォント及び文字サイズのフォントのフォント照合データとを記憶する記憶手段と、
前記記憶手段に記憶された前記画像データから文字を認識する文字認識手段と、
前記文字認識手段により前記文字と認識された前記画像データの領域について、認識された前記文字が、前記記憶手段に記憶された前記フォント照合データ内の複数のフォント及び複数の文字サイズのいずれに該当するか照合するフォント照合手段と、
前記フォント照合手段で照合された前記フォント及び前記文字サイズを文字属性データとして前記文書データに対して設定し、且つ、前記文字の描画位置を前記画像データに対応するよう前記文字属性データとして前記文書データに対して設定する文字属性データ設定手段とを備え
前記文字属性データ設定手段は、
(1)照合された前記フォント照合データ内の前記フォント及び前記文字サイズと、前記文書データの前記文字の画像とを比較して、一番一致する座標を算出し、この座標に基づいて前記文字の原点を算出する原点算出処理を行い、
(2)照合された前記フォント照合データ内の前記フォントと前記文字サイズとを指定して、少なくとも、前記文章データの前記文字の描画領域であるバウンディングボックスと、前記原点算出処理で算出された前記文字の原点及び次の文字の原点である次原点と、前記文字のサイドベアリングと、前記文字の文字幅とを含む描画データを前記文字属性データとして前記文書データに対して設定する文字描画位置補正設定処理を行い、
(3)前記文書データ中の隣り合う文字について、前記原点と前記次原点とが一致するか否かを判定し、一致すると判定された場合、前記隣り合う文字を同一の文章内の文字であることを示す前記文字属性データとして前記文書データに対して設定する同一文章設定処理を行う
ことを特徴とする情報処理システム。
In an information processing system comprising image data input in an image forming apparatus and a server that changes the image data to document data,
The server
Storage means for storing the image data and font collation data of a plurality of fonts and fonts of character sizes;
Character recognition means for recognizing characters from the image data stored in the storage means ;
The area of the image data is recognized as the character by the character recognition means, recognized the character, fall into one of a plurality of fonts and a plurality of character sizes of the font within the collation data stored in said storage means Font matching means for checking or matching,
The font set for the document data to the font and the character size is verified by collating means as character attribute data, and said drawing position location of the character as the character attribute data so as to correspond to the image data Character attribute data setting means for setting the document data ,
The character attribute data setting means includes:
(1) The font and the character size in the collated font collation data are compared with the image of the character of the document data to calculate the best matching coordinate, and the character is based on the coordinate. Perform the origin calculation process to calculate the origin of
(2) Designating the font and the character size in the collated font collation data, at least a bounding box that is a drawing area of the character of the sentence data, and the origin calculation process Character drawing position correction that sets drawing data including the character origin and the next origin which is the origin of the next character, the side bearing of the character, and the character width of the character as the character attribute data for the document data. Perform the setting process,
(3) For adjacent characters in the document data, it is determined whether or not the origin and the next origin match. If it is determined that they match, the adjacent characters are characters in the same sentence. An information processing system for performing the same sentence setting process for setting the document data as the character attribute data indicating the above .
JP2014072104A 2014-03-31 2014-03-31 Information processing apparatus, information processing system, and information processing program Expired - Fee Related JP6158736B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2014072104A JP6158736B2 (en) 2014-03-31 2014-03-31 Information processing apparatus, information processing system, and information processing program
CN201510111871.5A CN104954605B (en) 2014-03-31 2015-03-13 Image processing system, image formation system and image forming method
US14/665,015 US9514394B2 (en) 2014-03-31 2015-03-23 Image forming apparatus capable of changing image data into document data, an image forming system, and an image forming method
EP15161595.2A EP2927843B1 (en) 2014-03-31 2015-03-30 An image forming apparatus and system, and an image forming method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014072104A JP6158736B2 (en) 2014-03-31 2014-03-31 Information processing apparatus, information processing system, and information processing program

Publications (2)

Publication Number Publication Date
JP2015194873A JP2015194873A (en) 2015-11-05
JP6158736B2 true JP6158736B2 (en) 2017-07-05

Family

ID=54433836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014072104A Expired - Fee Related JP6158736B2 (en) 2014-03-31 2014-03-31 Information processing apparatus, information processing system, and information processing program

Country Status (1)

Country Link
JP (1) JP6158736B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10515296B2 (en) * 2017-11-14 2019-12-24 Adobe Inc. Font recognition by dynamically weighting multiple deep learning neural networks

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07262317A (en) * 1994-03-18 1995-10-13 Ricoh Co Ltd Document processor

Also Published As

Publication number Publication date
JP2015194873A (en) 2015-11-05

Similar Documents

Publication Publication Date Title
EP2927843B1 (en) An image forming apparatus and system, and an image forming method
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
US20200202173A1 (en) Image processing system and image processing method
JP2007174270A (en) Image processing apparatus, image processing method, storage medium, and program
US9659018B2 (en) File name producing apparatus that produces file name of image
US11212397B1 (en) Image reading system, image forming system, and image reading method for dividing each area into blockchains
US10764448B1 (en) Information processing apparatus and image forming apparatus performing file conversion of handwriting comment and comment extraction method
US8179558B2 (en) Image processing apparatus, image processing method, program and storage medium constructed to generate print data including a bitmap image and attribute data of each pixel of the bitmap image
US8199967B2 (en) Image processing apparatus, image processing method, and storage medium
US8238664B2 (en) Image processing apparatus, control method therefor, and recording medium
US20090154763A1 (en) Image processing method for generating easily readable image
US12266204B2 (en) Information processing apparatus, image forming apparatus, and information processing method for automatically ordering page
US8259313B2 (en) Image processing apparatus, method, and computer-readable medium storing the program thereof
US11146705B2 (en) Character recognition device, method of generating document file, and storage medium
JP6158736B2 (en) Information processing apparatus, information processing system, and information processing program
JP6269256B2 (en) Information processing apparatus, image forming apparatus, information processing method, and information processing program
JP2006321190A (en) Image forming apparatus and language setting method thereof
US20210097271A1 (en) Character recognition using previous recognition result of similar character
US20230419707A1 (en) Information processing apparatus, image forming apparatus, and information processing method for automatically dividing page data
US11212419B1 (en) Image reading system, image forming system, and image reading method that perform image processing for each area
US11134171B1 (en) Image reading apparatus, image forming apparatus, and image reading method that perform image processing for each area
US10623598B2 (en) Image processing apparatus and non-transitory computer readable medium for extracting and connecting inherent regions of multiple pages of document data
US12387516B2 (en) Information processing apparatus, image forming apparatus, and information processing method for automatically dividing page data based on the history
US11615278B2 (en) Image processing apparatus, image forming apparatus, and image processing method that performs analysis image processing during normal image processing
US10685268B1 (en) Methods and systems for logical cell based orientation in N-up copying or printing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170509

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170608

R150 Certificate of patent or registration of utility model

Ref document number: 6158736

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees