JP5325870B2 - Character string output device, character recognition system, program, and character string output method - Google Patents
Character string output device, character recognition system, program, and character string output method Download PDFInfo
- Publication number
- JP5325870B2 JP5325870B2 JP2010249031A JP2010249031A JP5325870B2 JP 5325870 B2 JP5325870 B2 JP 5325870B2 JP 2010249031 A JP2010249031 A JP 2010249031A JP 2010249031 A JP2010249031 A JP 2010249031A JP 5325870 B2 JP5325870 B2 JP 5325870B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- string
- strings
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
Description
本発明は、画像中の文字列のレイアウトに従って文字認識の結果を出力するための技術に関する。 The present invention relates to a technique for outputting a result of character recognition according to a layout of a character string in an image.
画像に対する文字認識処理の結果を、その画像中での文字(又は文字列)のレイアウトに従った内容で出力する技術がある。例えば、特許文献1は、手書き文字を含む原稿を対象としたOCR(Optical Character Recognition)処理の結果を、原稿での文字の大きさや文字間スペースを再現して印刷することにより、元原稿のレイアウトに準ずるようにすることを開示している。
There is a technique for outputting the result of character recognition processing on an image with contents according to the layout of characters (or character strings) in the image. For example,
ところで、縦書きと横書きなどのように、文字列の文字が連なる方向(列方向)がそれぞれ異なる文字列がひとつの画像の中に混在することがある。ここで、縦書きの文字列と横書きの文字列とは別々のまとまりとして捉えるべきであるが、従来の文字認識技術では、これらを区別せずに文字認識結果を出力してしまい、ユーザがその出力結果を見たときに意味が分からない文字列になることがある。また、横書きの文字列又は縦書きの文字列のいずれか一方だけが画像に含まれている場合であっても、その画像の元原稿を書いたユーザが、例えば或る意味を持つ文字列群を或る場所にまとめて書き、また、別の意味を持つ文字列群をそれとは別の場所にまとめて書く、といった具合に、各文字列をいくつかのまとまりに分けた上で、文字列を書く場所を変えるというようなケースがある。従来の文字認識技術では、このようなグループを区別せずに文字認識結果を出力してしまい、ユーザがその出力結果を見たときに、せっかくグループ分けした文字列が混在して、見分けがつかなくなってしまうことがある。
そこで、本発明の目的は、画像に対する文字認識の結果を出力するときに、その画像に含まれる文字列群のまとまりをも表現することができる仕組みを提供することにある。
By the way, there are cases where character strings having different directions (column directions) in which the characters of a character string are continuous are mixed in one image, such as vertical writing and horizontal writing. Here, vertical character strings and horizontal character strings should be regarded as separate groups, but conventional character recognition technology outputs character recognition results without distinguishing them, and the user can When looking at the output result, it may become a character string whose meaning is unknown. Even if only one of the horizontally written character string or the vertically written character string is included in the image, the user who wrote the original document of the image, for example, has a certain character string group. Is written in a certain place, and a group of strings having different meanings is written in a different place, and so on. There are cases such as changing the place of writing. In the conventional character recognition technology, the character recognition result is output without distinguishing such groups, and when the user sees the output result, the grouped character strings are mixed together, so that it can be distinguished. It may disappear.
Accordingly, an object of the present invention is to provide a mechanism capable of expressing a group of character strings included in an image when outputting a result of character recognition for the image.
上述した課題を解決するため、本発明の文字列出力装置は、2以上の文字を配列した文字列を含む複数の文字列を画像から抽出する抽出部と、前記抽出部が抽出した一の文字列に注目して、この注目文字列の位置から当該文字列の文字が連なる方向に離れるにつれて当該方向に直交する方向に次第に広がり、かつ、当該位置からの距離が閾値以下である探索範囲に含まれる文字列を前記画像から探索し、探索した文字列と前記注目文字列とを同一グループにして、前記複数の文字列の各文字列をグループ化するグループ化部と、前記各文字列に対する文字認識を行う文字認識部と、前記文字認識部により文字認識された文字列を、前記グループ毎に分類して表示されるように出力する出力部とを備えることを特徴とする。 In order to solve the problems described above, the character string output apparatus of the present invention, an extraction unit for extracting a plurality of strings containing a string array of two or more characters from the image, one character extracted by the extracting unit Paying attention to the column, it gradually spreads in the direction orthogonal to the direction as the characters of the character string move away from the position of the character string of interest and is included in the search range where the distance from the position is less than or equal to the threshold value It searches the string from the image, and the search string and said target string to the same group, the grouping unit for grouping each string of the plurality of character strings, the character for each character string a character recognition unit for recognizing a character string character recognition by the character recognition unit, and an outputting unit that outputs to be displayed are classified before each SL group.
本発明の好ましい態様において、前記グループ化部は、決められた条件を満たす文字列を前記注目文字列として前記探索を開始し、前記探索範囲に含まれる未グループ化の文字列のうち、当該注目文字列の位置からの近さに応じて新たな注目文字列を順次探索していき、当該新たな注目文字列が、それよりも先に探索したすべての注目文字列からの前記探索範囲に含まれる場合に、当該新たな注目文字列と当該すべての文字列とを同一グループにする。この場合に、前記条件は、未グループ化の文字列のうち、前記画像の画像領域の予め決められた端部に最も近い位置にある文字列であることが好ましい。 In a preferred aspect of the present invention, the grouping unit starts the search using a character string that satisfies a predetermined condition as the attention character string, and among the ungrouped character strings included in the search range, A new attention character string is sequentially searched according to the proximity from the position of the character string , and the new attention character string is included in the search range from all the attention character strings searched earlier than that. The new attention character string and all the character strings are grouped together. In this case, it is preferable that the condition is a character string at a position closest to a predetermined end of the image area of the image among ungrouped character strings.
本発明の別の好ましい態様において、各注目文字列の前記探索範囲について、当該文字列の文字が連なる方向に対する長さにより前記閾値が定められる。
本発明の別の好ましい態様において、前記グループ化部は、前記抽出部が抽出した文字列の文字が連なる方向に基づいて、縦書きの文字列と横書きの文字列とに分けてグループ化する。
本発明の別の好ましい態様において、前記出力部は、前記グループ化の結果に従って、前記文字認識された文字列をグループ単位で改行して表示させるための表示データを出力する。
In another preferred aspect of the present invention, for the search range of each character string of interest, the threshold is determined by the length of the character string in the direction in which the characters are continuous.
In another preferable aspect of the present invention, the grouping unit divides the character string into a vertically written character string and a horizontally written character string based on the direction in which the characters of the character string extracted by the extracting unit continue.
In another preferred aspect of the present invention, the output unit outputs display data for displaying the character string recognized as a line by group, in accordance with the grouping result.
また、本発明の文字認識システムは、撮影部と、前記撮影部の撮影により得られる画像から2以上の文字を配列した文字列を含む複数の文字列を抽出する抽出部と、前記抽出部が抽出した一の文字列に注目して、この注目文字列の位置から当該文字列の文字が連なる方向に離れるにつれて当該方向に直交する方向に次第に広がり、かつ、当該位置から距離が閾値以下である探索範囲に含まれる文字列を前記画像から探索して、探索した文字列と前記注目文字列とを同一グループにして、前記複数の文字列の各文字列をグループ化するグループ化部と、前記各文字列に対する文字認識を行う文字認識部と、前記文字認識部により文字認識された文字列を、前記グループ毎に分類して表示されるように出力する出力部と、前記出力部により出力された文字列を表示する表示部とを備えることを特徴とする。 The character recognition system according to the present invention includes an imaging unit, an extraction unit that extracts a plurality of character strings including a character string in which two or more characters are arranged from an image obtained by imaging of the imaging unit, and the extraction unit includes: Paying attention to the extracted one character string, it gradually spreads in the direction orthogonal to the direction as the characters of the character string move away from the position of the character string of interest and the distance from the position is equal to or less than the threshold value. a character string included in the search range are searched from the image, and the search string and said target string to the same group, the grouping unit for grouping each string of the plurality of character strings, the a character recognition unit for performing character recognition for each character string, a character string character recognition by the character recognition unit, an output unit for outputting to appear classified before Symbol each group, output by the output unit The Characterized in that it comprises a display unit for displaying the character string.
また、本発明のプログラムは、コンピュータに、2以上の文字を配列した文字列を含む複数の文字列を画像から抽出する抽出ステップと、前記抽出ステップで抽出した一の文字列に注目して、この注目文字列の位置から当該文字列の文字が連なる方向に離れるにつれて当該方向に直交する方向に次第に広がり、かつ、当該位置からの距離が閾値以下である探索範囲に含まれる文字列を前記画像から探索して、探索した文字列と前記注目文字列とを同一グループにして、前記複数の文字列の各文字列をグループ化するグループ化ステップと、前記各文字列に対する文字認識を行う文字認識ステップと、前記文字認識ステップで文字認識された文字列を、前記グループ毎に分類して表示されるように出力する出力ステップとを実行させるためのものである。
また、本発明の文字列出力方法は、2以上の文字を配列した文字列を含む複数の文字列を画像から抽出する抽出ステップと、前記抽出ステップで抽出した一の文字列に注目して、この注目文字列の位置から当該文字列の文字が連なる方向に離れるにつれて次第に広がり、かつ、当該位置からの距離が閾値以下である探索範囲に含まれる文字列を前記画像から探索して、探索した文字列と前記注目文字列とを同一グループにして、前記複数の文字列の各文字列をグループ化するグループ化ステップと、前記各文字列に対する文字認識を行う文字認識ステップと、前記文字認識ステップで文字認識された文字列を、前記グループ毎に分類して表示されるように出力する出力ステップとを有することを特徴とする。
Further, the program of the present invention pays attention to an extraction step of extracting a plurality of character strings including a character string in which two or more characters are arranged from an image , and the one character string extracted in the extraction step. A character string that gradually spreads in a direction orthogonal to the direction as the characters in the character string move away from the position of the target character string and that is included in a search range in which the distance from the position is equal to or less than a threshold is the image. in search from the, and the search string and said target string to the same group, and grouping step of grouping each string of the plurality of character strings, the character recognition steps for each string step a, the character string character recognition in the character recognition step, also the order to execute an output step of outputting to appear classified before each Symbol group It is.
In the character string output method of the present invention, attention is paid to the extraction step of extracting a plurality of character strings including a character string in which two or more characters are arranged from the image , and the one character string extracted in the extraction step, A search was made by searching the image for a character string that gradually spreads away from the position of the character string of interest in the direction in which the characters of the character string continue and that is included in a search range in which the distance from the position is equal to or less than a threshold value. the character string and the target string in the same group, and grouping step of grouping each string of the plurality of character strings, and character recognition step of performing character recognition for each character string, said character recognition step in the character recognition string, and it is having an output step of outputting as display classified before each SL group.
本発明によれば、画像に対する文字認識の結果を出力するときに、その画像に含まれる文字列群のまとまりをも表現することができる。 According to the present invention, when outputting the result of character recognition for an image, a group of character strings included in the image can also be expressed.
以下、図面を参照しつつ本発明の一実施形態について説明する。
[実施形態の構成]
図1は、文字認識システム1の構成を示す図である。
図1に示すように、文字認識システム1は、文字列出力装置10と携帯端末20とを備える。文字列出力装置10と携帯端末20とは、通信網NWを介して互いに通信可能に接続されている。通信網NWは、移動通信網やインターネット、ゲートウェイ等を含む通信網である。文字列出力装置10は、携帯端末20から受信した撮影画像に対する文字認識等を行い、この処理により得られる文字コード(例えば、ASCII、Unicode、Shift_JIS等)で記述した文字列を携帯端末20に対して提供するサービスを行う。携帯端末20は、撮影機能を有しユーザが携帯可能な情報処理端末であり、ここでは携帯電話端末である。携帯端末20は、文字列出力装置10により提供されるサービスを受けるユーザによって所有されるものである。
なお、図1には携帯端末20を1つだけ記載しているが、実際には更に多数の携帯端末20が文字認識システム1に含まれる。また、携帯端末20は、携帯電話端末のほか、スマートフォンやPDA(Personal Digital Assistant)、携帯ゲーム機等であってもよい。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
[Configuration of the embodiment]
FIG. 1 is a diagram showing a configuration of a
As shown in FIG. 1, the
Although only one
図2は、文字列出力装置10のハードウェア構成を示すブロック図である。図2に示すように、文字列出力装置10は、制御部11と、通信部12と、記憶部13とを備える。
制御部11は、CPU(Central Processing Unit)を含む演算装置やメモリを備え、記憶部13に記憶されたプログラムを読み出して実行することにより、文字列出力装置10の各部を制御する。通信部12は、通信網NWに接続するためのインタフェースである。記憶部13は、例えばハードディスク装置を備え、OCRプログラム131や、OCRプログラム131を用いて実行可能な光学文字認識処理(以下、「OCR処理」という。)に必要となる文字パターンファイルや辞書ファイル等の情報を記憶する。
FIG. 2 is a block diagram illustrating a hardware configuration of the character
The
図3は、携帯端末20のハードウェア構成を示すブロック図である。図3に示すように、携帯端末20は、制御部21と、操作部22と、無線通信部23と、撮影部24と、表示部25と、記憶部26とを備える。
制御部21は、CPUを含む演算装置やメモリを備え、記憶部26に記憶されたプログラムを読み出して実行することにより携帯端末20の各部の動作を制御する。操作部22は、テンキー等の複数の操作子を備え、ユーザによる操作子の操作を受け付けて、その操作に応じた操作信号を制御部21に出力する。無線通信部23は、無線通信回路やアンテナを備え、通信網NWに接続するためのインタフェースである。撮影部24は、CCD(Charge Coupled Device)等の撮像素子を備え、撮影して撮影画像を生成する。表示部25は、例えば液晶駆動回路や液晶ディスプレイを備え、画像の表示により情報に応じた内容を報知する。記憶部26は、例えばEEPROM(Electronically Erasable and Programmable ROM)を備え、文字列出力装置10が提供されるサービスを受けるために必要なアプリケーションプログラム等を記憶する。
なお、携帯端末20は、上記構成以外にも、受話音声を収音するマイクや送話音声を放音するスピーカ等、携帯電話端末として機能するための構成を備える。
FIG. 3 is a block diagram illustrating a hardware configuration of the
The
In addition to the above configuration, the
図4は、文字列出力装置10の制御部11が実現する機能構成を示す機能ブロック図である。
制御部11はOCRプログラム131を実行することにより、撮影画像取得部111と、文字列抽出部112と、グループ化部113と、文字認識部114と、文字列出力部115とに相当する機能を実現する。
撮影画像取得部111は、携帯端末20での撮影により得られる撮影画像を取得する。詳しくは後述するが、携帯端末20は撮影部24により撮影して得た撮影画像を、文字列出力装置10宛てに送信する。撮影画像取得部111は、携帯端末20により送信された撮影画像が通信部12により受信されると、受信された撮影画像を通信部12から取得する。撮影画像取得部111は、撮像画像の一例として、図5に示される内容の撮像画像P1を取得する。この実施形態の撮影画像は、矩形の画像領域を有する画像であり、画像領域内の各位置にはxy直交座標系に従って座標が割り当てられている。xy直交座標系では、撮影画像の左上隅点が原点Oに対応し、画像領域の一方の辺(紙面左右方向に延びる辺)に沿ってx軸が延び、他方の辺(紙面上下方向に延びる辺)に沿ってy軸が延びている。撮影画像P1の画像領域の短手方向がx軸方向に一致し、長手方向がy軸方向に一致する。また、撮像画像P1には、文字列T1〜T8という8つの文字列が含まれる。このうち、文字列T1〜T6は、横書きで記述された文字列であり、文字列T7及びT8は、縦書きで記述された文字列である。横書き及び縦書きいずれであっても、文字が連なる方向に文字列が延びる。
なお、「軸方向」は、この軸に平行な方向のことをいう。また、この実施形態では、複数の文字を配列した文字列を想定するが、1文字であっても本発明の文字列に含まれる。
FIG. 4 is a functional block diagram illustrating a functional configuration realized by the
The
The captured
The “axial direction” refers to a direction parallel to this axis. In this embodiment, a character string in which a plurality of characters are arranged is assumed, but even a single character is included in the character string of the present invention.
文字列抽出部112は、撮影画像取得部111が取得した撮影画像から各文字列を抽出する。文字列抽出部112は、例えば、撮影画像に対して二値化処理を施した後に、文字列を囲む矩形状のテキスト領域を定めることによって撮影画像から文字列を抽出する。このテキスト領域は、例えば、文字列に外接する外接矩形で定義される矩形領域である。文字列抽出部112は、撮像画像P1について、文字列T1〜T8のそれぞれで独立したテキスト領域を定める。
なお、文字列抽出部112が行う文字列の抽出は、ここではOCR処理の前段階の処理として行われるものである。
The character
Note that the character string extraction performed by the character
グループ化部113は、後述するグループ化処理を行うことにより、文字列抽出部112により抽出された各文字列をグループ化する。グループ化処理の内容については後述するが、グループ化部113は、撮影画像において相対的に近い位置にある文字列同士を1つのグループにするようグループ化する。
The
文字認識部114は、撮影画像取得部111が取得した撮影画像から文字列を認識するOCR処理を行って、各文字列を文字コードで記述された文字列に変換する。文字認識部114は、記憶部13に記憶された文字パターンファイルや辞書ファイル等を用いて、周知の方法によりOCR処理を行う。
なお、グループ化部113は、文字列抽出部112により文字列が抽出され、更に、文字認識部114により文字認識された結果を用いて、グループ化処理を行ってもよい。
The
The
文字列出力部115は、文字認識部114により文字コード化された文字列を、グループ化部113のグループ化の結果に従って、各文字列がグループ毎に分類して表示されるように出力する。文字列出力部115は、文字コード化された文字列を表示装置に表示させるための表示データを生成し、生成した表示データを通信部12に出力する。文字列出力部115が出力した表示データは、撮影画像取得部111の文字列の取得元(つまり、携帯端末20)に通信部12によって送信される。
文字認識システム1の構成の説明は以上である。
The character
The configuration of the
[実施形態の動作]
続いて、文字認識システム1に関わる動作について説明する。
まず、文字列出力装置10が実行するグループ化処理(つまり、グループ化部113に関わる機能)についてより詳細に説明する。
図6は、グループ化処理の手順を示すフローチャートである。以下では、文字列出力装置10が、図5に示す内容の撮像画像P1を用いてグループ化処理を行う場合の動作について説明する。図7〜9は、それぞれグループ化処理の説明図である。
制御部11は、撮影画像P1を取得すると、撮影画像P1の座標軸を変換する(ステップS51)。ここで、制御部11は、撮影画像に含まれる文字列の天地方向を撮影画像の天地方向に一致させるように撮影画像P1に対して回転処理を施す。この回転処理によって、図5に示す撮影画像P1は、図7(a)に示す撮影画像P2に加工される。撮影画像P2は、撮影画像P1を時計回り方向に90度回転した画像であり、画像領域の長手方向がx軸方向に平行となり、短手方向がy軸方向に平行となる。
なお、図7(a)において、矩形の二点鎖線は、それぞれ各文字列に対応するテキスト領域を表したものであり、実際に撮影画像に含まれているわけではない。ただし、図が見づらくなるのを防ぐため、文字列とテキスト領域を示す二点鎖線とを若干離して図示している。矩形の二点鎖線の意味は、他の図面でも同じである。図7(a)に示すように、テキスト領域の長手方向は、このテキスト領域に含まれる文字列において文字が連なる方向(以下、「列方向」という。)に一致する。よって、ステップS51の処理では、制御部11は各テキスト領域の長手方向を参照して、撮影画像を90度回転させるか、撮影画像を回転させないかといった回転処理の内容を決定する。
[Operation of the embodiment]
Next, operations related to the
First, the grouping process (that is, the function related to the grouping unit 113) executed by the character
FIG. 6 is a flowchart showing the procedure of the grouping process. Hereinafter, an operation when the character
When acquiring the captured image P1, the
In FIG. 7A, each rectangular two-dot chain line represents a text area corresponding to each character string, and is not actually included in the captured image. However, in order to prevent the figure from becoming difficult to see, the character string and the two-dot chain line indicating the text area are shown slightly apart. The meaning of the rectangular two-dot chain line is the same in other drawings. As shown in FIG. 7A, the longitudinal direction of the text area coincides with the direction in which characters are connected in the character string included in the text area (hereinafter referred to as “column direction”). Accordingly, in the process of step S51, the
次に、制御部11は、撮影画像から抽出した各文字列の列方向に基づいて、縦書きの文字列と横書きの文字列とに分類する(ステップS52)。ここでは、制御部11は、各テキスト領域の長手方向をx軸又はy軸の向きが近い方の軸と平行にするよう、各文字列を回転させる。この回転により、図7(a)に示す撮影画像P2は、図7(b)に示す撮影画像P3に加工される。これにより、各テキスト領域の長手方向(つまり、文字列の列方向)においては、横書きの文字列についてはx軸に平行となり、縦書きの文字列についてはy軸に平行となる。
なお、制御部11は、OCR処理を行ってからグループ化処理を行ってもよい。この場合、制御部11は、ステップS51の処理ではOCR処理から文字の天地方向を特定し、ステップS52の処理では、OCR処理からテキスト領域を特定したり、テキスト領域に含まれる文字列の文字が連なる方向を特定したりするとよい。
Next, the
Note that the
続いて、制御部11は、横書きの文字列を対象としたグループ化処理を開始する(ステップS53)。このとき、制御部11は、例えば、横書きの文字列を対象とすることを示すフラグデータをメモリに記憶する。これにより、このフラグデータがメモリに記憶されている限りは、制御部11は撮影画像に含まれる文字列のうち、横書きの文字列を対象として後述する処理ステップを実行する。
Subsequently, the
次に、制御部11は、撮影画像から抽出した文字列の中から、決められた条件を満たす文字列を基準文字列に決定する(ステップS54)。基準文字列は、制御部11により文字列の探索が開始される際に、その起点となる文字列である。具体的には、制御部11は、横書きの文字列については、未だいずれのグループにも分類していない文字列(未グループ化の文字列)のうち、テキスト領域の頂点が最も撮影画像の上端に近い文字列(つまり、y座標が最小である文字列。)を基準文字列に決定する。
なお、この実施形態の頂点は、横書きの文字列についてはテキスト領域の左上に位置するものを指すものとする。テキスト領域の頂点は、この実施形態において、このテキスト領域に含まれる文字列の位置を表すものである。ここでは、ステップS54の処理において、制御部11は「福岡」という文字列T1を基準文字列に決定する。
Next, the
In addition, the vertex of this embodiment shall point to the thing located in the upper left of a text area about a horizontal character string. In this embodiment, the vertex of the text area represents the position of a character string included in the text area. Here, in the process of step S54, the
次に、制御部11は、ステップS54の処理で決定した基準文字列に注目し、これを注目文字列として、この注目文字列の探索範囲に含まれる文字列を探索する(ステップS55)。注目とは、制御部11が探索範囲を設定する文字列を特定すること、つまり、探索範囲の起点となる頂点を有するテキスト領域を特定することをいう。制御部11が実行するステップS55の処理の内容について、図8(a)を参照しつつ説明する。図8(a)は、撮影画像P3のうち文字列T1付近を拡大した様子を表す。
制御部11は、注目文字列T1の頂点v1を起点として、注目文字列の列方向(つまり、x軸方向)に対する両側に、それぞれ探索範囲R1(太線枠内)を設定する。探索範囲R1は、頂点v1から注目文字列の列方向(つまり、x軸方向)に角度θで広がり、かつ、頂点v1からのx軸方向に対する距離が3L1以下である三角形の範囲である。ここでは、θ=10°であり、頂点v1よりも上側の領域(つまり、y座標が小さい領域)は探索範囲R1に含まれない。3L1という距離は、文字列T1の列方向の長さに応じて定められた閾値であり、この実施形態では、その長さの3倍となるように定められる。なお、θの値は予め決められた値である。
Next, the
The
ここで、制御部11は、探索範囲R1内に未グループ化の別の文字列の頂点が含まれていれば、このうちの頂点v1から最も近いものを新たに探索する。ここでいう「最も近い」とは、y軸方向(撮影画像の天地方向)に対する距離が最も近いということを意味する。ただし、例えば直線距離やx軸方向(撮影画像の左右方向)に対する距離が近いという構成であってもよい。図8(a)に示すように、ここでは探索範囲R1内に「大阪」という文字列T2の頂点v2と、「東京」という文字列T3の頂点v3と探索範囲R1に含まれるが、制御部11は「大阪」という文字列T2を新たに探索することになる。
Here, if the vertex of another character string that has not been grouped is included in the search range R1, the
次に、制御部11は、ステップS55の処理で新たな文字列を探索したか否かを判定する(ステップS56)。制御部11は、新たな文字列を探索したと判定すると(ステップS56;YES)、当該新たな注目文字列が、それよりも先に探索したすべての未グループ化の文字列の探索範囲のそれぞれに含まれるか否かを判定する(ステップS57)。ここでは、制御部11は、ステップS55の処理で探索した文字列T2が、先に探索したT1の探索範囲R1に含まれるか否かを判定する。図8(a)に示すとおり、ここでは、制御部11はステップS57の処理で「YES」と判定し、ステップS58の処理に進む。そして、制御部11は、直前のステップS55の処理で探索した文字列T2を新たな注目文字列に決定して、ステップS55の処理に戻る。
Next, the
次に、制御部11は、ステップS58の処理で決定した注目文字列T2の探索範囲に含まれる文字列を探索する(ステップS55)。ここで、ステップS55の処理の内容について、図8(b)を参照しつつ説明する。図8(b)は、撮影画像P3のうち文字列T2付近を拡大した様子を表す。制御部11は、注目文字列T2の頂点v2を起点として、注目文字列の列方向(つまり、x軸方向)に対する両側に、それぞれ探索範囲R2(太線枠内)を設定する。探索範囲R2は、頂点v2から注目文字列の列方向に角度θで広がり、かつ、頂点v2からのx軸方向に対する距離が3L2以下である三角形の範囲である。ここでは、θ=10°であり、頂点v2よりも上側の領域は探索範囲R2に含まれない。3L2という距離は、文字列T2の列方向の長さに応じて定められた閾値であり、この実施形態では、その長さの3倍となるように定められる。
Next, the
図8(b)に示すように、探索範囲R2内には「東京」という文字列T3の頂点v3が含まれるので、制御部11は、ステップS55の処理で文字列T3を新たに探索する。次に、制御部11は、ステップS56の処理で「YES」と判定して、文字列T3よりも先に探索した、未グループ化のすべての注目文字列の探索範囲のそれぞれにこの注目文字列が含まれるか否かを判定する(ステップS57)。ここでは、制御部11は、文字列T3がそれよりも先に探索したすべての未グループ化の文字列(つまり、文字列T1及びT2)の探索範囲R1,R2のそれぞれに含まれるか否かを判定する。図8(a),(b)に示すとおり、ここでは、制御部11はステップS57の処理で「YES」と判定し、ステップS58の処理に進む。そして、制御部11は、直前のステップS55の処理で探索した文字列T3を新たな注目文字列に決定して、ステップS55の処理に戻る。
As shown in FIG. 8B, since the vertex v3 of the character string T3 “Tokyo” is included in the search range R2, the
次に、制御部11は、ステップS58で決定した注目文字列T3の探索範囲に含まれる文字列を探索する(ステップS55)。ここで、ステップS55の処理の内容について、図8(c)を参照しつつ説明する。図8(c)は、撮影画像P3のうち文字列T3付近を拡大した様子を表す。制御部11は、探索範囲R1,R2と同じ根拠に基づいて、注目文字列T3の頂点v3を起点とした探索範囲R3(太線枠内)を設定する。図8(c)に示すように、探索範囲R3には別の文字列が含まれないから、制御部11は、ステップS55の処理では文字列を探索しない。そして、制御部11は、ステップS56の処理で「NO」と判定して、ステップS59の処理に進む。
なお、制御部11は、ステップS55の処理で新たな文字列を探索した場合であっても、ステップS56の処理で、それよりも先に探索した未グループ化のすべての文字列の各探索範囲に当該新たな文字列が含まれないときには、ステップS57の処理で「NO」と判定して、ステップS59の処理に進む。つまり、制御部11は、基準文字列から或る程度離れた文字列については、これらが同一グループに属さないようにする。
Next, the
Even if the
そして、制御部11は、ステップS54の処理で決定した基準文字列と、ステップS55の処理で探索した文字列とを同一グループにして各文字列をグループ化する(ステップS59)。ここでは、制御部11は、文字列T1,T2及びT3を同一のグループとしてグループ化する。このグループ化によって、横書きの文字列については、撮影画像P3において天地方向に対する位置が互いに近く(つまり、y座標が比較的近く)、かつ、その左右方向(x座標方向)に対して相対的に近い位置にある文字列同士が同一グループに属する。
Then, the
次に、制御部11は、横書きの文字列について未グループ化の文字列があるか否かを判定する(ステップS60)。撮影画像P3には、未グループ化の横書きの文字列が別に含まれるから、制御部11は、ステップS60の処理で「YES」と判定して、ステップS54の処理に戻る。そして、制御部11は、文字列T4を基準文字列と決定して、上述した手順で処理ステップS55〜S59の処理ステップを実行してグループ化を行う。ここでは、制御部11は、文字列T4のみを1つのグループにグループ化する。同様に、制御部11は、文字列T5を基準文字列として上述した手順で処理ステップS55〜S59の処理を実行し、文字列T5及びT6を1つのグループにグループ化する。
Next, the
ステップS60の処理で、制御部11は、未グループの横書きの文字列がないと判定すると(ステップS60;NO)、横書き及び縦書きの双方について、上記グループ化に係る処理が終了したか否かを判定する(ステップS61)。ここでは、制御部11は、縦書きの文字列のグループ化を完了していないので、ステップS61の処理で「NO」と判定し、縦書きの文字列に対するグループ化処理を開始すると判断する(ステップS62)。このとき、制御部11は、例えば、縦書きの文字列を対象とすることを示すフラグデータをメモリに記憶(更新)する。これにより、このフラグデータがメモリに記憶されている限りは、制御部11は撮影画像に含まれる文字列のうち、縦書きの文字列を対象として後述する処理ステップを実行する。そして、制御部11は、ステップS54の処理に戻る。
If the
次に、制御部11は、縦書きの文字列について上記同様の手順でステップS54〜S60の処理ステップを実行して、縦書きの文字列についてグループ化処理を行う。
図9は、縦書きの文字列のグループ化を説明する図である。図9は、撮影画像P3のうち文字列T7,8付近を拡大した様子を表す。制御部11は、縦書きの文字列の中から基準文字列を決定する(ステップS54)。ここでの基準文字列は、未グループ化の文字列のうち、頂点の座標が最も右側(つまり、x座標が最大である。)である文字列を基準文字列として決定する。この実施形態の頂点は、縦書きの文字列についてはテキスト領域の右上に位置するものを指し、以下の説明でも同様とする。ここでは、制御部11は、「連休プランが」という文字列T7を基準文字列に決定する。
Next, the
FIG. 9 is a diagram for explaining grouping of vertically written character strings. FIG. 9 shows a state in which the vicinity of the character strings T7 and 8 is enlarged in the captured image P3. The
そして、制御部11は、注目文字列T7の探索範囲に含まれる文字列を探索する(ステップS55)。ここでは、制御部11は、注目文字列T7の頂点v7を起点として、注目文字列の列方向(つまり、y軸方向)に対する両側に、それぞれ探索範囲R7(太線枠内)を設定する。文字列T7の文字列の長さはL7である。探索範囲R7は、頂点v7から注目文字列の列方向(つまり、y軸方向)に角度θで広がり、かつ、頂点v7からのy軸方向に対する距離が3L7以下である範囲である。ここでは、θ=10°であり、頂点v7よりも右側の領域(つまり、x座標が大きい領域)は探索範囲R7に含まれない。3L7という距離は、文字列T7の列方向の長さに応じて定められた閾値であり、この実施形態では、その長さの3倍となるように定められる。なお、θの値は予め決められた値である。このように、縦書きの文字列の探索範囲は横書きの文字列の探索範囲を時計回りに90度回転したものに等しい。
Then, the
制御部11は、ステップS55の処理で、横書きの場合と同じ手順で文字列の探索を行うが、探索範囲R7に別の文字列が含まれないから、ステップS56の処理では「NO」と判定する。そして、制御部11は、文字列T7のみを1つのグループにグループ化する。引き続き、制御部11は、文字列T8を基準文字列として同様に探索を行うが、ステップS59の処理では、文字列T8のみを1つのグループにグループ化する。このグループ化によって、縦書きの文字列については、y座標が比較的近く、かつ、x座標が相対的に近い位置にある文字列同士を同一にグループにグループ化される。
The
そして、制御部11は、ステップS60の処理で「NO」と判定し、さらに、ステップS61の処理で「YES」と判定すると、グループ化処理を終了する。
以上のグループ化処理によって、制御部11は、撮影画像中の各文字列をいずれか1つのグループに属するようにグループ化する。
And the
Through the grouping process described above, the
図10は、撮影画像P1に対するグループ化処理の結果を示す図である。
図10に示すように、横書きの文字列については、文字列T1,T2及びT3がグループGr1に属し、文字列T4がグループGr2に属し、文字列T5及びT6がグループGr3に属する。また、縦書きの文字列については、文字列T7がグループGr4に属し、文字列T8がグループGr5に属する。
FIG. 10 is a diagram illustrating a result of the grouping process for the captured image P1.
As shown in FIG. 10, for the horizontally written character strings, the character strings T1, T2, and T3 belong to the group Gr1, the character string T4 belongs to the group Gr2, and the character strings T5 and T6 belong to the group Gr3. For vertically written character strings, the character string T7 belongs to the group Gr4, and the character string T8 belongs to the group Gr5.
次に、文字認識システム1の全体的な動作について説明する。図11は、文字認識システム1において実行される処理の手順を示すシーケンス図である。
まず、携帯端末20のユーザが、文字列出力装置10により提供されるサービスを受けようと考えると、操作部22を操作して、それに必要なアプリケーションプログラムの起動を携帯端末20に対して指示する。制御部21は、この指示に応じた操作信号を操作部22から受け取ると、このアプリケーションプログラムを記憶部26から読み出して実行する。次に、制御部21は、撮影部24の撮影機能を起動させる。ユーザは表示部25に表示される撮影内容を見ながら、撮影対象物に撮影部24の撮影レンズを向け、撮影指示を意味する操作部22の操作を行う。撮影対象物は、例えば、手書き文字が記述された原稿のほか、雑誌やポスター、看板、商店の陳列棚に配置された各商品を説明する札等が挙げられるが、文字が記述されたものであればどのようなものでもよい。
Next, the overall operation of the
First, when the user of the
制御部21は、操作部22により撮影指示の操作が受け付けられると、撮影部24によって撮影対象物を撮影し、撮影画像を生成する(ステップS1)。制御部21は、生成した撮影画像を無線通信部23によって文字列出力装置10宛てに送信する(ステップS2)。このとき、制御部21は、携帯端末20の電子メールアドレス等、OCR処理の認識結果を受け取るために必要な情報も併せて送信する。
When the
文字列出力装置10の制御部11は、携帯端末20により送信された撮影画像を通信部12により受信し、これを取得する(ステップS3)。次に、制御部11は、取得した撮影画像に含まれる文字列を抽出する(ステップS4)。ステップS4の処理では、制御部11は各文字列に対するテキスト領域を定めることで文字列を抽出する。そして、制御部11は、図6に示した手順に従ってグループ化処理を実行する(ステップS5)。次に、制御部11は、撮影画像に含まれる各文字列に対してOCR処理を行う(ステップS6)。
なお、制御部11は、OCR処理を行ってからグループ化処理をしてもよく、ステップS5,S6の処理の順序を入れ替えてもよい。この場合、制御部11は、OCR処理からテキスト領域を特定したり、文字列の文字が連なる方向を特定したりするとよい。
The
The
そして、制御部11は、ステップS5のグループ化処理と、ステップS6のOCR処理の結果とに基づいて、表示データを生成する(ステップS7)。この表示データは、OCR処理が施された文字列をグループ毎に分類して表示出力するためのデータである。制御部11は、生成した文字コードを含み、かつ、各文字列の表示位置を特定可能な表示データを生成し、携帯端末20を送信先と指定して通信部12により送信する(ステップS8)。
And the
携帯端末20の制御部21は、文字列出力装置10により送信された表示データを通信部12により受信する(ステップS9)。そして、制御部21は、受信した表示データに基づいて表示部25に画像を表示させる(ステップS10)。制御部21は、撮影画像P1に基づいて生成された表示データを受信した場合、図12に示す画像を表示部25に表示させる。
図12は、表示データの内容の一例を示す図である。
図12に示すように、表示データに基づいて表示される表示画像にあっては、縦書きと横書きとに分けて表示されるとともに、OCR処理が施された文字列がグループ単位で改行して表示される。また、表示画像にあっては、同一グループに属する各文字列はスペースを用いてそれぞれ離して配置されるとともに、撮影画像P3で左側に位置したものが表示画像でも左側に位置し、右側に位置したものが表示画像でも右側に位置する。また、撮影画像P3で上側に位置した文字列が表示画像でも上側に位置し、下側に位置した文字列が表示画像でも下側に位置する。つまり、制御部11は、x座標及びy座標に応じた位置に文字列が表示画像上に表示されるように表示データを生成する。図12に示す内容の表示データにおいては、横書きの文字列が上位に表示され、縦書きの文字列が下位に表示されているが、これらが逆であってもよい。また、撮影対象物での文字列のレイアウトに近くなるように、例えば上述したテキスト領域の頂点の座標に基づいて、撮影画像上で上端に最も近いグループの文字列が横書きであれば横書きを上位にし、上端に最も近いグループの文字列が縦書きであれば縦書きを上位にしてもよい。また、行単位で横書きの文字列と縦書きの文字列とが混在していてもよく、撮影画像上で上端に近いグループの文字列ほど、表示データにおいても上位になるように文字列が配置されてもよい。
なお、携帯端末20は文字コード化された文字列を受信するから、例えば、この文字列を操作部22の操作に応じて編集したり、電子メールにコピー(又はカット)及びペーストしたりする、といった具合に利用することも可能である。
The
FIG. 12 is a diagram illustrating an example of the contents of display data.
As shown in FIG. 12, in the display image displayed based on the display data, it is displayed separately in vertical writing and horizontal writing, and the character string subjected to OCR processing is broken into lines in groups. Is displayed. Further, in the display image, the character strings belonging to the same group are spaced apart from each other by using a space, and the left side of the captured image P3 is positioned on the left side and the right side of the display image. The displayed image is also located on the right side of the display image. Further, the character string positioned on the upper side in the captured image P3 is positioned on the upper side of the display image, and the character string positioned on the lower side is positioned on the lower side of the display image. That is, the
Since the
以上説明した実施形態によれば、文字列出力装置10が実行したグループ化処理によって、撮影画像において天地方向に対する位置が相対的に近く、かつ、左右方向に対する位置が相対的に近い文字列が表示画像中でも同一グループに分類され、撮影画像でのレイアウトを考慮した配置で表示画像中に文字列が配置される。また、探索範囲は、文字列の列方向に対して頂点から離れるほど広がるから、例えば、携帯端末20の撮影画像の天地方向と、文字列の天地方向とが完全には一致しておらず、文字列がやや傾いてしまっていても、実施形態で説明したようなグループ化及び文字列の表示が可能である。これにより、文字列出力装置10によれば、画像に対する文字認識の結果を出力するときに、その画像に含まれる文字列群のまとまりをも表現することができ、例えばユーザが、各文字列の撮影対象物(又は、撮影画像)上での各文字列の位置を直観的に把握できるようにすることもできる。
According to the embodiment described above, the character
[変形例]
本発明は、上述した実施形態と異なる形態で実施することが可能である。本発明は、例えば、以下のような形態で実施することも可能である。また、以下に示す変形例は、各々を適宜に組み合わせてもよい。
[変形例1]
上述した実施形態では、探索範囲は、注目文字列の位置(頂点)からこの文字列の列方向に対して所定の角度θで広がり、かつ、この位置から当該方向に対して文字列の長さの3倍以下である範囲を表していた。これに対し、本発明の探索範囲はこの態様に限定されない。探索範囲は、注目オブジェクトの位置からx軸方向に離れるにつれてy軸方向に次第に広がる範囲であればよく、例えば、曲線的に広がる範囲を表していてもよい。また、距離については、注目文字列の位置から各方向に文字列の長さの3倍以下である範囲としてもよく、この場合探索範囲は扇形になる。また、この距離は、文字列の長さの3倍に限らず、他の倍数とされてもよいし、予め決められた固定値であってもよい。また、探索範囲は、横書きの文字列について、注目オブジェクトの頂点よりも上方の(y座標が小さくなる)領域を含んでいてもよいし、縦書きの文字列において、注目オブジェクトの頂点よりも右方の(x座標が大きくなる)領域を含んでいてもよい。
[Modification]
The present invention can be implemented in a form different from the above-described embodiment. The present invention can also be implemented in the following forms, for example. Further, the following modifications may be combined as appropriate.
[Modification 1]
In the embodiment described above, the search range extends from the position (vertex) of the target character string at a predetermined angle θ with respect to the string direction of the character string, and the length of the character string with respect to the direction from this position. Represents a range that is less than or equal to three times. On the other hand, the search range of the present invention is not limited to this mode. The search range may be a range that gradually expands in the y-axis direction as it moves away from the position of the object of interest in the x-axis direction. For example, the search range may represent a range that expands in a curved line. The distance may be a range that is three times or less the length of the character string in each direction from the position of the target character string. In this case, the search range is a sector. Further, this distance is not limited to three times the length of the character string, but may be other multiples, or may be a fixed value determined in advance. Further, the search range may include an area above the vertex of the object of interest (y coordinate becomes smaller) in the horizontally written character string, or may be on the right side of the vertex of the object of interest in the vertically written character string. May be included (where the x-coordinate becomes larger).
[変形例2]
上述した実施形態では、基準文字列が、縦書きの文字列については、未グループ化の文字列のうち、頂点が撮影画像の上端に近い文字列として定められ、横書きの文字列については、未グループ化の文字列のうち、頂点が撮影画像の右端に近い文字列として定められていた。これに代えて、基準文字列が、縦書きの文字列について、未グループ化の文字列のうち頂点が撮影画像の下端に近い文字列として定められ、横書きの文字列について、未グループ化の文字列のうち頂点が撮影画像の左端に近い文字列として定められてもよいし、また、画像領域の端部に最も近い文字列としないことも可能である。また、各文字列の位置は、テキスト領域の頂点に限らず、例えばテキスト領域の中心点を用いて特定されてもよく、テキスト領域内の予め定められた位置を文字列の位置と見做してよい。
[Modification 2]
In the embodiment described above, the reference character string is determined as a character string whose vertex is close to the upper end of the photographed image among ungrouped character strings for vertically written character strings, and unwritten for horizontally written character strings. Of the grouped character strings, the vertex was determined as a character string close to the right end of the photographed image. Instead, the reference character string is determined as a character string whose apex is close to the lower end of the photographed image among ungrouped character strings for vertically written character strings, and ungrouped characters for horizontally written character strings. Of the columns, the vertex may be determined as a character string close to the left end of the photographed image, or may not be the character string closest to the end of the image area. In addition, the position of each character string is not limited to the vertex of the text area, and may be specified using, for example, the center point of the text area. A predetermined position in the text area is regarded as the position of the character string. It's okay.
[変形例3]
上述した実施形態では、複数の文字列を同一グループにするための条件として、ステップS56の処理で説明したように、新たな注目文字列がそれよりも先に探索したすべての文字列の探索範囲のそれぞれに含まれることを要していたが、本発明において、この条件を省くことも可能である。この場合、制御部11は、注目文字列から探索範囲に文字列が含まれていることのみを同一グループにする条件とする。これにより、上述した実施形態よりも、文字列の列方向に対して広範囲に分布する文字列が同一グループに分類されることも考えられる。この場合であっても、撮影画像内での天地方向に対する位置が相対的に近い文字列同士が同一グループになるので、文字列出力装置10によれば、画像に含まれる文字列群のまとまりを表現することができる。
なお、制御部11は、ステップS57の処理で「YES」と判定したことを契機に、既にグループが確定した文字列について先にグループ化してもよい。
[Modification 3]
In the embodiment described above, as a condition for grouping a plurality of character strings, as described in the process of step S56, a search range of all character strings searched for by a new target character string before that is performed. However, in the present invention, this condition can be omitted. In this case, the
Note that the
[変形例4]
上述した実施形態では、文字列出力装置10は、グループ化の結果に従って、文字認識された文字列をグループ単位で改行して表示させるための表示データを出力していたが、表示データの内容はこれに限定されない。ユーザが各文字列をグループ単位で識別できればよいから、例えば、グループ毎に文字列が「/」(スラッシュ)や「,」(カンマ)等を用いて分類して表示されてもよいし、グループを識別する情報と対応付けて各文字列が表示されてもよい。
また、本発明の文字列出力装置は、縦書き又は横書きの一方の文字列を対象としてグループ化処理やOCR処理等を行うものであってもよい。
[Modification 4]
In the above-described embodiment, the character
Further, the character string output device of the present invention may perform grouping processing, OCR processing, or the like for one of the vertical and horizontal writing character strings.
[変形例5]
本発明において、携帯端末の撮影により得られる撮影画像は、携帯端末が内蔵する撮影部により得たものであってもよいし、携帯端末に装着された外部の撮影装置により得たものであってもよい。これらのいずれであっても、携帯端末での撮影により撮影画像が得られることに変わりないからである。
また、本発明の文字列出力装置は、文字列を含む画像を処理対象とすることができる。また、本発明の文字列出力装置は、外部の情報処理端末と通信接続される態様のほか、例えば、情報処理端末に内蔵されたものであってもよい。また、本発明の文字列出力システムは、撮影部での撮影から文字認識の結果を表す文字列の表示までの一連の処理を行う、情報処理端末によって実現されてもよい。また、本発明は、上述したようグループ化処理を行って文字認識を行う文字列出力方法として特定することもできる。
また、上述した文字列出力装置10及び携帯端末20が実現する各機能は、複数のプログラムの組み合わせによって実現され、又は、複数のハードウェア資源の協働によって実現されうる。
[Modification 5]
In the present invention, a photographed image obtained by photographing with a portable terminal may be obtained by a photographing unit incorporated in the portable terminal, or obtained by an external photographing device attached to the portable terminal. Also good. This is because any of these methods does not change that a photographed image can be obtained by photographing with a portable terminal.
Moreover, the character string output device of the present invention can process an image including a character string. Moreover, the character string output device of the present invention may be incorporated in an information processing terminal, for example, in addition to an aspect in which communication is connected to an external information processing terminal. Further, the character string output system of the present invention may be realized by an information processing terminal that performs a series of processing from photographing at the photographing unit to display of a character string representing the result of character recognition. The present invention can also be specified as a character string output method for performing character recognition by performing grouping processing as described above.
Moreover, each function which the character
1…文字認識システム、10…文字列出力装置、11…制御部、111…撮影画像取得部、112…文字列抽出部、113…グループ化部、114…文字認識部、115…文字列出力部、12…通信部、13…記憶部、131…OCRプログラム、20…携帯端末、21…制御部、22…操作部、23…無線通信部、24…撮影部、25…表示部、26…記憶部。
DESCRIPTION OF
Claims (9)
前記抽出部が抽出した一の文字列に注目して、この注目文字列の位置から当該文字列の文字が連なる方向に離れるにつれて当該方向に直交する方向に次第に広がり、かつ、当該位置からの距離が閾値以下である探索範囲に含まれる文字列を前記画像から探索し、探索した文字列と前記注目文字列とを同一グループにして、前記複数の文字列の各文字列をグループ化するグループ化部と、
前記各文字列に対する文字認識を行う文字認識部と、
前記文字認識部により文字認識された文字列を、前記グループ毎に分類して表示されるように出力する出力部と
を備えることを特徴とする文字列出力装置。 An extraction unit for extracting a plurality of strings containing a string array of two or more characters from the image,
Paying attention to the one character string extracted by the extraction unit, the distance from the position of the target character string gradually spreads in the direction orthogonal to the direction as the characters of the character string move away from each other in the direction in which the character string continues. grouping but searches the character string included in the search range is equal to or less than the threshold from the image, and the search string and said target string to the same group, grouping each string of said plurality of strings And
A character recognition unit that performs character recognition for each of the character strings;
String output apparatus characterized by comprising an output section for outputting a character string character recognition by the character recognition unit, to be displayed are classified before each SL group.
決められた条件を満たす文字列を前記注目文字列として前記探索を開始し、前記探索範囲に含まれる未グループ化の文字列のうち、当該注目文字列の位置からの近さに応じて新たな注目文字列を順次探索していき、当該新たな注目文字列が、それよりも先に探索したすべての注目文字列からの前記探索範囲に含まれる場合に、当該新たな注目文字列と当該すべての文字列とを同一グループにする
ことを特徴とする請求項1に記載の文字列出力装置。 The grouping unit
The search is started by using a character string that satisfies a predetermined condition as the attention character string, and a new character string is added according to the proximity from the position of the attention character string among ungrouped character strings included in the search range. When the target character string is sequentially searched and the new target character string is included in the search range from all the target character strings searched earlier than the target character string, the new target character string and all the target character strings are searched. The character string output device according to claim 1, wherein the character string is grouped into the same group.
ことを特徴とする請求項2に記載の文字列出力装置。 The character string output device according to claim 2, wherein the condition is a character string located closest to a predetermined end of an image area of the image among ungrouped character strings. .
ことを特徴とする請求項1から3のいずれかに記載の文字列出力装置。 The character string output device according to any one of claims 1 to 3, wherein the threshold value is determined for the search range of each character string of interest by a length in a direction in which characters of the character string are continuous.
前記抽出部が抽出した文字列の文字が連なる方向に基づいて、縦書きの文字列と横書きの文字列とに分けてグループ化する
ことを特徴とする請求項1から4のいずれかに記載の文字列出力装置。 The grouping unit
5. The character string extracted by the extraction unit is grouped into a vertically written character string and a horizontally written character string based on a direction in which the characters are consecutive. String output device.
前記グループ化の結果に従って、前記文字認識された文字列をグループ単位で改行して表示させるための表示データを出力する
ことを特徴とする請求項1から5のいずれかに記載の文字列出力装置。 The output unit is
6. The character string output device according to claim 1, wherein the character string output device outputs the display data for displaying the character string recognized as a group in a line feed according to the grouping result. .
前記撮影部の撮影により得られる画像から2以上の文字を配列した文字列を含む複数の文字列を抽出する抽出部と、
前記抽出部が抽出した一の文字列に注目して、この注目文字列の位置から当該文字列の文字が連なる方向に離れるにつれて当該方向に直交する方向に次第に広がり、かつ、当該位置から距離が閾値以下である探索範囲に含まれる文字列を前記画像から探索して、探索した文字列と前記注目文字列とを同一グループにして、前記複数の文字列の各文字列をグループ化するグループ化部と、
前記各文字列に対する文字認識を行う文字認識部と、
前記文字認識部により文字認識された文字列を、前記グループ毎に分類して表示されるように出力する出力部と、
前記出力部により出力された文字列を表示する表示部と
を備えることを特徴とする文字認識システム。 A shooting section;
An extraction unit that extracts a plurality of character strings including a character string in which two or more characters are arranged from an image obtained by photographing of the photographing unit;
Paying attention to the one character string extracted by the extraction unit, the distance from the position of the character string of interest gradually spreads in a direction orthogonal to the direction as the characters of the character string move away from each other. searches for a character string included in the search range is equal to or less than the threshold from the image, and the search string and said target string to the same group, the grouping of grouping each string of said plurality of strings And
A character recognition unit that performs character recognition for each of the character strings;
An output unit for outputting to the character recognition string is displayed by classifying before each Symbol group by the character recognition unit,
A character recognition system comprising: a display unit that displays a character string output by the output unit.
2以上の文字を配列した文字列を含む複数の文字列を画像から抽出する抽出ステップと、
前記抽出ステップで抽出した一の文字列に注目して、この注目文字列の位置から当該文字列の文字が連なる方向に離れるにつれて当該方向に直交する方向に次第に広がり、かつ、当該位置からの距離が閾値以下である探索範囲に含まれる文字列を前記画像から探索して、探索した文字列と前記注目文字列とを同一グループにして、前記複数の文字列の各文字列をグループ化するグループ化ステップと、
前記各文字列に対する文字認識を行う文字認識ステップと、
前記文字認識ステップで文字認識された文字列を、前記グループ毎に分類して表示されるように出力する出力ステップと
を実行させるためのプログラム。 On the computer,
An extraction step of extracting from the image a plurality of character strings including a character string in which two or more characters are arranged ;
Paying attention to the one character string extracted in the extraction step, the distance from the position gradually increases in the direction orthogonal to the direction as the characters of the character string move away from the position of the character string of interest. group but by searching the character string included in the search range is equal to or less than the threshold from the image, and the search string and said target string to the same group, grouping each string of said plurality of strings Step,
A character recognition step for performing character recognition for each of the character strings;
Program for executing an output step of outputting the character string character recognition in the character recognition step, to be displayed are classified before each SL group.
前記抽出ステップで抽出した一の文字列に注目して、この注目文字列の位置から当該文字列の文字が連なる方向に離れるにつれて次第に広がり、かつ、当該位置からの距離が閾値以下である探索範囲に含まれる文字列を前記画像から探索して、探索した文字列と前記注目文字列とを同一グループにして、前記複数の文字列の各文字列をグループ化するグループ化ステップと、
前記各文字列に対する文字認識を行う文字認識ステップと、
前記文字認識ステップで文字認識された文字列を、前記グループ毎に分類して表示されるように出力する出力ステップと
を有することを特徴とする文字列出力方法。 An extraction step of extracting from the image a plurality of character strings including a character string in which two or more characters are arranged ;
Focusing on the one character string extracted in the extraction step, the search range is gradually expanded from the position of the character string of interest in the direction in which the characters of the character string are connected, and the distance from the position is equal to or less than the threshold value and a character string is searched from the image, and the search string and said target string to the same group, the grouping step of grouping each string of the plurality of character strings included in,
A character recognition step for performing character recognition for each of the character strings;
String output method characterized in that it comprises an output step of outputting the character string character recognition in the character recognition step, to be displayed are classified before each SL group.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010249031A JP5325870B2 (en) | 2010-11-05 | 2010-11-05 | Character string output device, character recognition system, program, and character string output method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010249031A JP5325870B2 (en) | 2010-11-05 | 2010-11-05 | Character string output device, character recognition system, program, and character string output method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2012103755A JP2012103755A (en) | 2012-05-31 |
| JP5325870B2 true JP5325870B2 (en) | 2013-10-23 |
Family
ID=46394113
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010249031A Expired - Fee Related JP5325870B2 (en) | 2010-11-05 | 2010-11-05 | Character string output device, character recognition system, program, and character string output method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5325870B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6435934B2 (en) * | 2015-03-13 | 2018-12-12 | オムロン株式会社 | Document image processing program, image processing apparatus and character recognition apparatus using the program |
| TWI671686B (en) * | 2018-01-24 | 2019-09-11 | 緯創資通股份有限公司 | Image data retrieving method and image data retrieving device |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6295185A (en) * | 1985-10-22 | 1987-05-01 | 日本電気株式会社 | Apparatus for automatically arranging mails |
| JPS62169283A (en) * | 1986-01-22 | 1987-07-25 | Nec Corp | Character string extraction system |
| JPH0636174B2 (en) * | 1986-10-29 | 1994-05-11 | 富士通株式会社 | Line extraction method for character strings |
| JPH02220185A (en) * | 1989-02-22 | 1990-09-03 | Pentel Kk | Document image recognizing device |
| JP3253356B2 (en) * | 1992-07-06 | 2002-02-04 | 株式会社リコー | Document image area identification method |
| JP4170441B2 (en) * | 1997-11-28 | 2008-10-22 | 富士通株式会社 | Document image inclination detection apparatus and storage medium for document image inclination detection program |
| JP2007188512A (en) * | 2000-09-29 | 2007-07-26 | Japan Science & Technology Agency | Character recognition method, character recognition program, and computer-readable recording medium on which character recognition program is recorded |
-
2010
- 2010-11-05 JP JP2010249031A patent/JP5325870B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2012103755A (en) | 2012-05-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN105518712B (en) | Keyword notification method and device based on character recognition | |
| CN107885430B (en) | Audio playing method and device, storage medium and electronic equipment | |
| CN101615251B (en) | Method and apparatus for recognizing character in character recognizing apparatus | |
| US12039791B2 (en) | Image processing method, and electronic device supporting same | |
| CN109189879B (en) | Electronic book display method and device | |
| CN110135411A (en) | Business card recognition method and device | |
| US10976906B2 (en) | Detection and visualization of a formation of a tangible interface object | |
| CN104428790A (en) | Method of handling complex variants of words through prefix-tree based decoding for devanagiri ocr | |
| US20160080298A1 (en) | Method for generating emoticon and electronic device supporting the same | |
| CN111597922A (en) | Cell image recognition method, system, device, equipment and medium | |
| CN109726379B (en) | Content item editing method and device, electronic equipment and storage medium | |
| JP5325870B2 (en) | Character string output device, character recognition system, program, and character string output method | |
| CN115391524B (en) | Sensitive word detection method and device, computer equipment, storage medium and product | |
| CN109771950B (en) | Node map setting method, device and storage medium | |
| CN111078982A (en) | An electronic page retrieval method, electronic device and storage medium | |
| CN110750659A (en) | Dynamic display method, device and storage medium for media resources | |
| CN117690147B (en) | Text recognition method and electronic device | |
| CN117978768B (en) | Method, device and system for processing instant messaging messages of order receiving equipment | |
| CN105975566A (en) | Image-based information search method and device | |
| KR20170002921A (en) | Apparatus and method for creating digital building instruction | |
| JP2005135210A (en) | Mobile device with character recognition function | |
| JP6481204B2 (en) | Information processing apparatus, processing method thereof, and program | |
| CN112764601B (en) | Information display method and device and electronic equipment | |
| CN117830666A (en) | Image matching method, device, equipment and medium | |
| HK40091467A (en) | Method, apparatus, terminal, and storage medium for creating table |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121207 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130108 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130311 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130716 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130722 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5325870 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |