JPS6327752B2 - - Google Patents
Info
- Publication number
- JPS6327752B2 JPS6327752B2 JP55187050A JP18705080A JPS6327752B2 JP S6327752 B2 JPS6327752 B2 JP S6327752B2 JP 55187050 A JP55187050 A JP 55187050A JP 18705080 A JP18705080 A JP 18705080A JP S6327752 B2 JPS6327752 B2 JP S6327752B2
- Authority
- JP
- Japan
- Prior art keywords
- mask
- character
- area
- information
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Description
【発明の詳細な説明】
本発明は文字図形分離方式に関し、特に文字と
図形が混在して記載されている画像情報からでも
その文字情報のみを分離して認識できるようにし
た文字図形分離方式に関する。DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a character/figure separation method, and more particularly to a character/figure separation method that allows only character information to be separated and recognized even from image information containing a mixture of characters and figures. .
例えばプリント回路の設計図面や論理回路等通
常の図面では、通常は文字と図形が混在して画か
れているのが普通である。したがつてこのような
図面を認識する場合、図形と文字の混在がその自
動認識処理を困難にしている。これは図形に用い
る処理方式と文字に用いる処理方式が全く異質の
ものであることによる。したがつて図面を認識し
て、例えば手書き図面をデータ処理装置により製
図するような場合、図形ならば直線とか、矩形と
か正方形とかあるいは円とか、ある程度のパター
ンが決つており、それにもとづき製図することが
できるが、文字の場合の識別は図形の識別と全く
異質なために、図面を認識する場合、先ず文字と
図形を分離する必要が生ずる。 For example, in ordinary drawings such as design drawings of printed circuits and logic circuits, characters and figures are usually drawn in a mixture. Therefore, when recognizing such drawings, the mixture of figures and characters makes automatic recognition difficult. This is because the processing method used for graphics and the processing method used for characters are completely different. Therefore, when recognizing a drawing and, for example, drawing a handwritten drawing using a data processing device, there is a certain certain pattern of shapes, such as straight lines, rectangles, squares, or circles, and it is necessary to draw the drawing based on that pattern. However, since the identification of characters is completely different from the identification of graphics, when recognizing a drawing, it is first necessary to separate the characters and graphics.
本発明はこのような必要性に応じた文字と図形
とを分離することを可能にした文字図形分離方式
の提供を目的とするものであり、このために本発
明の文字図形分離方式では、文字と図形が混在さ
れた画像情報から文字と図形を分離する文字図形
分離方式において、前記画像情報を入力する入力
手段と、該入力手段から入力された入力情報を保
持する情報保持手段と、該情報保持手段に保持さ
れた情報を四辺形のマスクを用いて特徴抽出を行
なう特徴抽出手段を有し、該情報保持手段に保持
された該入力情報を、該マスクを走査して、該マ
スクの左辺に前記文字を構成する部分が存在せ
ず、且つ右辺に該部分が存在すれば文字情報エリ
アの開始位置と判断し、次に該マスクを走査して
該マスクの上辺及び下辺に該部分が存在せず、且
つ該右辺に該部分が存在すれば該文字情報エリア
内であると判断し、更に該マスクを走査して該マ
スクの左辺の該部分が存在し、且つ右辺に該部分
が存在しなければ該文字領域の端であると判断し
て該文字情報エリアを識別することにより、文字
と図形を分離することを特徴とする。 The object of the present invention is to provide a character/figure separation method that makes it possible to separate characters and figures in accordance with such needs. In a character/figure separation method for separating characters and figures from image information containing a mixture of images and figures, an input means for inputting the image information, an information holding means for holding input information input from the input means, and the information It has a feature extraction means for extracting features from the information held in the holding means using a quadrilateral mask, and scans the input information held in the information holding means through the mask to extract features from the left side of the mask. If the part constituting the character does not exist in , and the part exists on the right side, it is determined to be the start position of the character information area, and then the mask is scanned and the part exists on the top and bottom sides of the mask. If not, and the part exists on the right side, it is determined that it is within the character information area, and the mask is further scanned to find that the part on the left side of the mask exists, and the part exists on the right side. If not, the character information area is determined to be at the edge of the character area and the character information area is identified, thereby separating the characters and graphics.
以下本発明の一実施例を詳述するに先立ち、第
1図〜第3図にもとづき本発明の概略を説明す
る。 DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Before describing one embodiment of the present invention in detail, an outline of the present invention will be explained based on FIGS. 1 to 3.
まず、第1図に示すように横方向の幅がYl、
縦方向の高さがTlで各辺の幅が単位長の中空の
マスクMを使用する。そして第2図イに示すよう
にこのマスクMのうち領域Aがすべて「0」であ
つて領域Bのうちの一部にでも「1」があるか否
かをバツフアに記憶されている画像情報について
走査する。なおここで「1」とは画像情報が存在
することを示し、「0」はそれが存在しないこと
を示している。この第2図イに示すモード0の状
態で画像情報をx方向に走査する。そして第4図
に示す如く、文字領域の最初の部分に入るとき、
モード0が成立する。すなわち、第2図イにおけ
る領域Aがオール「0」、領域Bに少なくとも1
つの「1」が存在することになる。このモード0
が成立したとき、マスクは第2図ハに示すよう
に、領域EとFがそれぞれオール「0」か否かを
チエツクするモード3になり、領域EとFがすべ
て「0」であるこのモード3が成立したとき、マ
スクはその位置で、第4図に示す領域Gに「1」
が存在するか否かをチエツクするモード2にな
る。このようにして、モード3とモード2が成立
すれば文字領域が連続しているものと判断して、
この状態でx方向の走査が行なわれる。モード0
ではAの部分がすべて0でなければならないのに
対し、モード2ではモード0のAの部分を無視
(0でも1でも良い)し、Bに相当する部分だけ
を検証する。この理由は、モード0は文字列の始
まりをみつけるためのものであり、モード2は文
字列を構成する個別文字間のつながりをみつける
ためのものである。そしてモード3のチエツクの
ときに、例えば領域Eに「1」が存在すれば、そ
れは文字情報ではなく、線とかあるいはパターン
等の図形情報とみなし、再びモード0でx方向の
走査が行なわれる。そしてモード2のチエツクに
おいて「1」が存在しなければ、文字領域の終り
か否かを判断するため、第2図ロに示すロのモー
ド1、つまり領域Dがオール「0」で領域Cに
「1」が存在するか否かをチエツクする。そして
このモード1が成立すれば、第4図に示すように
これを文字の終りと判断する。 First, as shown in Figure 1, the horizontal width is Yl,
A hollow mask M with a vertical height of Tl and a width of each side of unit length is used. Then, as shown in FIG. 2A, the image information stored in the buffer indicates whether all the areas A in this mask M are ``0'' and there are even some ``1''s in area B. Scan about. Note that here, "1" indicates that image information exists, and "0" indicates that it does not exist. Image information is scanned in the x direction in the mode 0 state shown in FIG. 2A. As shown in Figure 4, when entering the first part of the character area,
Mode 0 is established. That is, in FIG. 2A, area A is all 0, and area B is at least 1.
There will be ``1''. This mode 0
When this is true, the mask enters mode 3, which checks whether areas E and F are all 0, as shown in Fig. 2C, and this mode in which areas E and F are all 0 is activated. 3 is established, the mask prints "1" in the area G shown in FIG. 4 at that position.
Mode 2 is entered to check whether or not exists. In this way, if mode 3 and mode 2 are established, it is determined that the character area is continuous, and
In this state, scanning in the x direction is performed. mode 0
In contrast, in mode 2, the A part in mode 0 is ignored (it can be 0 or 1), and only the part corresponding to B is verified. The reason for this is that mode 0 is for finding the beginning of a character string, and mode 2 is for finding connections between individual characters that make up the string. When checking in mode 3, for example, if "1" exists in area E, it is assumed that it is not character information but graphic information such as a line or pattern, and scanning in the x direction is performed again in mode 0. If "1" does not exist in the mode 2 check, in order to judge whether or not it is the end of the character area, mode 1 shown in FIG. Check whether "1" exists. If mode 1 is established, this is determined to be the end of the character, as shown in FIG.
ところでこの場合、文字の大きさが画面により
異なることが多いため、マスクMの大きさを固定
することはできない。それでこのマスクの大きさ
すなわちその幅Ylと高さTlを決定するため、第
5図に示す如き処理を最初に行なう。 By the way, in this case, the size of the mask M cannot be fixed because the size of the characters often differs depending on the screen. Therefore, in order to determine the size of this mask, that is, its width Yl and height Tl, the process shown in FIG. 5 is first performed.
(a) まず、第5図イに示すように全画面情報を走
査してその「1」,「0」を求める。そしてこの
全画面情報よりその画像情報の変化点すなわち
「0」→「1」および「1」→「0」に変化す
る点を求める。例えば第5図ロに示すように、
いまラインl上を走査するとき、x1では「0」
→「1」に変化し、x2では「1」→「0」に変
化し、x3では「0」→「1」に変化し、x4では
「1」→「0」に変化する。このように変化点
を求めたとき、その変化点間のインターバルの
和T-1
〓x=1
lと変化点の個数Tyをカウントする。そ
してその変化点間のインターバルの和を変化点
数Tyで除して変化点間の平均距離を求め
る。(a) First, as shown in FIG. 5A, the entire screen information is scanned to find its "1" and "0". Then, from this full-screen information, the changing points of the image information, that is, the points where the image information changes from "0" to "1" and from "1" to "0" are determined. For example, as shown in Figure 5B,
Now when scanning on line l, x 1 is "0"
→ changes to “1”, x 2 changes from “1” to “0”, x 3 changes from “0” to “1”, and x 4 changes from “1” to “0”. When the change points are determined in this way, the sum of the intervals between the change points T-1 〓 x=1 l and the number of change points Ty are counted. Then, the average distance between the change points is determined by dividing the sum of the intervals between the change points by the number of change points Ty.
(b) そして全画面を走査して、変化点間の距離が
上記平均距離より小さくなる変化点の座
標を、その近傍に文字を含む侯補点として記憶
する。これにより第5図ハに示す如き侯補点情
報が得られる。 (b) Then, the entire screen is scanned, and the coordinates of the change points where the distance between the change points is smaller than the above-mentioned average distance are stored as the interpolation points that include characters in the vicinity. As a result, the information on the marquee complement points as shown in FIG. 5C is obtained.
(c) 次に連続する侯補点のインターバルの最大値
をMLとする。例えば第8図イの原画において、
変化点の1例が同図ロの黒点(「0」→「1」)、
白点(「1」→「0」)として部分的に示され
る。そのインターバルは第8図ハのl1,l2……
lnとして示される。このうちこのインターバル
の平均距離以下のインターバルは、第8
図ニに示すl1,l2,l4……で示される。そして
インターバルの最大値MLは、第8図ホの如く
示される。(c) Let M L be the maximum value of the interval between the next consecutive interpolation points. For example, in the original picture in Figure 8A,
An example of a change point is the black dot in Figure B (“0” → “1”).
Partially shown as a white dot (“1” → “0”). The intervals are l 1 , l 2 . . . in Figure 8 C.
Denoted as ln. Among these, the interval less than the average distance of this interval is the 8th
They are indicated by l 1 , l 2 , l 4 ... shown in Figure D. The maximum value ML of the interval is shown as in FIG. 8(e).
(d) 同様の走査を縦方向にも行ない、連続する侯
補点の始点と終点のインターバルの平均を
Tlmとする。そしてこのTlmの5/4倍を上記マ
スクMの高さTlとし、またその5/8を該マスク
Mの幅Ylとする。(d) Perform a similar scan in the vertical direction, and calculate the average interval between the start and end points of consecutive interpolation points.
Tlm. Then, 5/4 times this Tlm is the height Tl of the mask M, and 5/8 is the width Yl of the mask M.
Tl=5/4Tlm
Yl=5/8Tlm
この数値は発明者等の実験により得られたもの
である。このようにして定められた大きさのマス
クMを使用して、上記の如き文字の識別を行なう
ものである。第8図の例では、Tlmは同図ヘに
示す如きものとなり、Tl,Ylは同図トに示す如
きものとなる。 Tl=5/4Tlm Yl=5/8Tlm These values were obtained through experiments by the inventors. The above-mentioned characters are identified using the mask M having the size thus determined. In the example of FIG. 8, Tlm is as shown in F of the figure, and Tl and Yl are as shown in G of the figure.
次に本発明の一実施例構成を第6図および第7
図にもとづき説明する。 Next, the configuration of one embodiment of the present invention is shown in FIGS. 6 and 7.
This will be explained based on the diagram.
第6図は本発明の一実施例構成を示し、第7図
は本発明の動作状態を説明するフローチヤートで
ある。 FIG. 6 shows the configuration of an embodiment of the present invention, and FIG. 7 is a flowchart for explaining the operating state of the present invention.
図中、1は入力部、2は画像メモリ、3はバツ
フア、4はパラメータ演算部、5はアドレス発生
部、6は領域ROM、7は制御部、8はアンド回
路、9は特徴抽出部、10はゲート、11はアド
レス・テーブル、12は画像クリア回路、13は
出力メモリである。 In the figure, 1 is an input section, 2 is an image memory, 3 is a buffer, 4 is a parameter calculation section, 5 is an address generation section, 6 is an area ROM, 7 is a control section, 8 is an AND circuit, 9 is a feature extraction section, 10 is a gate, 11 is an address table, 12 is an image clear circuit, and 13 is an output memory.
入力部1は図面を読取りこれを電気信号に変換
するものであつて、この入力部1から入力された
画像情報は画像メモリ2に保持される。バツフア
3は画像情報よりその変化点を求めたり、マスク
走査を行うための作業領域用のバツフア・メモリ
である。 The input section 1 reads a drawing and converts it into an electrical signal, and image information input from the input section 1 is held in an image memory 2. The buffer 3 is a buffer memory for use as a work area for determining points of change from image information and for performing mask scanning.
パラメータ演算部4は、画像情報から変化点を
検出し、これにより上記ML,Tl,Yl等のパラメ
ータ値を演算し、これらを保持するものである。 The parameter calculation unit 4 detects changing points from the image information, calculates parameter values such as M L , Tl, Yl, etc., and holds them.
アドレス発生部5は、バツフア3にデータをセ
ツトしたりあるいはこのセツトされたデータを読
出すためのアドレス信号を発生するものである。 The address generator 5 generates an address signal for setting data in the buffer 3 or reading the set data.
領域ROM6はマスクMの領域を定めるデータ
が出力されるものであり、そのマスクMを決定す
るためのパラメータは上記パラメータ演算部4か
ら伝達される。 The area ROM 6 is for outputting data that defines the area of the mask M, and parameters for determining the mask M are transmitted from the parameter calculation unit 4.
制御部7は、画面情報から文字を分離するまで
のデータ処理に必要な制御信号を発生するための
制御部である。 The control unit 7 is a control unit for generating control signals necessary for data processing up to separating characters from screen information.
特徴抽出部9は第4図に示すモードにもとづき
文字情報か否かを識別するものである。 The feature extractor 9 identifies whether or not the information is character information based on the mode shown in FIG.
アドレス・テーブル11は、文字の存在する始
端座標xsと文字の存在が終了する終端座標xEが
記入されるレジスタである。 The address table 11 is a register in which the start coordinate xs where a character exists and the end coordinate xE where the character ends are entered.
画像クリア回路12は、画像メモリ2にセツト
された画像情報のうち、文字領域のみをクリアす
るクリア回路である。 The image clear circuit 12 is a clear circuit that clears only the character area of the image information set in the image memory 2.
出力メモリ13は画像メモリ2にセツトされた
画像情報から文字領域がクリアされたものが出力
用に保持されるメモリである。 The output memory 13 is a memory in which the image information set in the image memory 2 with the character area cleared is held for output.
次に第6図の動作について説明する。 Next, the operation shown in FIG. 6 will be explained.
(1) まず図面が入力部1にセツトされると、入力
部1はその図面を電気信号に変換し、これを画
像メモリ2に送出する。そして画像メモリ2に
は図面の画像情報が保持される。それから制御
部7は画像メモリ2からバツフア3に対し順次
画像情報を読出すように制御を行なう。そして
このバツフア3にセツトされた画像情報を第5
図イに示すように走査し、これによりパラメー
タ演算部4は変化点を検出する。そしてこのよ
うにして検出した変化点にもとづき、パラメー
タ演算部4は上記(a)〜(d)に詳述した如き演算を
行なつてML,TlおよびYlを求め、これらの値
をその保持用バツフアで保持するとともに演算
結果を領域ROM6に伝達する。かくして領域
ROM6では、これらの値のうち、TlおよびYl
により所定の大きさのマスクを作成する。(1) First, when a drawing is set in the input section 1, the input section 1 converts the drawing into an electrical signal and sends it to the image memory 2. The image memory 2 holds image information of the drawing. Then, the control section 7 performs control to sequentially read image information from the image memory 2 to the buffer 3. Then, the image information set in this buffer 3 is transferred to the 5th buffer.
Scanning is performed as shown in FIG. Then, based on the change points detected in this way, the parameter calculation unit 4 performs the calculations detailed in (a) to (d) above to obtain ML, Tl, and Yl, and uses these values for storage. It is held in a buffer and the calculation result is transmitted to the area ROM6. thus the area
In ROM6, among these values, Tl and Yl
Create a mask of a predetermined size.
(2) このようにして得られたマスクを使用して画
像情報をアクセスするが、まず、アドレス発生
部5から画像情報の左上端の座標位置にマスク
Mを置きこのマスクMを順次x軸方向に走査
し、上記モード0(第7図のフローチヤートで
はモード0をC1と表示する)すなわちC1が成
立するか否かをチエツクする。もしC1が成立
しなければそのときのx座標が右端WDHにな
るまで順次この走査を続ける。そしてこのマス
クが右端まで走査してもC1が成立しなければ、
今度はマスクをy軸方向に1つ進め、同様の走
査を行なう。このような走査は、アドレス発生
部5から発生されるアドレスに応じ行なわれ、
マスク領域は領域ROM6から送出される、マ
スクMの領域のみ「1」になる信号をアンド回
路8に送出することにより、マスク制御が行な
われ、各モードが成立するか否かの識別は特徴
抽出部9で行なわれるものである。(2) The image information is accessed using the mask obtained in this way. First, the mask M is placed at the coordinate position of the upper left corner of the image information from the address generation unit 5, and this mask M is sequentially moved in the x-axis direction. It is checked whether or not the above-mentioned mode 0 (mode 0 is indicated as C 1 in the flowchart of FIG. 7), that is, C 1 is established. If C 1 does not hold, this scanning is continued in sequence until the x-coordinate at that time reaches the right end WDH. And even if this mask is scanned to the right end, if C 1 does not hold, then
This time, the mask is advanced one step in the y-axis direction and a similar scan is performed. Such scanning is performed according to the address generated from the address generation section 5,
For the mask area, mask control is performed by sending a signal that is sent from the area ROM 6 and becomes "1" only in the area of the mask M to the AND circuit 8, and whether or not each mode is established is determined by feature extraction. This will be done in Section 9.
(3) そしてある位置で上記C1が成立すれば、第
4図に示すように、そのときのマスクの左上隅
の位置を文字領域始点xsと定め、これを特徴
抽出部9のレジスタに保持する。そしてx軸方
向の座標を1つ進めてモード3(C3)が成立す
るか否かを特徴抽出部9で判別する。勿論この
とき第4図に示す領域Gに「1」が存在するこ
とをチエツクするモード2のチエツクも行な
う。しかしながら、上記モード3が不成立の場
合には、その領域は文字領域でないものと判断
し、先に特徴抽出部9内で保持した文字領域始
点xsを消滅させる。そして再びC1が成立する
か否かをチエツクする。(3) If the above C 1 is established at a certain position, the upper left corner position of the mask at that time is determined as the character area starting point xs, and this is stored in the register of the feature extraction unit 9. do. Then, the feature extraction unit 9 determines whether mode 3 (C 3 ) is established by advancing the coordinate in the x-axis direction by one. Of course, at this time, a mode 2 check is also performed to check that "1" exists in area G shown in FIG. However, if mode 3 is not established, it is determined that the area is not a character area, and the character area starting point xs previously held in the feature extraction unit 9 is deleted. Then, check whether C1 holds true again.
(4) もしも上記(3)においてC3が成立し、更に次
いでモード2のチエツクが成立すれば、その時
点ではモード3(C3)のチエツクが不成立とい
うことになる。すなわち第2図ロに示す領域D
がオール「0」ではなく、「1」が存在したこ
とを示す。そしてこのときのx座標から上記
xsを引いたx−xsが上記MLよりも小さけれ
ば、x座標が+1されてマスクが進行し、C3
が成立するか否かがチエツクされる。そしてマ
スクの進行にともない、C3は成立したものの、
次いでモード2のチエツクのとき領域Gに
「1」が存在しなかつたときには、これはすな
わちC2が成立したことになる。そして第4図
に示すように、このときの座標xの値を文字領
域終点xEと定めこれをアドレス・テーブル1
1に記入する。このようにして文字領域始点
xsと文字領域終点xEが揃つて得られたとき、
ゲート10を開き、これらの文字領域始点xs
と文字領域終点xEがアドレス・テーブル11
に送出される。そしてこれにより画像クリア回
路12が動作し、画像メモリ2に保持された画
像情報より上記文字領域始点xsと文字領域終
点xEの間でかつマスクMの高さYl(或いはマス
クMの内側の高さYl′)の領域をクリアする。(4) If C 3 is established in the above (3) and then the check of mode 2 is established, then the check of mode 3 (C 3 ) is not established at that point. In other words, area D shown in Figure 2B
indicates that there were not all 0's but 1's. And from the x coordinate at this time, the above
If x−xs, which is obtained by subtracting xs, is smaller than the above ML, the x coordinate is incremented by 1, the mask progresses, and C 3
It is checked whether or not it holds true. As the mask progressed, C3 was established, but
Next, when checking in mode 2, if "1" does not exist in region G, this means that C2 is established. Then, as shown in Figure 4, the value of the coordinate x at this time is determined as the character area end point xE, and this is set as
Fill in 1. In this way, the starting point of the character area
When xs and character area end point xE are obtained,
Open gate 10 and set these character area starting points xs
and character area end point xE is address table 11
sent to. As a result, the image clearing circuit 12 operates, and from the image information held in the image memory 2, the height Yl of the mask M (or the height inside the mask M) is determined between the character area start point xs and the character area end point xE. Clear the area of Yl′).
(5) このような動作を全画像情報について行な
い、その文字領域がすべてクリアされたのち
に、画像メモリ2に保持されたデータが出力メ
モリ13に伝達される。勿論このとき出力メモ
リ13に伝達された画像情報は文字情報がクリ
アされている。このようにして出力メモリ13
から文字の分離された画像情報を得ることがで
きる。(5) After this operation is performed on all the image information and all the character areas are cleared, the data held in the image memory 2 is transmitted to the output memory 13. Of course, the character information of the image information transmitted to the output memory 13 at this time has been cleared. In this way, the output memory 13
Image information with separated characters can be obtained from .
以上説明の如く本発明によれば、マスクを使用
して文字領域のみ分離することができるので、画
像情報から文字情報を区別することが可能になり
図形情報のみを取出すことが非常に容易になる。 As explained above, according to the present invention, only the character area can be separated using a mask, so it becomes possible to distinguish character information from image information, and it becomes very easy to extract only graphic information. .
なお上記説明では文字領域を画像クリア回路で
クリアした例について説明したが、勿論文字領域
始点および文字領域終点間を上記のようにクリア
する代りにこの領域のみを取出すこともできる。
そして取出した情報によりこの文字領域に記載さ
れた文字を識別するような操作を行なうこともで
きる。 In the above explanation, an example has been explained in which the character area is cleared by the image clearing circuit, but of course, instead of clearing the area between the character area start point and the character area end point as described above, it is also possible to extract only this area.
It is also possible to perform operations such as identifying the characters written in this character area using the retrieved information.
第1図は本発明において使用するマスク、第2
図は該マスクを使用した識別モードの説明図、第
3図はマスクの走査状態説明図、第4図は文字の
存在と識別モードおよび文字領域始点および文字
領域終点の説明図、第5図はマスクの大きさの決
定等に必要なパラメータの作成の説明図、第6図
は本発明の一実施例構成図、第7図はその動作状
態を説明するフローチヤート、第8図は本発明の
動作説明図である。
図中、1は入力部、2は画像メモリ、3はバツ
フア、4はパラメータ演算部、5はアドレス発生
部、6は領域ROM、7は制御部、8はアンド回
路、9は特徴抽出部、10はゲート、11はアド
レス・テーブル、12は画像クリア回路、13は
出力メモリをそれぞれ示す。
Figure 1 shows the mask used in the present invention, and Figure 2 shows the mask used in the present invention.
The figure is an explanatory diagram of the identification mode using the mask, Fig. 3 is an explanatory diagram of the scanning state of the mask, Fig. 4 is an explanatory diagram of the presence of characters, the identification mode, the character area start point and the character area end point, and Fig. 5 is an explanatory diagram of the character area start point and character area end point. An explanatory diagram of the creation of parameters necessary for determining the size of a mask, etc., Fig. 6 is a configuration diagram of an embodiment of the present invention, Fig. 7 is a flowchart explaining its operating state, and Fig. 8 is an illustration of the method of the present invention. It is an operation explanatory diagram. In the figure, 1 is an input section, 2 is an image memory, 3 is a buffer, 4 is a parameter calculation section, 5 is an address generation section, 6 is an area ROM, 7 is a control section, 8 is an AND circuit, 9 is a feature extraction section, 10 is a gate, 11 is an address table, 12 is an image clear circuit, and 13 is an output memory.
Claims (1)
図形を分離する文字図形分離方式において、 前記画像情報を入力する入力手段と、 該入力手段から入力された入力情報を保持する
情報保持手段と、 該情報保持手段に保持された情報を四辺形のマ
スクを用いて特徴抽出を行なう特徴抽出手段を有
し、 該情報保持手段に保持された該入力情報を、該
マスクを走査して、該マスクの左辺に前記文字を
構成する部分が存在せず、且つ右辺に該部分が存
在すれば文字情報エリアの開始位置と判断し、次
に該マスクを走査して該マスクの上辺及び下辺に
該部分が存在せず、且つ該右辺に該部分が存在す
れば該文字情報エリア内であると判断し、更に該
マスクを走査して該マスクの左辺の該部分が存在
し、且つ右辺に該部分が存在しなければ該文字領
域の端であると判断して該文字情報エリアを識別
することにより、文字と図形を分離することを特
徴とする文字図形分離方式。[Scope of Claims] 1. A character/figure separation method for separating characters and figures from image information containing a mixture of characters and figures, comprising: an input means for inputting the image information; and holding input information input from the input means. and a feature extracting means for extracting features from the information held in the information holding means using a quadrilateral mask. When scanning, if the part constituting the character does not exist on the left side of the mask and the part exists on the right side, it is determined that the character information area is the starting position, and then the mask is scanned to find the part of the mask. If the portion does not exist on the upper and lower sides and the portion exists on the right side, it is determined that the character information area is within the character information area, and further scans the mask to find that the portion on the left side of the mask exists; If the part does not exist on the right side, it is determined that it is the end of the character area, and the character information area is identified, thereby separating characters and graphics.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP55187050A JPS57111677A (en) | 1980-12-27 | 1980-12-27 | Character pattern separation system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP55187050A JPS57111677A (en) | 1980-12-27 | 1980-12-27 | Character pattern separation system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS57111677A JPS57111677A (en) | 1982-07-12 |
| JPS6327752B2 true JPS6327752B2 (en) | 1988-06-06 |
Family
ID=16199291
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP55187050A Granted JPS57111677A (en) | 1980-12-27 | 1980-12-27 | Character pattern separation system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS57111677A (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0731713B2 (en) * | 1983-09-07 | 1995-04-10 | 株式会社東芝 | Keyword detection method |
| JPS63291185A (en) * | 1987-05-25 | 1988-11-29 | Hitachi Seiko Ltd | String extraction method |
| JPH0786906B2 (en) * | 1987-05-25 | 1995-09-20 | 日立精工株式会社 | Character string extraction method |
-
1980
- 1980-12-27 JP JP55187050A patent/JPS57111677A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS57111677A (en) | 1982-07-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5075895A (en) | Method and apparatus for recognizing table area formed in binary image of document | |
| JP2940936B2 (en) | Tablespace identification method | |
| US6947596B2 (en) | Character recognition method, program and recording medium | |
| JPH0721310A (en) | Document recognition device | |
| JPS6327752B2 (en) | ||
| JP3276555B2 (en) | Format recognition device and character reader | |
| JP2846486B2 (en) | Image input device | |
| JPH09128478A (en) | Image processing device | |
| JP3406942B2 (en) | Image processing apparatus and method | |
| JP2755299B2 (en) | Image processing method | |
| JP3052438B2 (en) | Table recognition device | |
| JPH0697470B2 (en) | Character string extractor | |
| JP2762476B2 (en) | Copy-writing device | |
| JP3276554B2 (en) | Format recognition device and character reader | |
| JP2893781B2 (en) | Character recognition device | |
| JPH0728934A (en) | Document image processor | |
| JP2931041B2 (en) | Character recognition method in table | |
| JP3031565B2 (en) | Table space judgment method | |
| JPH0644406A (en) | Method and device for processing image | |
| JP2872757B2 (en) | Line direction determination device | |
| JPH09114925A (en) | Optical character reader | |
| JPH11242716A (en) | Image processing method and recording medium | |
| JPH04156694A (en) | Character recognition system | |
| JP2721415B2 (en) | Character image extraction method | |
| JPH05274472A (en) | Image recognizing device |