JPH0580707B2 - - Google Patents
Info
- Publication number
- JPH0580707B2 JPH0580707B2 JP60009566A JP956685A JPH0580707B2 JP H0580707 B2 JPH0580707 B2 JP H0580707B2 JP 60009566 A JP60009566 A JP 60009566A JP 956685 A JP956685 A JP 956685A JP H0580707 B2 JPH0580707 B2 JP H0580707B2
- Authority
- JP
- Japan
- Prior art keywords
- stroke
- code
- character
- master
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
〔技術分野〕
本発明は、文字認識用の文字辞書を作成する方
式に関する。DETAILED DESCRIPTION OF THE INVENTION [Technical Field] The present invention relates to a method for creating a character dictionary for character recognition.
発明者は、文字認識用の文字辞書を作成する方
式の1つとして、文字辞書に登録すべき文字(マ
スター文字」のストロークを抽出してデイスプレ
イ装置の画面に表示させ、オペレータがそのスト
ロークを観察し、そのストロークに相当するスト
ロークコードを入力し、そのストロークコードを
マスター文字のストロークの位置およびサイズの
情報とゝもに文字辞書に登録する方式を研究して
きた。この方式は、相当に効率よく文字辞書を作
成できることが確認されたが、その一方で、オペ
レータの判断の誤りにより不適切なストロークコ
ードが登録される場合があり、その誤りを修正す
るための作業に相当の時間を要するという問題が
あることが判明した。
As one method for creating a character dictionary for character recognition, the inventor extracted the strokes of characters to be registered in the character dictionary (master characters) and displayed them on the screen of a display device, and an operator observed the strokes. We have been researching a method in which a stroke code corresponding to that stroke is input, and that stroke code is registered in a character dictionary together with information on the stroke position and size of the master character.This method is quite efficient. It has been confirmed that it is possible to create a character dictionary, but on the other hand, there are cases where inappropriate stroke codes are registered due to errors in operator judgment, and the problem is that it takes a considerable amount of time to correct the errors. It turned out that there is.
本発明は、上記のような問題点を解消した効率
的な文字辞書作成方式を提供することにある。
An object of the present invention is to provide an efficient character dictionary creation method that solves the above-mentioned problems.
本発明による文字辞書作成方式は、マスター文
字パターンからストロークと、その位置およびサ
イズを抽出する手段と、抽出されたストロークを
表示する手段と、標準化されたストロークを合成
するためのストローク情報を記憶する手段と、オ
ペレータがストロークコードを入力する手段と、
オペレータから入力されたストロークコードに対
応するストロークおよびそれと同一分類に属する
ストロークのパターンをストローク情報およびマ
スター文字から抽出されたストロークのサイズお
よび位置の情報に基づき合成する手段と、合成さ
れたストロークパターンとマスター文字から抽出
されたストロークのパターンとのマツチングを行
い、最も一致度の高い合成ストロークのストロー
クコードを文字辞書に登録する手段とからなるこ
とを特徴とするものである。
The character dictionary creation method according to the present invention includes means for extracting strokes, their positions and sizes from a master character pattern, means for displaying the extracted strokes, and storing stroke information for synthesizing standardized strokes. means for an operator to enter a stroke code;
Means for synthesizing a stroke corresponding to a stroke code input by an operator and a pattern of strokes belonging to the same classification based on stroke information and information on stroke size and position extracted from a master character; The present invention is characterized by comprising means for performing matching with a stroke pattern extracted from a master character and registering a stroke code of a synthetic stroke with the highest degree of matching in a character dictionary.
以下、図面を参照し、本発明の一実施例につい
て説明する。 Hereinafter, one embodiment of the present invention will be described with reference to the drawings.
第1図は本発明の一実施例を示すブロツク図で
ある。この図において、10はマスター文字のパ
ターンを記憶している記憶装置、12はマスター
文字パターンからストロークと、その位置および
サイズを抽出するストローク抽出装置、14はス
トロークテーブルを格納している記憶装置、16
はストロークを合成するためのストローク情報を
記憶している記憶装置、18はストローク情報お
よびストローク抽出部12で抽出されたストロー
ク(マスターストローク)の位置およびサイズに
基づき、ストロークパターンを合成するストロー
ク合成装置、20はオペレータがストロークコー
ドを入力するための入力装置、22は文字辞書を
記憶するための記憶装置、24はデイスプレイ装
置、26は前記各部の制御およびマツチングなど
の処理を行う演算制御装置である。各部はシステ
ムバス28を介して接続されている。
FIG. 1 is a block diagram showing one embodiment of the present invention. In this figure, 10 is a storage device that stores a master character pattern, 12 is a stroke extraction device that extracts strokes, their positions and sizes from the master character pattern, and 14 is a storage device that stores a stroke table. 16
18 is a storage device that stores stroke information for composing strokes, and 18 is a stroke synthesis device that synthesizes stroke patterns based on the stroke information and the position and size of the stroke (master stroke) extracted by the stroke extraction unit 12. , 20 is an input device for an operator to input a stroke code, 22 is a storage device for storing a character dictionary, 24 is a display device, and 26 is an arithmetic and control device that performs processing such as controlling and matching each of the above parts. . Each part is connected via a system bus 28.
この実施例においては、ストロークとして第3
図に示す42種類を考えている。この図の各ストロ
ーク(心線として示されている)の上の数字(16
進表現)は、そのストロークコードである。ま
た、この実施例においては、42種類のストローク
を、曲がり方向および太線化情報(後述)に基づ
き13の分類に分けている。そのように分類したス
トロークテーブルを第4図に示す。このストロー
クテーブルは、記憶装置14に格納されている。 In this example, the third stroke is
We are considering 42 types shown in the figure. The number (16) above each stroke (shown as a core wire) in this diagram
decimal representation) is its stroke code. Further, in this embodiment, 42 types of strokes are divided into 13 categories based on the bending direction and thick line information (described later). A stroke table classified in this manner is shown in FIG. This stroke table is stored in the storage device 14.
記憶装置16に格納されているストローク情報
を、第6図に概念図に示す。各ストローク情報
は、ストロークコード、ストロークの長さを示す
プロポーシヨン、ストロークに肉付けするための
太線化情報、ストロークをビツトパターンに展開
するためのチエーンコードからなる。 Stroke information stored in the storage device 16 is conceptually shown in FIG. Each stroke information consists of a stroke code, a proportion indicating the length of the stroke, thickening information for fleshing out the stroke, and a chain code for developing the stroke into a bit pattern.
このチエーンコードは、ストロークをビツト展
開する際に、心線上のあるドツトから次のドツト
へ移行するための方向を、第7図に示す方向ベク
トルのコード0〜7と、ストツプコード0の系列
として表現したものである。 This chain code expresses the direction of transition from one dot to the next on a core line as a series of direction vector codes 0 to 7 and stop code 0, as shown in Figure 7, when a stroke is developed into bits. This is what I did.
太線化情報は、第8図に概念図に示すように、
特徴コード、節点座標、太さデータ(L、R)か
らなる。特徴コードは、ストロークの肉付けする
部分を規定するコードである。第9図に例示する
ように(この図は、「大」の左下にはらう部分な
どのストロークを示している)、節点座標はスト
ロークの太さを変化する点のX方向座標を示す。
太さデータは、ストロークの心線にY方向に左右
に肉付けする幅を示している。 The thick line information is as shown in the conceptual diagram in Figure 8.
It consists of a feature code, node coordinates, and thickness data (L, R). The feature code is a code that defines the part of the stroke to be fleshed out. As exemplified in FIG. 9 (this figure shows a stroke such as the part that falls on the lower left of "Large"), the node coordinates indicate the X-direction coordinates of the point at which the thickness of the stroke changes.
The thickness data indicates the width to be added to the center line of the stroke from left to right in the Y direction.
第2図は、本実施例における文字辞書作成処理
のフローチヤートである。この図を参照して、各
処理段階を順に説明する。 FIG. 2 is a flowchart of the character dictionary creation process in this embodiment. Each processing stage will be explained in turn with reference to this figure.
演算制御装置26によつて、文字辞書に登録す
べき文字のマスター文字パターンが、記憶装置1
0より読み出されてストローク抽出装置12に入
力される(ステツプ30)。 The master character pattern of the characters to be registered in the character dictionary is stored in the storage device 1 by the arithmetic and control unit 26.
0 and input to the stroke extraction device 12 (step 30).
ストローク抽出装置12では、マスター文字パ
ターンの心線を抽出し(ステツプ32)、ついでス
トロークを抽出する(ステツプ34)。抽出された
マスターストロークのパターンと、その位置およ
びサイズのデータは、演算制御装置26内のメモ
リに格納され、また演算制御装置26の制御によ
り、デイスプレイ装置24に転送され表示される
(ステツプ36)。 The stroke extraction device 12 extracts the core lines of the master character pattern (step 32), and then extracts the strokes (step 34). The extracted master stroke pattern and its position and size data are stored in the memory within the arithmetic and control unit 26, and are transferred to and displayed on the display device 24 under the control of the arithmetic and control unit 26 (step 36). .
オペレータは、デイスプレイ装置24に表示さ
れたマスターストロークのパターンを観察し、そ
のマスターストロークに該当すると思われるスト
ロークコードを入力装置20から入力する(ステ
ツプ38)。 The operator observes the master stroke pattern displayed on the display device 24 and inputs a stroke code that seems to correspond to the master stroke from the input device 20 (step 38).
演算制御装置26は、オペレータから入力され
たストロークコードを用いてストロークテーブル
14を検索し、そのストロークコードと同じ分類
に属するすべてのストロークコード(候補ストロ
ークコード)を見付ける(ステツプ40)。例えば、
ストロークコード0120が入力された場合、候補ス
トロークコードとして0120、0390が得られる。 The arithmetic and control unit 26 searches the stroke table 14 using the stroke code input by the operator, and finds all stroke codes (candidate stroke codes) belonging to the same classification as the stroke code (step 40). for example,
When stroke code 0120 is input, 0120 and 0390 are obtained as candidate stroke codes.
次に演算制御装置26は、各候補ストロークコ
ードと、マスターストローク(表示中)の位置と
サイズのデータとをストローク合成装置に与え、
同装置を起動する。ストローク合成装置18は、
各候補ストロークコードに対応するストローク情
報を記憶装置16から読み出し、そのストローク
情報にしたがつてストロークを合成するが、その
際、マスターストロークの位置およびサイズに応
じて、合成ストロークを変倍する(ステツプ41)。
得られた合成ストロークは、演算制御装置26に
送られ、その内部のメモリに一時的に記憶され
る。 Next, the arithmetic and control device 26 provides each candidate stroke code and data on the position and size of the master stroke (currently displayed) to the stroke synthesis device,
Start the device. The stroke synthesizer 18 is
Stroke information corresponding to each candidate stroke code is read from the storage device 16 and strokes are synthesized according to the stroke information. At this time, the synthesized stroke is scaled (step 41).
The resulting composite stroke is sent to the arithmetic and control unit 26 and temporarily stored in its internal memory.
演算制御装置26は、各候補ストロークコード
の合成ストローク・パターンと、マスターストロ
ーク・パターン(心線化前)とのマツチングを行
い、マツチング率
M=(A+C)/(B+C)
を計算する(ステツプ42)。こゝで、A〜Cは第
5図に示す同一符号の領域の画素数である。この
図において、実線50はマスターストローク・パ
ターンであり、破線52は合成ストローク・パタ
ーンである。つまり、ストローク間の不一致画素
数と一致画素数との比をマツチング率として計算
する。 The arithmetic and control unit 26 matches the composite stroke pattern of each candidate stroke code with the master stroke pattern (before core formation), and calculates the matching rate M=(A+C)/(B+C) (step 42). ). Here, A to C are the numbers of pixels in the areas with the same symbols shown in FIG. In this figure, solid line 50 is the master stroke pattern and dashed line 52 is the composite stroke pattern. That is, the ratio between the number of mismatched pixels and the number of matching pixels between strokes is calculated as the matching rate.
次に演算制御装置26は、合成ストロークの中
でマスターストロークとの一致率が最高(マツチ
ング率が最小)の合成ストロークを選出し、その
一致率が規定値以上であるか判定する(ステツプ
44)。一致率が規定値以上ならば、演算制御装置
26は、その合成ストロークのストロークコード
を、マスターストロークの位置およびサイズの情
報とゝもに、文字辞書22のマスター文字のエン
トリに登録し(ステツプ46)、次のストロークの
処理へ進む。 Next, the arithmetic and control unit 26 selects the composite stroke with the highest matching rate (minimum matching rate) with the master stroke from among the composite strokes, and determines whether the matching rate is greater than or equal to a specified value (step 1).
44). If the matching rate is greater than or equal to the specified value, the arithmetic and control unit 26 registers the stroke code of the composite stroke in the master character entry of the character dictionary 22 along with the master stroke position and size information (step 46). ), proceed to process the next stroke.
最高の一致率が規定値未満の場合、演算制御装
置26は、候補ストロークコードをキヤンセル
し、現在表示中のマスターストロークに対する別
のストロークコードの入力を促すメツセードをデ
イスプレイ装置24に表示させ(ステツプ48)、
オペレータからの入力を待つ。 If the highest matching rate is less than the specified value, the arithmetic and control unit 26 cancels the candidate stroke code and causes the display unit 24 to display a message prompting the input of another stroke code for the currently displayed master stroke (step 48). ),
Waits for input from the operator.
以上の処理により、マスター文字の各ストロー
クに対するストロークコードと、ストロークの位
置およびサイズの情報を文字辞書に登録すること
により、そのマスター文字用の文字辞書を作成す
る。同様の処理を必要なマスター文字のすべてに
ついて行い、文字認識用の文字辞書を作成する。 Through the above processing, the stroke code for each stroke of the master character and information on the position and size of the stroke are registered in the character dictionary, thereby creating a character dictionary for the master character. A similar process is performed for all necessary master characters to create a character dictionary for character recognition.
なお、前記のストローク抽出、ストローク合成
やその変倍の処理については、既に知られている
ので、その詳細は説明しない。 Note that the stroke extraction, stroke synthesis, and magnification processing described above are already known, so the details thereof will not be explained.
以上説明したように、本発明によれば、オペレ
ータから入力されたストロークコードに対応する
合成ストロークだけでなく、そのストロークコー
ドと同一分類に属する他のストロークコードの合
成ストロークについても、マスターストロークと
のマツチングを行い、一致率が最高の合成ストロ
ークを選び、そのストロークコードを文字辞書に
登録するから、オペレータの判断ミスによる不適
当なストロークコードが文字辞書に登録されるこ
とがなくなり、文字辞書作成を大幅に効率化でき
る。
As explained above, according to the present invention, not only the composite stroke corresponding to the stroke code input by the operator, but also the composite stroke of other stroke codes belonging to the same classification as that stroke code, can be combined with the master stroke. Matching is performed, the composite stroke with the highest matching rate is selected, and that stroke code is registered in the character dictionary. This eliminates the possibility of inappropriate stroke codes being registered in the character dictionary due to an operator's judgment error, making it easier to create a character dictionary. It can greatly improve efficiency.
第1図は本発明の一実施例を示すブロツク図、
第2図は同実施例の処理の流れを示すフローチヤ
ート、第3図はストロークとそのコードを対称さ
れて示す図、第4図はストロークテーブルの説明
図、第5図はマスターストロークと合成ストロー
クとのマツチングの説明図、第6図はストローク
情報の概念図、第7図はチエーンコードに用いら
れる方向ベクトルのコードを示す図、第8図は太
線化情報の概念図、第9図は太線化情報の説明図
である。
10……マスター文字パターン用記憶装置、1
2……ストローク抽出装置、14……ストローク
テーブル用記憶装置、16……ストローク情報用
記憶装置、18……ストローク合成装置、20…
…入力装置、22……文字辞書用記憶装置、24
……デイスプレイ装置、26……演算制御装置。
FIG. 1 is a block diagram showing one embodiment of the present invention;
Figure 2 is a flowchart showing the processing flow of the same embodiment, Figure 3 is a diagram showing strokes and their codes symmetrically, Figure 4 is an explanatory diagram of a stroke table, and Figure 5 is a master stroke and composite stroke. Fig. 6 is a conceptual diagram of stroke information, Fig. 7 is a diagram showing the direction vector code used in the chain code, Fig. 8 is a conceptual diagram of thick line information, and Fig. 9 is a conceptual diagram of thick line information. FIG. 3 is an explanatory diagram of conversion information. 10... Master character pattern storage device, 1
2... Stroke extraction device, 14... Stroke table storage device, 16... Stroke information storage device, 18... Stroke synthesis device, 20...
...Input device, 22...Character dictionary storage device, 24
...Display device, 26... Arithmetic control device.
Claims (1)
の位置およびサイズを抽出する手段と、抽出され
たストロークのパターンを表示する手段と、標準
化されたストロークのパターンを合成するための
ストローク情報を記憶する手段と、オペレータが
ストロークコードを入力する手段と、オペレータ
から入力されたストロークコードに対応するスト
ロークおよびそれが同一分類に属するストローク
のパターンを、ストローク情報およびマスター文
字から抽出されたストロークのサイズおよび位置
の情報に基づき合成する手段と、合成されたスト
ロークパターンとマスター文字から抽出されたス
トロークのパターンとのマツチングを行い、最も
一致度の高い合成ストロークのストロークコード
を文字辞書に登録する手段とからなることを特徴
とする文字辞書作成方式。1. A means for extracting strokes, their positions and sizes from a master character pattern, a means for displaying the extracted stroke pattern, a means for storing stroke information for synthesizing a standardized stroke pattern, and an operator. A means for inputting a stroke code, and a method for determining strokes corresponding to the stroke code input by the operator and patterns of strokes belonging to the same classification based on stroke information and stroke size and position information extracted from the master character. The present invention is characterized by comprising means for synthesizing, and means for matching the synthesized stroke pattern with a stroke pattern extracted from a master character, and registering the stroke code of the synthesized stroke with the highest degree of matching in a character dictionary. A character dictionary creation method.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60009566A JPS61168081A (en) | 1985-01-22 | 1985-01-22 | System for implementing character dictionary |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60009566A JPS61168081A (en) | 1985-01-22 | 1985-01-22 | System for implementing character dictionary |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS61168081A JPS61168081A (en) | 1986-07-29 |
| JPH0580707B2 true JPH0580707B2 (en) | 1993-11-10 |
Family
ID=11723842
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60009566A Granted JPS61168081A (en) | 1985-01-22 | 1985-01-22 | System for implementing character dictionary |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS61168081A (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2696134B2 (en) * | 1987-10-09 | 1998-01-14 | 株式会社鷹山 | How to register character data |
| US5121441A (en) * | 1990-09-21 | 1992-06-09 | International Business Machines Corporation | Robust prototype establishment in an on-line handwriting recognition system |
-
1985
- 1985-01-22 JP JP60009566A patent/JPS61168081A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS61168081A (en) | 1986-07-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0139265B2 (en) | ||
| JPH0580707B2 (en) | ||
| JPH0944135A (en) | Character pattern generator | |
| US5355448A (en) | Method of generating dot signals corresponding to character pattern and the system therefor | |
| JP2007293829A (en) | Image processing method and image processing apparatus | |
| JPH05257666A (en) | Flowchart automatic generation method | |
| JP3249654B2 (en) | Creating a dictionary for character recognition | |
| JP2801246B2 (en) | Character processing apparatus and method | |
| JPH01257995A (en) | Character pattern generating device | |
| JPH07117967B2 (en) | Drawing processing system | |
| JPH0247787B2 (en) | ||
| JPH09127929A (en) | Multi-font device and multi-font combining method | |
| JPS61252583A (en) | Character generation method | |
| JP2838556B2 (en) | Image processing device | |
| JP2567590B2 (en) | Character generator | |
| JPH0658689B2 (en) | Line figure separation device | |
| JPH1040401A (en) | Format analysis method for creating family register data | |
| JPS63103291A (en) | Character synthesization | |
| JPH09282335A (en) | CAD drawing conversion method | |
| JPH0461396B2 (en) | ||
| JPS6172376A (en) | Recognizing order deciding system | |
| JPH09167208A (en) | On-line character recognizing device | |
| JPS63104089A (en) | How to create a character dictionary | |
| JPH04278684A (en) | Contour extracting system | |
| JPH08272906A (en) | Character recognition device |