Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0634259B2 - Character recognition device - Google Patents
[go: Go Back, main page]

JPH0634259B2 - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH0634259B2
JPH0634259B2 JP59073412A JP7341284A JPH0634259B2 JP H0634259 B2 JPH0634259 B2 JP H0634259B2 JP 59073412 A JP59073412 A JP 59073412A JP 7341284 A JP7341284 A JP 7341284A JP H0634259 B2 JPH0634259 B2 JP H0634259B2
Authority
JP
Japan
Prior art keywords
pattern
dictionary
input
recognition
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59073412A
Other languages
Japanese (ja)
Other versions
JPS60217487A (en
Inventor
由明 黒沢
好勝 中村
勝則 大井
裕 比田井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP59073412A priority Critical patent/JPH0634259B2/en
Publication of JPS60217487A publication Critical patent/JPS60217487A/en
Publication of JPH0634259B2 publication Critical patent/JPH0634259B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は入力パターンと辞書登録された辞書パターンと
を照合して文字認識する文字認識装置に係り、特に簡易
に文字データの入力効率の向上を図り得るようにした文
字認識装置に関する。
Description: TECHNICAL FIELD [0001] The present invention relates to a character recognition device that recognizes characters by collating an input pattern with a dictionary pattern registered in a dictionary, and particularly, for improving the input efficiency of character data easily. The present invention relates to a character recognition device that can be designed.

〔発明の技術的背景とその問題点〕[Technical background of the invention and its problems]

情報処理技術の発達に伴い、計算機で取扱われるデータ
量が膨大化している。これ故、各種データを如何に効率
良く計算機に入力するかが大きな課題となっている。
Along with the development of information processing technology, the amount of data handled by computers is enormous. Therefore, how to efficiently input various data into a computer has become a major issue.

これに対する解答として、近時、帳票等に印刷あるいは
手書きされた文字・記号を光学的に読取って文字認識し
てデータ入力するOCRや、タブレット等の座標入力装
置を介して筆記入力される文字ストロークの情報から実
時間的に文字認識しデータ入力する文字認識装置が各種
開発されている。
As an answer to this, OCR which optically reads characters and symbols recently printed or handwritten on a form or the like to recognize and input data, or a character stroke which is handwritten and input through a coordinate input device such as a tablet Various character recognition devices for recognizing characters in real time and inputting data have been developed.

ところで、この種の文字認識装置は、基本的には入力文
字パターンを1文字毎に切出し、その文字パターンの特
徴を検出して認識辞書に予め登録された標準辞書パター
ンの特徴と照合し、この照合結果から上記文字パターン
に対する認識結果を得る如く構成されている。この為、
例えば原稿の下書やメモ書き等で多く利用されている略
字や略記号等を入力することができないと云う不具合が
あった。そして、必然的に正式な書体による文字・記号
の筆記が要求されることになり、筆記者に大きな負担を
掛けることのみならず、文字データ入力時間の増大、入
力ミスの増大等を招く問題があった。
By the way, this type of character recognition device basically cuts out an input character pattern for each character, detects the characteristics of the character pattern, and compares it with the characteristics of a standard dictionary pattern registered in advance in the recognition dictionary. It is configured to obtain a recognition result for the character pattern from the matching result. Therefore,
For example, there is a problem in that it is not possible to input abbreviations and symbols that are often used in drafts of drafts and memos. Inevitably, the writing of characters and symbols in a formal typeface is required, which not only puts a heavy burden on the writer but also causes an increase in character data input time and an increase in input errors. there were.

〔発明の目的〕[Object of the Invention]

本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、効率良く文字データの入力を行
うことができ、しかも文字データ入力の簡易化を図って
筆記者の負担を軽減することのできる実用性の高い文字
認識装置を提供することにある。
The present invention has been made in consideration of such circumstances, and an object of the present invention is to enable efficient input of character data and to simplify the input of character data to reduce the burden on the writer. It is to provide a highly practical character recognition device that can be reduced.

〔発明の概要〕[Outline of Invention]

すなわち、上記目的を達成すために、本発明の文字認識
装置は、与えられた入力パターンと認識辞書に予め辞書
登録された辞書パターンとを照合して上記入力パターン
に対する認識結果を求める文字認識装置において、前記
認識辞書に辞書パターンとして辞書登録されていない所
望の入力パターンが与えられ、この所望の入力パターン
を指定された所定の文字列に対する特殊辞書パターンと
して作成し、この特殊辞書パターンを上記所定の文字列
に対応付けて前記文字認識辞書に追加登録する手段と、
上記特殊辞書パターンに該当する入力パターンが与えら
れたとき、前記特殊辞書パターンに対応する前記所定の
文字列を上記入力パターンに対する認識結果として出力
する手段とを具備したことを特徴とする。
That is, in order to achieve the above object, the character recognition device of the present invention is a character recognition device for collating a given input pattern with a dictionary pattern registered in a dictionary in advance in a recognition dictionary to obtain a recognition result for the input pattern. In the above, a desired input pattern which is not registered as a dictionary pattern in the recognition dictionary is given, and the desired input pattern is created as a special dictionary pattern for a specified predetermined character string, and this special dictionary pattern is set to the predetermined dictionary pattern. Means for additionally registering in the character recognition dictionary in association with the character string of
When an input pattern corresponding to the special dictionary pattern is given, the predetermined character string corresponding to the special dictionary pattern is output as a recognition result for the input pattern.

〔発明の効果〕〔The invention's effect〕

かくして本発明によれば、この文字認識装置の使用者が
随時、所望の入力パターンを所定の文字列と対応付けて
認識辞書に追加登録することが可能となる。
Thus, according to the present invention, the user of the character recognition device can additionally register a desired input pattern in the recognition dictionary in association with a predetermined character string at any time.

このため、出現頻度の高い長い文のような簡易に入力し
たい文字列を上記所定の文字列として指定し、使用者が
選んだ簡単なパターンを上記特殊辞書パターンとして追
加登録しておくことにより、文字データ入力に際し、こ
の簡単なパターンを筆記するだけで上記文字列を入力す
ることが可能となるので、文章を短時間に入力でき、筆
者に対する負担を大幅に軽減できる。
Therefore, by specifying a character string that you want to input easily such as a long sentence with high appearance frequency as the above-mentioned predetermined character string, and additionally registering a simple pattern selected by the user as the special dictionary pattern, When inputting character data, the above character string can be input simply by writing this simple pattern, so that the sentence can be input in a short time and the burden on the writer can be greatly reduced.

しかも、本発明では、使用者が特殊辞書パターンとして
用いる簡単なパターンを選択する上での制約が全くない
ので、例えば対応する所定の文字列を連想しやすいよう
なパターンを選択したり、一般的には無意味な記号であ
っても特定の筆記者が特定の文字列を入力する上で非常
に簡便になるようなパターンを選択したりすることによ
って、筆者に対する負担をより効果的に軽減し実用性を
さらに高めることができる。
Moreover, in the present invention, since there is no restriction on the user selecting a simple pattern to be used as a special dictionary pattern, for example, a pattern that makes it easy to associate a corresponding predetermined character string, Can reduce the burden on the writer more effectively by selecting a pattern that makes it very easy for a specific writer to input a specific character string even if it is a meaningless symbol. The practicality can be further enhanced.

〔発明の実施例〕Example of Invention

以下、図面を参照して本発明の一実施例につき説明す
る。
An embodiment of the present invention will be described below with reference to the drawings.

第1図は実施例装置の概略構成図である。この実施例装
置はタブレット装置1の座標面上にペン2を用いて筆記
入力された文字・記号パターンを筆記ストロークの時系
列な座標データとして検出し、その特徴を抽出して上記
入力文字・記号パターンを文字認識するものである。し
かして、前記タブレット装置1から時系列座標データと
して入力される文字・記号パターンの情報は、検切部3
に導かれて所定の前処理がなされたのち、1文字毎に切
出される。上記前処理は、例えば筆記ストロークデータ
の中から雑音成分を除去したり、また入力文字・記号パ
ターン毎にその大きさを正規化する等して行われる。そ
の後、上記前処理が施された入力パターンについて、例
えば各筆記ストロークの標本点を特徴情報として抽出す
る等して上記入力パターンを表現する特徴データが求め
られる。認識部4は、このようにして求められた前記入
力パターンの特徴と、認識辞書5に予め登録された標準
辞書パターンの特徴とを照合し、その類以度を求める等
して入力パターンに最も類似している標準辞書パターン
を検出し、この標準辞書パターンを前記入力パターンの
文字認識結果として求めている。
FIG. 1 is a schematic configuration diagram of the embodiment apparatus. The apparatus of this embodiment detects a character / symbol pattern handwritten using the pen 2 on the coordinate plane of the tablet device 1 as time-series coordinate data of a writing stroke, and extracts the characteristics of the input character / symbol. The pattern is recognized by characters. Then, the information of the character / symbol pattern input as time-series coordinate data from the tablet device 1 is stored in the inspection unit 3.
, And a predetermined pre-process is performed, and then each character is cut out. The above-mentioned preprocessing is performed, for example, by removing noise components from the writing stroke data, or normalizing the size of each input character / symbol pattern. Then, for the preprocessed input pattern, characteristic data expressing the input pattern is obtained by, for example, extracting sample points of each writing stroke as characteristic information. The recognition unit 4 collates the features of the input pattern thus obtained with the features of the standard dictionary pattern registered in the recognition dictionary 5 in advance, and determines the degree of similarity and the like to find the most similar input pattern. A similar standard dictionary pattern is detected, and this standard dictionary pattern is obtained as the character recognition result of the input pattern.

尚、認識部4における認識処理方式は、従来より知られ
ている種々の方式を適宜用いれば良いものであり、また
前記認識辞書5の構成もその認識方式に応じて定められ
ることは云うまでもない。
It is needless to say that the recognition processing method in the recognition unit 4 may appropriately use various conventionally known methods, and the configuration of the recognition dictionary 5 is also determined according to the recognition method. Absent.

ところで、前記認識辞書5には予め複数の認識対象文字
の各標準辞書パターンが登録されているが、この認識辞
書5に新たな辞書パターンの追加登録ができるようにな
っている。この認識辞書5に追加登録される辞書パター
ンは、辞書作成部6にて作成されるもので、辞書登録モ
ード設定時に前記タブレット装置1を介して入力される
入力パターンの特徴データを新たな辞書パターンとする
等して行われる。
By the way, although the standard dictionary patterns of a plurality of recognition target characters are registered in advance in the recognition dictionary 5, a new dictionary pattern can be additionally registered in the recognition dictionary 5. The dictionary pattern additionally registered in the recognition dictionary 5 is created by the dictionary creating unit 6, and the characteristic data of the input pattern input via the tablet device 1 when the dictionary registration mode is set is used as a new dictionary pattern. And so on.

即ち、辞書登録モード設定時には、先ず辞書登録すべき
文字列が、例えばキーボード装置(図示せず)を介して
文字コード等として入力される。尚、前記タブレット装
置1を介して上記文字列を入力するようにしても良く、
或いは既に入力された文字列を選択指定して与えるよう
にしても良い。しかる後、この指定された文字列に対す
る登録辞書パターンを前記タブレット装置1をして入力
する。この登録辞書パターンは、例えば第2図に示すよ
うに、文字列「電話」に対しては、その略称である「t
el」の筆記体パターンとして、或いは文字列「オンラ
イン手書文字認識装置」に対しては特殊記号パターン等
として与えられる。このようにして入力される登録辞書
パターンに対して、例えば第3図に示すようにその筆記
ストロークを9つの標本座標位置データとして特徴抽出
し、これを新たな辞書パターン(特殊辞書パターン)と
する。この特殊辞書パターンを前記指定された所定の文
字列に対応付けて前記認識辞書5に追加登録することに
よって、上記指定された文字列に対する辞書登録が完了
する。
That is, when the dictionary registration mode is set, a character string to be registered in the dictionary is first input as a character code or the like via a keyboard device (not shown). The above character string may be input via the tablet device 1,
Alternatively, a character string that has already been input may be selectively designated and given. Then, the registered dictionary pattern for the designated character string is input to the tablet device 1. This registered dictionary pattern is an abbreviation "t" for the character string "telephone" as shown in FIG. 2, for example.
It is given as a cursive pattern of "el" or as a special symbol pattern for the character string "online handwritten character recognition device". With respect to the registered dictionary pattern input in this way, for example, as shown in FIG. 3, the writing stroke is feature-extracted as nine sample coordinate position data, and this is used as a new dictionary pattern (special dictionary pattern). . By additionally registering this special dictionary pattern in the recognition dictionary 5 in association with the designated predetermined character string, the dictionary registration for the designated character string is completed.

かくしてこのような特殊辞書パターンが認識辞書5に追
加登録されると、それ以降に前記タブレット装置1を介
して上記特殊辞書パターンに該当する入力パターンが入
力されると、前述した認識処理によって認識部4は上記
入力パターンが前記追加登録された特殊辞書パターンで
あることを認識する。この認識結果を得て、認識部4は
上記特殊辞書パターンに対応して記憶された前記所定の
文字列を前記入力パターンに対する認識結果として出力
する。
Thus, when such a special dictionary pattern is additionally registered in the recognition dictionary 5, when an input pattern corresponding to the special dictionary pattern is subsequently input through the tablet device 1, the recognition unit performs the recognition processing described above. 4 recognizes that the input pattern is the additionally registered special dictionary pattern. When the recognition result is obtained, the recognition unit 4 outputs the predetermined character string stored corresponding to the special dictionary pattern as a recognition result for the input pattern.

かくして本装置によれば、前記特殊辞書パターンを有効
に利用して所定の文字列を極めて簡易に入力することが
可能となる。つまり、日常使用している略字や記号を利
用して所望とする文字列を効率良く入力することが可能
となり、筆記者に対する負担を大幅に軽減することがで
きる。またこの特殊辞書パターンを利用して文字数の多
い文章等を簡易に入力することも可能となり、文字デー
タ入力の高速化を図り得る等の効果も奏せられる。
Thus, according to the present device, it is possible to input a predetermined character string extremely easily by effectively utilizing the special dictionary pattern. That is, it becomes possible to efficiently input a desired character string by using the abbreviations and symbols used in daily life, and it is possible to significantly reduce the burden on the writer. Further, it is possible to easily input a sentence having a large number of characters by using this special dictionary pattern, and it is possible to achieve an effect such as speeding up of character data input.

尚、本発明は上述した実施例に限定されるものではな
い。実施例ではタブレット装置を介して文字パターンを
筆記入力するものについて説明したが、帳票等に記載さ
れた文字パターンを光学的に入力して文字認識処理する
文字認識装置にも同様に適用して実施することができ
る。また文字認識の方式や、この文字認識で用いる入力
パターンの特徴情報等も装置仕様に応じて種々変形する
ことができる。要するに本発明はその要旨を逸脱しない
範囲で種々変形して実施することができる。
The present invention is not limited to the above embodiment. In the embodiment, the description is given of the case where the character pattern is written and input through the tablet device, but the same is applied to the character recognition device that optically inputs the character pattern described in the form and performs the character recognition process. can do. Further, the character recognition method, the characteristic information of the input pattern used in the character recognition, and the like can be variously modified according to the device specifications. In short, the present invention can be variously modified and implemented without departing from the scope of the invention.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例装置の概略構成図、第2図は
辞書登録する指定の文字列とこの文字列に対して辞書登
録される特殊辞書パターンとの例を示す図、第3図は入
力パターンに対する特殊辞書パターンデータの抽出例を
示す図である。 1……タブレット装置、2……ペン、3……検切部、4
……認識部、5……認識辞書、6……辞書作成部。
FIG. 1 is a schematic configuration diagram of an apparatus according to an embodiment of the present invention, FIG. 2 is a diagram showing an example of a designated character string to be registered in a dictionary, and a special dictionary pattern registered in the dictionary for this character string. The figure is a diagram showing an example of extracting special dictionary pattern data for an input pattern. 1 ... tablet device, 2 ... pen, 3 ... inspection section, 4
...... recognition unit, 5 ... recognition dictionary, 6 ... dictionary creation unit.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 比田井 裕 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝総合研究所内 (56)参考文献 特開 昭58−149574(JP,A) 特開 昭58−219685(JP,A) 特開 昭57−206988(JP,A) 電子通信学会論文誌,Vol J65− D,No.6(昭57−6−25)P.679− 686 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor, Hiroshi Hitai, No. 1, Komukai Toshiba-cho, Sachi-ku, Kawasaki-shi, Kanagawa Inside the Toshiba Research Institute, Inc. (56) Reference JP-A-58-149574 (JP, A) Kai 58-219685 (JP, A) JP 57-206988 (JP, A) IEICE Transactions, Vol J65-D, No. 6 (Sho 57-6-25) P. 679-686

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】与えられた入力パターンと認識辞書に予め
辞書登録された辞書パターンとを照合して上記入力パタ
ーンに対する認識結果を求める文字認識装置において、 前記認識辞書に辞書パターンとして辞書登録されていな
い所望の入力パターンが与えられ、この所望の入力パタ
ーンを指定された所定の文字列に対する特殊辞書パター
ンとして作成し、この特殊辞書パターンを上記所定の文
字列に対応付けて前記認識辞書に追加登録する手段と、 上記特殊辞書パターンに該当する入力パターンが与えら
れたとき、前記特殊辞書パターンに対応する前記所定の
文字列を上記入力パターンに対する認識結果として出力
する手段とを具備したことを特徴とする文字認識装置。
1. A character recognition apparatus for collating a given input pattern with a dictionary pattern registered in advance in a recognition dictionary to obtain a recognition result for the input pattern, wherein the dictionary is registered as a dictionary pattern in the recognition dictionary. A desired input pattern that is not present is given, and this desired input pattern is created as a special dictionary pattern for a specified predetermined character string, and this special dictionary pattern is additionally registered in the recognition dictionary in association with the predetermined character string. And a means for, when an input pattern corresponding to the special dictionary pattern is given, outputting the predetermined character string corresponding to the special dictionary pattern as a recognition result for the input pattern. Character recognition device.
【請求項2】所定の文字列に対応付けて設定される特種
辞書パターンは、上記所定の文字列を該特殊辞書パター
ンの属性データとして付加して認識辞書に登録されるも
のである特許請求の範囲第1項記載の文字認識装置。
2. A special dictionary pattern set in association with a predetermined character string is registered in a recognition dictionary with the predetermined character string added as attribute data of the special dictionary pattern. The character recognition device according to claim 1.
【請求項3】入力パターンは、座標入力装置を介して筆
記入力される文字・記号パターンの筆記ストロークを示
す時系列的な座標データして入力されるものである特許
請求の範囲第1項記載の文字認識装置。
3. The input pattern is input as time-series coordinate data indicating a writing stroke of a character / symbol pattern written and input via a coordinate input device. Character recognition device.
JP59073412A 1984-04-12 1984-04-12 Character recognition device Expired - Lifetime JPH0634259B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59073412A JPH0634259B2 (en) 1984-04-12 1984-04-12 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59073412A JPH0634259B2 (en) 1984-04-12 1984-04-12 Character recognition device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP7130644A Division JP2549831B2 (en) 1995-05-29 1995-05-29 Character recognition device input pattern / character string registration method

Publications (2)

Publication Number Publication Date
JPS60217487A JPS60217487A (en) 1985-10-31
JPH0634259B2 true JPH0634259B2 (en) 1994-05-02

Family

ID=13517452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59073412A Expired - Lifetime JPH0634259B2 (en) 1984-04-12 1984-04-12 Character recognition device

Country Status (1)

Country Link
JP (1) JPH0634259B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015004787A1 (en) * 2013-07-11 2015-01-15 Tanaka Shunichi Input assistance device

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07122891B2 (en) * 1985-10-21 1995-12-25 キヤノン株式会社 Information processing method and device
JP2664894B2 (en) * 1985-10-21 1997-10-22 キヤノン株式会社 Information processing method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6030993B2 (en) * 1980-03-25 1985-07-19 富士通株式会社 Real-time handwritten character recognition device
JPS57206988A (en) * 1981-06-15 1982-12-18 Fujitsu Ltd Data processor
JPS5878260A (en) * 1981-11-04 1983-05-11 Toshiba Corp Optical character reader
JPS58149574A (en) * 1982-03-02 1983-09-05 Nec Corp Registering device of standard pattern
JPS58219685A (en) * 1982-06-14 1983-12-21 Canon Inc character processing device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子通信学会論文誌,VolJ65−D,No.6(昭57−6−25)P.679−686

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015004787A1 (en) * 2013-07-11 2015-01-15 Tanaka Shunichi Input assistance device

Also Published As

Publication number Publication date
JPS60217487A (en) 1985-10-31

Similar Documents

Publication Publication Date Title
Nagy Twenty years of document image analysis in PAMI
Tagougui et al. Online Arabic handwriting recognition: a survey
Jayadevan et al. Offline recognition of Devanagari script: a survey
JP3452774B2 (en) Character recognition method
EP1479013A1 (en) An electronic filing system searchable by a handwritten search query
Awaida et al. Writer identification of arabic text using statistical and structural features
Saba et al. Online versus offline Arabic script classification
Beigi An overview of handwriting recognition
Sharma et al. Rearrangement of recognized strokes in online handwritten Gurmukhi words recognition
Tang et al. Document structures: A survey
Hakro et al. A study of sindhi related and arabic script adapted languages recognition
Ma et al. A new database for online handwritten Mongolian word recognition
JPH0634259B2 (en) Character recognition device
Mashiyat et al. Bangla off-line handwritten character recognition using superimposed matrices
AbdulKader A two-tier arabic offline handwriting recognition based on conditional joining rules
JPH05225399A (en) Document processor
JP2549831B2 (en) Character recognition device input pattern / character string registration method
Sarnacki et al. Character Recognition Based on Skeleton Analysis
Amin Recognition of printed Arabic text using machine learning
JPH02282883A (en) Recognizing system for handwriting input
Iwayama Interactive Character recognition technology for pen-based computers
Ramanaprasad et al. Reading handprinted addresses on IRS tax forms
Srihari et al. Written Language Input
Pao et al. An approximate string matching algorithm for on-line Chinese character recognition
Koteswararao et al. Recognition with an Improved CNN