JPS6030992B2 - character encoding device - Google Patents
character encoding deviceInfo
- Publication number
- JPS6030992B2 JPS6030992B2 JP54084597A JP8459779A JPS6030992B2 JP S6030992 B2 JPS6030992 B2 JP S6030992B2 JP 54084597 A JP54084597 A JP 54084597A JP 8459779 A JP8459779 A JP 8459779A JP S6030992 B2 JPS6030992 B2 JP S6030992B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- code
- stored
- characters
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
この発明は文字を多く含む画像の伝送などに用いられる
文字符号化装置に関するものである。DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a character encoding device used for transmitting images containing many characters.
近年、計算機技術や通信技術の発展によって、画像を取
り扱うことが比較的容易となり、画像データファイルや
画像通信の応用が盛んになりつつあるが、画像の持つ膨
大な情報量をいかに効率よく表現し、記憶や伝送に応用
するかは重要な問題である。従来画像のデータ圧縮技術
として、画像内の画素信号の持つ統計的な性質を利用し
て、RL(ランレンクス)符号化、DPCMなどの予測
符号化、アダマール変換などの直交変換符号化などの各
種の符号化方式が研究されてきた。In recent years, with the development of computer technology and communication technology, it has become relatively easy to handle images, and applications of image data files and image communication are becoming more popular. , whether it will be applied to storage or transmission is an important question. Conventional image data compression techniques utilize the statistical properties of pixel signals within an image to utilize various techniques such as RL (run length) encoding, predictive encoding such as DPCM, and orthogonal transform encoding such as Hadamard transform. Coding schemes have been studied.
これらの方式は、画像が文書なのか図面なのか、写真な
のかという内容にかかわらず適用することができる意味
で汎用性はあるが、その反面、特定の種類の画像に対し
て必ずしも最も効率の良い符号化方式であると限らない
ものである。つまり、画像の種類を限定した場合にはこ
れらの汎用的符号化方式よりも、より効率の良い符号化
方式が考えられる。この発明は、上記の点に着目してな
されてもので、文字を多く含む文書のような画像に対し
て、極めて効率の良い符号化を可能とする文字符号化装
置を提供することを目的とする。以下、この発明の一実
施例を図面にもとづいて説明する。These methods are versatile in the sense that they can be applied regardless of whether the image is a document, drawing, or photograph, but on the other hand, they are not necessarily the most efficient for a particular type of image. It does not necessarily mean that it is a good encoding method. In other words, when the types of images are limited, a more efficient encoding method can be considered than these general-purpose encoding methods. The present invention has been made with attention to the above points, and an object of the present invention is to provide a character encoding device that enables extremely efficient encoding of images such as documents containing many characters. do. Hereinafter, one embodiment of the present invention will be described based on the drawings.
第1図は、この発明に係る文字符号化装置の構成を示す
ブロック図で、10は文字が書かれた文書、1 1は文
字の字形を読みとる字形読取部、12は所定の字形があ
らかじめ記憶された第1の記憶部、13は所定の字形が
あらかじめ記憶されていない第2の記憶部、14は符号
化部で、15は上記各部11〜14を制御する制御部で
ある。FIG. 1 is a block diagram showing the configuration of a character encoding device according to the present invention, in which 10 is a document in which characters are written, 11 is a character shape reading unit that reads the character shape, and 12 is a predetermined character shape that is stored in advance. 13 is a second storage section in which predetermined glyphs are not stored in advance; 14 is an encoding section; and 15 is a control section for controlling each of the sections 11 to 14.
第2図は、上記文字符号化装置に対応する文字復号化装
置の構成を示すブロック図で、21は復号化部、22は
第1の記憶部、23は第2の記憶部、24は字形記憶部
、25は制御部で、26は文字がコピーされた文書コピ
ーである。つぎに作用を説明する。FIG. 2 is a block diagram showing the configuration of a character decoding device corresponding to the character encoding device described above, in which 21 is a decoding section, 22 is a first storage section, 23 is a second storage section, and 24 is a glyph shape. A storage section, 25 is a control section, and 26 is a document copy into which characters are copied. Next, the effect will be explained.
文書10上に書かれた、たとえば「カナと漢字では、漢
字の方がはるかに複雑で、・…・・」という文字列は、
字形読取部11で順次読みとられのち、制御部15にお
いて、第1の記憶部12に記憶されている所定の文字字
形と比較、照合される。For example, the character string written on document 10, ``Between kana and kanji, kanji is much more complex,...''
After being sequentially read by the character shape reading section 11, the control section 15 compares and collates them with predetermined character shapes stored in the first storage section 12.
この第1の記憶部12内には、所定の文字、たとえば仮
名文字、数字、アルファベット文字のような比較的字形
の簡単な文字の標準的字形や字形の特徴があらかじめ記
憶されており、公知の文字認識技術によって、このうち
1つと読み取られた文字が同一であるかが判定される。
そして、第1の記憶部12内に同一文字が見つかった場
合には、つまり字形読取部11で読みとられた文字の字
形が第1の記憶部12に記憶されている場合には、その
該当文字に個有に与えられたコードを、読みとられた文
字に対する符号として、符号化部40で符号化する。た
とえば上記の例では、「力」には“01000101”
という符号が、また「ナ」には“01010100’’
という符号がそれぞれ与えられる。一方、第1の記憶部
12内に同一文字が見つからない場合は、つまり、字形
読取部11で読み取られた文字の字形が第1の記憶部1
2に記憶されていない場合には、読み取った文字の字形
を逐次第2の記憶部13に記憶させる。The first storage unit 12 stores in advance the standard shapes and character shapes of predetermined characters, for example, characters with relatively simple shapes such as kana characters, numbers, and alphabetic characters. Character recognition technology determines whether one of the characters read is the same.
If the same character is found in the first storage unit 12, that is, if the glyph of the character read by the glyph reading unit 11 is stored in the first storage unit 12, the corresponding A code uniquely given to a character is encoded by the encoding unit 40 as a code for the read character. For example, in the above example, "force" is "01000101".
The code ``Na'' is also ``01010100''
A code is given for each. On the other hand, if the same character is not found in the first storage section 12, that is, the glyph of the character read by the glyph reading section 11 is not found in the first storage section 1.
If the shape of the read character is not stored in the memory section 2, the shape of the read character is sequentially stored in the memory section 13 of the second memory.
この第2の記憶部13は書き込みおよび読み出しの両方
が可能な記憶装置である。上記第2の記憶部13に新た
に記憶された文字には、先の第1の記憶部12内の文字
とは異なる文字コードが与えられる。この文字コード‘
ま、たとえば、第1の記憶部12で見し・出されなかっ
た文字が出現した順番や、第2の記憶部13内の記憶ア
ドレスを表わすコ−ドを用いることができる。たとえば
、再び上記の例で、「漢」には“10000000”と
いうコードが、また「字」には“10000001’’
というコードがそれぞれ与えられる。符号化部14では
、このコ−ドを、読みとった文字に対する符号として符
号化を行なつoここで、第1の記憶部12に見つからな
い文字であって、以前に文書中に出現して第2の記憶部
13内にすでに記憶されている文字が再び出現した場合
には、新たに文字コードを与えてもよいし、あるいは先
に与えられたコードをその文字の符号として符号化して
もよい。This second storage unit 13 is a storage device that allows both writing and reading. A character newly stored in the second storage unit 13 is given a character code different from that of the character in the first storage unit 12. This character code'
For example, it is possible to use a code representing the order in which characters not displayed in the first storage section 12 appear or a storage address within the second storage section 13. For example, again in the above example, "Kan" has the code "10000000" and "Ji" has the code "10000001''.
A code is given for each. The encoding unit 14 encodes this code as a code for the read character. When a character already stored in the storage unit 13 of 2 appears again, a new character code may be given, or the previously given code may be encoded as the code for that character. .
つまり、上記の例では、2度割こ出現した「漢」と「字
」は以前と同じく、それぞれ“l000000び、“1
0000001’1とし、つコードで符号化される。文
書中のすべての文字がこのようにして符号化されれば、
つまり第1の記憶部12と第2の記憶部13内の文字字
形が与えられれば元の文書面の文字列を再現することが
可能である。In other words, in the above example, "kan" and "ji" that appear twice are "l000000" and "1" respectively, as before.
0000001'1, and is encoded with one code. If all the characters in the document are encoded in this way,
In other words, if the character shapes in the first storage section 12 and the second storage section 13 are given, it is possible to reproduce the character string on the original document surface.
ところで、このような符号化によって、文書を伝送する
ことを考えれば、文書中の文字のうち、第1の記憶部1
2内の文字は、標準文字としてあらかじめ送信側にも受
信側にも備えておけばよいが、第2の記憶部13内の文
字は、文書によって出現する文字の種類が異なるため、
あらかじめ準備することはできない。By the way, if we consider transmitting a document using such encoding, some of the characters in the document are stored in the first storage unit 1.
The characters in 2 may be prepared in advance as standard characters on both the sending and receiving sides, but the characters in the second storage section 13 differ in the type of characters that appear depending on the document.
It cannot be prepared in advance.
したがって、この内容を送信側から受信側へ伝達しなけ
ればならない。この際には、第2の記憶部13内には標
準文字以外の出現文字が「漢・字・方・複・雑・・・・
・・」と並んでいるわけであるから、これを通常の2値
画像としてRL符号化などの方法で符号化部14によっ
て符号化すればよい。伝送の際には、先に符号化された
文字列に対応して、“01010100”、“0001
001r、“1000000ぴとなる符号列に、第2の
記憶部13内の字形列の符号化されたものを付加すれば
よい。さて、このようにして符号化されて、記憶された
り、伝送されてきた文書の文字列の復元は、第2図のよ
うな復号化装置によって行なうことができる。Therefore, this content must be conveyed from the sender to the receiver. At this time, characters appearing other than standard characters are stored in the second storage unit 13 as "kanji, characters, forms, complex, complicated...
. . ”, so the encoding unit 14 can encode this as a normal binary image using a method such as RL encoding. During transmission, "01010100" and "0001" are written in response to the previously encoded character string.
001r, "1,000,000 bits" can be added to the encoded glyph string in the second storage unit 13. The character string of the document can be restored by a decoding device as shown in FIG.
すなわち、第1の記憶部22は標準文字の標準字形が記
憶されており、あらかじめ準備されるものである。一方
第2の記憶部23は、画像記憶での応用の際は、符号化
時の記憶内容がそのまま利用できるが、画像伝送などで
の応用では、最初は何も記憶されていない。そこで、ま
ず「漢」「字」「方」「複一「難」という字形列の符号
を受信し、復号化部21によって復号化して、字形列を
再現し、それを第2の記憶部23内に記憶させる。つぎ
に、‘‘01010100”、“00010011”、
“1000000びなる文字符号列から文字コードを順
次復号化して第1の記憶部22と第2の記憶部23内の
文字字形を読み出し、その信号を字形記録部24に印加
することにより、元の文書の文字列「ナハ「とハ「漢」
を再生して文書コピー26を得る。なお、上記の実施例
の説明で、文書面上の文字列の符号化のみについて述べ
たが、文字と同様に取扱うことのできる図形、たとえば
、登録商標や署名などについても、文字と同様に標準図
形として第1の記憶部12内に記憶したり、あるいは非
標準図形として第2の記憶部13に記憶して符号化した
りできることは勿論である。That is, the first storage unit 22 stores standard glyph shapes of standard characters and is prepared in advance. On the other hand, in the second storage unit 23, when applied to image storage, the stored contents at the time of encoding can be used as is, but when applied to image transmission etc., nothing is stored at first. Therefore, first, the code of the glyph string "Kan", "ji", "kata", and "multiple "dang" is received, decoded by the decoding section 21 to reproduce the glyph string, and stored in the second storage section 23. memorize it internally. Next, ``01010100'', ``00010011'',
By sequentially decoding character codes from a character code string of 1,000,000 and reading the character shapes in the first storage section 22 and second storage section 23, and applying the signal to the character shape recording section 24, the original Document string “naha” and ha “han”
is reproduced to obtain a document copy 26. In the explanation of the above embodiment, only the encoding of character strings on the document surface was described, but graphics that can be handled in the same way as characters, such as registered trademarks and signatures, can also be encoded as standard. Of course, it can be stored in the first storage unit 12 as a figure, or stored in the second storage unit 13 as a non-standard figure and encoded.
以上詳述したように、この発明では、文字を読み取って
符号化する文字符号化装置において、2種の記憶部を有
し、読み取られた字形が第1の記憶部に記載されている
場合は、該当文字に与えられたコードをその読み取り文
字に対する符号とし、読み取られた字形が第1の記憶部
に記憶されてない場合には、その字形を第2の記憶部に
記憶して新たなコードを付し、このコードをその読み取
り文字に対する符号とするように構成したので、つまり
、文書中の文字のすべてを符号に変換するので、文字を
多く含む文書などの画像の符号化においてRL符号化な
ど通常の符号化方式にくらべて極めて効率が高く、かつ
標準文字以外の図形を含む画像でも符号化できるという
汎用性もある。As described in detail above, in the present invention, a character encoding device that reads and encodes characters has two types of memory sections, and when the read character shape is written in the first memory section, , the code given to the corresponding character is used as the code for the read character, and if the read character shape is not stored in the first storage unit, the character shape is stored in the second storage unit and a new code is generated. , and this code is used as the code for the read character. In other words, all the characters in the document are converted into codes, so RL encoding is used when encoding images such as documents containing many characters. It is extremely efficient compared to normal encoding methods such as , and has the versatility of being able to encode images that include graphics other than standard characters.
第1図はこの発明に係る文字符号化装置のブロック図、
第2図は文字復号化装置のブ。
ック図である。11・・…・字形読取部、12・・・・
・・第1の記憶部、13・・・・・・第2の記憶部、1
4・・…・符号化部。
第1図第2図FIG. 1 is a block diagram of a character encoding device according to the present invention;
Figure 2 shows the block of the character decoding device. This is a diagram. 11...Glyph reading section, 12...
...First storage section, 13...Second storage section, 1
4... Encoding section. Figure 1 Figure 2
Claims (1)
あらかじめ記憶された第1の記憶部と、所定の字形が記
憶されていない第2の記憶部と、符号化部を備え、字形
読取部で読み取られた文字の字形が第1の記憶部に記憶
されている場合には、第1の記憶部に記憶された該当文
字に与えられたコードを、その読み取り文字に対する符
号とし、字形読取部で読み取られた文字の字形が第1の
記憶部に記載されていない場合には、その文字の字形を
第2の記憶部に記憶して新たなコードを付し、このコー
ドを、その読み取り文字に対する符号とするように構成
したことを特徴とする文字符号化装置。1. A character shape reading unit comprising a character shape reading unit that reads the character shape, a first storage unit in which a predetermined character shape is stored in advance, a second storage unit in which a predetermined character shape is not stored, and an encoding unit. If the glyph of the character read by is stored in the first storage unit, the code given to the corresponding character stored in the first storage unit is used as the code for the read character, and the glyph reading unit If the glyph of the character read in is not recorded in the first memory, the glyph of the character is stored in the second memory, a new code is attached, and this code is applied to the read character. What is claimed is: 1. A character encoding device characterized in that the character encoding device is configured to encode a code for a character.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP54084597A JPS6030992B2 (en) | 1979-07-02 | 1979-07-02 | character encoding device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP54084597A JPS6030992B2 (en) | 1979-07-02 | 1979-07-02 | character encoding device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS569872A JPS569872A (en) | 1981-01-31 |
| JPS6030992B2 true JPS6030992B2 (en) | 1985-07-19 |
Family
ID=13835084
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP54084597A Expired JPS6030992B2 (en) | 1979-07-02 | 1979-07-02 | character encoding device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6030992B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5824976A (en) * | 1981-08-06 | 1983-02-15 | Fujitsu Ltd | Reading system for optical character reader |
-
1979
- 1979-07-02 JP JP54084597A patent/JPS6030992B2/en not_active Expired
Also Published As
| Publication number | Publication date |
|---|---|
| JPS569872A (en) | 1981-01-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5867112A (en) | Software method of compressing text and graphic images for storage on computer memory | |
| US7769237B2 (en) | Dynamic, locally-adaptive, lossless palettization of color and grayscale images | |
| WO1987007107A1 (en) | Data communication equipment | |
| JPH022349B2 (en) | ||
| JPS5923964A (en) | Method of transmitting test document | |
| US5283667A (en) | Electronic filing apparatus provided with a multiple processing function when image data is displayed | |
| WO2005022524A3 (en) | Content preservation | |
| US20060170574A1 (en) | Method and apparatus for compressing and decompressing data, and computer product | |
| US8463759B2 (en) | Method and system for compressing data | |
| JPS6030992B2 (en) | character encoding device | |
| JP2000039969A5 (en) | ||
| CN101124590A (en) | Method of doubly encoding information on physical media and in DOTEM computer format | |
| US6356667B1 (en) | Encoding apparatus and method, decoding apparatus and method and recording medium | |
| JP2959633B2 (en) | Fast vector quantum differentiation method and apparatus | |
| JPS63155957A (en) | Binary picture information compressing device | |
| US6272256B1 (en) | Fast compression of periodic halftoned bitonal images | |
| JPH08162973A (en) | Data processing method and device, and information system using the data processing device | |
| JPS6193770A (en) | Band compression coding device | |
| JPS62141860A (en) | Data processing system | |
| JPH03276259A (en) | Image processing method | |
| KR940025191A (en) | Variable length coding method | |
| JPH0411907B2 (en) | ||
| JPH05181961A (en) | Document retrieval device and continuous document display device for filing device | |
| JPH02109424A (en) | Encoded data decoding processing method | |
| JPS63184877A (en) | Picture fun length encoding device |