JPH0628059B2 - Character processor - Google Patents
Character processorInfo
- Publication number
- JPH0628059B2 JPH0628059B2 JP1255492A JP25549289A JPH0628059B2 JP H0628059 B2 JPH0628059 B2 JP H0628059B2 JP 1255492 A JP1255492 A JP 1255492A JP 25549289 A JP25549289 A JP 25549289A JP H0628059 B2 JPH0628059 B2 JP H0628059B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- word
- pointer
- stored
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は仮名漢字変換により漢字仮名混り文を入力する
文字処理装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Industrial application] The present invention relates to a character processing device for inputting a kanji / kana mixed sentence by kana / kanji conversion.
[従来の技術] 現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。[Prior Art] Currently, a character processing device such as a Japanese word processor generally inputs kanji-kana mixed sentences using kana-kanji conversion.
従来、仮名漢字変換用辞書は外部メモリ(フロッピーデ
ィスク、ハードディスク)に格納することが多かった。
ところが、一括変換等の変換方式面での改良が進むこと
により辞書アクセスの回数が増大し、また、そうでなく
ても、変換のスピードアップ要求が高まってきたことか
ら、辞書を高速アクセス可能な内部メモリに格納する方
式が主流となっている。Conventionally, the kana-kanji conversion dictionary was often stored in an external memory (floppy disk, hard disk).
However, due to improvements in conversion methods such as batch conversion, the number of dictionary accesses has increased. The method of storing in the internal memory is the mainstream.
内部メモリには、読込/書込ともに可能で揮発性(電源
を切ると記憶内容が消えてしまう)のRAMと、書込が
不可能であるが不揮発性(電源を切っても記憶内容が消
えない)のROMの2種類が一般に広く使用されてい
る。The internal memory is readable / writable RAM that is volatile (the contents are lost when the power is turned off), and non-writable but non-volatile (the contents are erased even when the power is turned off) There are two types of ROMs that are commonly used.
辞書をRAMに持つ場合、仮名漢字変換する前の準備と
して辞書を外部メモリからRAMにロードすることにな
るが、ロード時間がかかるという欠点があり、更に、R
AMの方がROMよりも高価であるためコストが高くな
るという欠点もある。このため、辞書はROMに記憶す
るのが一般的である。If the dictionary is stored in RAM, the dictionary will be loaded from external memory to RAM as preparation before Kana-Kanji conversion, but it has the drawback of requiring a long loading time.
Since AM is more expensive than ROM, it also has the disadvantage of higher cost. Therefore, the dictionary is generally stored in the ROM.
また、最近は、仮名漢字変換の変換率に対する要求も高
度化しているため、辞書が大容量化する傾向がある。In addition, recently, the demand for the conversion rate of Kana-Kanji conversion has become more sophisticated, so that the dictionary tends to have a large capacity.
このように辞書が大容量化されているため、個人個人に
とってみれば、絶対に使用しないと思われる単語が相当
多く辞書に記憶されていることになる。このような無駄
な単語は、単に無駄でメモリが勿体ないのは仕方がない
ことであるが、誤変換の原因ともなり、オペレータによ
っては存在しない方が有難い単語もある。Since the dictionary has a large capacity in this way, for an individual person, a large number of words that will never be used are stored in the dictionary. It is unavoidable that such a useless word is useless and wasteful of memory, but it is also a cause of erroneous conversion, and some words are more than appreciated by some operators.
例えば、単語数が増えた結果、「神戸(こうべ)」とい
う姓が辞書に格納され、また、「功(こう)」という名
前も辞書に格納されたとする。そのような辞書でオペレ
ータが「神戸港」を変換しようとして「こうべこう」と
打鍵したとすると、仮名漢字変換には通常「姓+名前」
のパターンを優先して変換する処理が組み込まれている
ので、オペレータの意図に反し「神戸功」と変換する可
能性が高い。For example, as a result of the increase in the number of words, it is assumed that the surname "Kobe" is stored in the dictionary and the name "Ko" is also stored in the dictionary. If an operator tries to convert "Kobe Port" with such a dictionary and then types "Kobeko", the Kana-Kanji conversion is usually "Last name + First name".
Since the process of converting the pattern of No. 1 with priority is incorporated, there is a high possibility that it will be converted to "Kobe Isao" against the operator's intention.
このような場合、「功」を「港」に変更すれば、学習が
働き、次回から「神戸港」は正しく変換される。ところ
が、「神戸」という姓が辞書上に存在する限り、「神戸
市」のつもりが「神戸氏」になり、「神戸産」のつもり
が「神戸さん」になるなど、あちこちで誤変換が生じ、
操作性を阻害する。In such a case, if "Gong" is changed to "Port", learning will work and "Kobe Port" will be correctly converted from the next time. However, as long as the surname "Kobe" exists in the dictionary, the intention of "Kobe city" becomes "Mr. Kobe", the intention of "Kobe product" becomes "Mr. Kobe", and misconversions occur here and there. ,
It impairs operability.
そもそも、「神戸」という姓は普通の人にとっては馴染
の薄い姓であり、辞書から削除するという解決策が手間
がなく最も効果が高い。ところが、通常、辞書はROM
上に存在するので、直接的に単語の削除を行なうことは
できない。In the first place, the surname "Kobe" is a familiar surname for ordinary people, and the solution of deleting it from the dictionary is the most effective because it has no trouble. However, the dictionary is usually ROM
Since it exists above, it is not possible to delete words directly.
ROM上の単語を削除する方法として、辞書ROM上の
単語の存在アドレスを記憶し、変換時にその位置の単語
を無視し使用しないようにする方式、削除すべき単語の
読み、表記、品詞などの単語情報を記憶し、変換時にそ
れと一致する単語がROM上の辞書に存在すれば、その
単語を無視し使用しないようにする方式、などが考えら
れる。As a method of deleting a word on the ROM, a method of storing the existing address of the word on the dictionary ROM and ignoring the word at that position during conversion and not using it, reading of the word to be deleted, notation, part of speech, etc. A method is conceivable in which word information is stored, and if a word that matches the word information is present in the dictionary at the time of conversion, the word is ignored and not used.
[発明が解決しようとしている問題点] しかし、上記の単語情報を記憶する方式による単語の削
除は、1単語削除する度にかなりのメモリを必要とする
ため、コストが高くなり、また、変換時に単語情報とマ
ッチングを取るのでは処理も複雑になり、変換時間も長
くなるという欠点がある。[Problems to be Solved by the Invention] However, deleting a word by the above-described method of storing word information requires a large amount of memory each time one word is deleted, resulting in a high cost, and at the time of conversion. Matching with word information has the drawbacks that the processing becomes complicated and the conversion time becomes long.
また、アドレスを記憶する方式による単語の削除では、
削除単語辞書は、辞書の内容が更新された時に使用でき
なくなってしまう。そのため、複数の種類の機械を使用
するオペレータはその機械語とに削除単語辞書を作成し
なければならず、データ互換性の点で問題がある。In addition, when deleting words by the method of storing addresses,
The deleted word dictionary becomes unusable when the contents of the dictionary are updated. Therefore, an operator who uses a plurality of types of machines must create a deleted word dictionary for the machine language, which is problematic in terms of data compatibility.
また、アドレスと単語情報の両方を記憶する方式も考え
られるが、そのときは仕様メモリが相当大きくなり、コ
ストがかかりすぎるという欠点がある。A method of storing both the address and the word information is also conceivable, but at that time, there is a drawback that the specification memory becomes considerably large and the cost is too high.
[問題点を解決するための手段(及び作用)] 上述の問題点を解決するために、本発明の文字処理装置
は、仮名文字列を入力するための入力手段と、単語の読
みと、表記を含む当該単語の単語情報とを対応させて記
憶するとともに、当該辞書を識別するための辞書識別情
報が記憶された書き換え不可能な第1の辞書手段と、該
第1の辞書手段を参照して、前記入力手段より入力され
た仮名文字列を、当該仮名文字列を読みとする単語の表
記に変換する変換手段と、該変換手段による変換の際に
無効とすべき単語の、書き換え不可能な辞書におけるポ
インタである第1のポインタと、該書き換え不可能な辞
書の辞書識別情報とを記憶するとともに、前記無効とす
べき単語の読みと、表記を含む当該無効とすべき単語の
単語情報とを対応させて記憶する第2の辞書手段と、前
記第1の辞書手段に記憶された単語のうち、前記変換手
段による変換において無効とすべき単語の前記第1の辞
書手段におけるポインタである第2のポインタを記憶す
るための無効単語ポインタ記憶手段と、前記第2の辞書
手段より前記無効単語ポインタ記憶手段へ、前記第1の
ポインタを前記第2のポインタとしてロードするロード
手段と、起動時に、前記第1の辞書手段に記憶されてい
る辞書識別情報と、前記第2の辞書手段に記憶されてい
る辞書識別情報とが一致するかを判定する判定手段と、
該判定手段によって、一致すると判定されたときには、
前記無効単語ポインタ記憶手段に、前記ロード手段によ
ってロードされる第1のポインタを前記第2のポインタ
として記憶し、不一致と判定されたときには、前記第1
の辞書手段を検索して前記第2の辞書手段に記憶されて
いる単語と読み及び単語情報が一致する単語の当該辞書
手段におけるポインタを求めて、前記無効単語ポインタ
記憶手段に、求められた該ポインタを第2のポインタと
して記憶するように制御する第1の制御手段と、前記変
換手段による変換において、前記入力された仮名文字列
を読みとする単語の前記第1の辞書手段におけるポイン
タを求め、求められた当該ポインタと一致するポインタ
が前記無効単語ポインタ記憶手段に記憶されているかを
判定し、記憶されていると判定された場合には、当該ポ
インタに対応する単語を変換対象から除外するように制
御する第2の制御手段とを具える。[Means (and Action) for Solving Problems] In order to solve the above-mentioned problems, the character processing device of the present invention has an input means for inputting a kana character string, a word reading, and a notation. The first non-rewritable dictionary means storing the dictionary identification information for identifying the dictionary and the first dictionary means while referring to the first dictionary means. And a conversion means for converting the kana character string input by the input means into a notation of a word in which the kana character string is read, and a word that should be invalidated at the time of conversion by the conversion means, cannot be rewritten. A first pointer which is a pointer in a valid dictionary and dictionary identification information of the non-rewritable dictionary, and reading of the invalid word and word information of the invalid word including notation Corresponds to and And a second pointer which is a pointer in the first dictionary means of a word to be invalidated in the conversion by the conversion means among the words stored in the first dictionary means. Invalid word pointer storage means for storing; load means for loading the first pointer as the second pointer from the second dictionary means to the invalid word pointer storage means; Determining means for determining whether or not the dictionary identification information stored in the dictionary means and the dictionary identification information stored in the second dictionary means match.
When the determination means determines that they match,
The first pointer loaded by the loading means is stored as the second pointer in the invalid word pointer storage means, and when it is determined that there is a mismatch, the first pointer is stored.
Of the dictionary means to find a pointer in the dictionary means for a word whose reading and word information matches the word stored in the second dictionary means, and the invalid word pointer storage means obtains the pointer. A first control means for controlling the pointer to be stored as a second pointer; and a pointer in the first dictionary means for a word whose reading is the inputted kana character string in the conversion by the converting means. It is determined whether a pointer that matches the obtained pointer is stored in the invalid word pointer storage means, and if it is determined that the pointer is stored, the word corresponding to the pointer is excluded from the conversion target. And a second control means for controlling.
[実施例] 以下図面を参照しながら本発明を詳細に説明する。EXAMPLES The present invention will be described in detail below with reference to the drawings.
第1図は本発明の全体構成の一例である。FIG. 1 is an example of the overall configuration of the present invention.
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。In the illustrated configuration, the CPU is a microprocessor, performs arithmetic operations for character processing, logical judgments, etc., and has an address bus AB, a control bus CB, and a data bus D.
Via B, each component connected to those buses is controlled.
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
の制御の対象とする各構成要素のコントロール信号を転
送して印加する。データバスDBは各構成機器相互間の
データの転送を行なう。The address bus AB transfers an address signal indicating a component to be controlled by the microprocessor CPU. Control bus CB is a microprocessor CPU
The control signals of the respective components to be controlled by are transferred and applied. The data bus DB transfers data between the constituent devices.
つぎにROMは、読出し専用の固定メモリであり、第1
0図〜第14図につき後述するマイクロプロセッサCP
Uによる制御の手順、及び、仮名漢字変換用辞書DIC
を記憶させておく。Next, the ROM is a fixed read-only memory.
Microprocessor CP described later with reference to FIGS. 0 to 14
U control procedure and kana-kanji conversion dictionary DIC
Remember.
また、RAMは、1ワード16ビットの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。DELDは削除単語
辞書であり、辞書DICから削除した単語を記憶する。
SWTBLはサーチ単語テーブルであり、仮名漢字変換
中に必要な単語の存在位置を一時的に記憶するためのテ
ーブルである。The RAM is a writable random access memory having a structure of 1 word 16 bits, and is used for temporary storage of various data from each constituent element. DELD is a deleted word dictionary and stores words deleted from the dictionary DIC.
SWTBL is a search word table, and is a table for temporarily storing the existence positions of words required during Kana-Kanji conversion.
KBはキーボードであって、アルファベットキー、ひら
かなキー、カタカナキー等の文字記号入力キー、及び、
変換キー、単語削除キー、実行キー等の本文字処理装置
に対する各種機能を指示するための各種のファンクショ
ンキーを備えている。KB is a keyboard, which is a character / symbol input key such as an alphabet key, a hiragana key, or a katakana key, and
Various function keys such as a conversion key, a word deletion key, and an execution key for instructing various functions for the character processing apparatus are provided.
DISKは文書データ、削除単語辞書DELDを記憶す
るための外部メモリである。文書、削除単語辞書DEL
Dは必要に応じて保管され、また、保管されたデータは
キーボードの指示により必要な時呼び出される。DISK is an external memory for storing the document data and the deleted word dictionary DELD. Document, delete word dictionary DEL
D is stored as needed, and the stored data is recalled when needed by a keyboard instruction.
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。後述するCRTコ
ントローラCRTCは、ここに蓄えられたアドレスに対
応する表示装置CRT上の位置にカーソルを表示する。CR is a cursor register. The CPU can read and write the contents of the cursor register. The CRT controller CRTC described later displays a cursor at a position on the display device CRT corresponding to the address stored here.
DBUFは表示用バッファメモリで、表示すべきデータ
のパターンを蓄える。DBUF is a display buffer memory that stores a pattern of data to be displayed.
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担
う。CRTC is cursor register CR and buffer DBUF
It plays the role of displaying the contents stored in the display CRT.
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドット構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。The CRT is a display device using a cathode ray tube or the like, and the display pattern of the dot configuration and the display of the cursor on the display device CRT are controlled by the CRT controller.
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。Further, CG is a character generator, which stores patterns of characters and symbols to be displayed on the display device CRT.
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラプト信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶してある各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。The character processing device of the present invention comprising the above-described components operates in response to various inputs from the keyboard KB. When an input from the keyboard KB is supplied, first, an interrupt signal is sent to the microprocessor CP.
The control signal is sent to U, the microprocessor CPU reads out various control signals stored in the ROM, and various controls are performed in accordance with these control signals.
第2図は本発明装置による変換操作の例を示した図であ
る。2−1はまず、読み列「こうべこう」を入力した時
の画面を示している。カーソルは入力読み列の次に表示
されている。ここで変換キーを打鍵すると2−2の画面
になる。2−2では読み列「こうべこう」が「神戸功」
と変換されている。これは望む変換ではないので、「神
戸」(姓)を辞書から単語削除するという操作を行なっ
て、その後もう一度「こうべこう」と入力すると2−3
の画面になる。ここで変換キーを再度打鍵すると2−4
の画面になり、今度は正しく「神戸港」と変換されてい
る。FIG. 2 is a diagram showing an example of conversion operation by the device of the present invention. 2-1 shows the screen when the reading column "Kobeko" is input. The cursor is displayed next to the input reading row. When the conversion key is pressed here, a screen 2-2 is displayed. In 2-2, the reading column “Kobeko” is “Kobe Isao”
Has been converted to. This is not the desired conversion, so delete the word "Kobe" (surname) from the dictionary, and then enter "Kobeko" again 2-3
Will be displayed. If you press the conversion key again here, 2-4
Is displayed, and this time it is correctly converted to "Kobe Port".
第3図は単語削除の操作を説明した図である。3−1は
初期画面を示しており、この状態で単語削除キーを打鍵
すると3−2の画面になる。3−2で単語削除が起動さ
れ、削除単語の入力ウインドウが表示されている。ここ
で削除すべき単語の読み「こうべ」をオペレータが入力
すると、ウインドウ中に削除単語の読みが表示され、3
−3の画面になる。更に変換キーを打鍵すると、「こう
べ」が「神戸」に変換されてウインドウ中に表示され、
3−4の画面となる。ここで実行キーを打鍵すると「神
戸」の表記と読みが取り込まれ、品詞の入力ウインドウ
が開き、3−5の画面になる。ここで品詞「姓」をオペ
レータが入力すると3−6の画面になる。ここで実行キ
ーを打鍵すると、読み「こうべ」表記「神戸」品詞
「姓」の単語が辞書より削除され、終了メッセージが3
−7に示すように表示される。FIG. 3 is a diagram explaining an operation for deleting a word. Reference numeral 3-1 indicates an initial screen, and when the word delete key is pressed in this state, a screen 3-2 is displayed. The word deletion is started in 3-2, and the input window for the deleted word is displayed. When the operator inputs the reading of the word to be deleted, "Kobe", the reading of the deleted word is displayed in the window.
-3 screen is displayed. When you press the conversion key further, "Kobe" is converted to "Kobe" and displayed in the window.
It becomes the screen of 3-4. When the enter key is pressed here, the notation and reading of "Kobe" are taken in, the part-of-speech input window opens, and the screen 3-5 appears. When the operator inputs the part-of-speech "surname", the screen of 3-6 appears. When the enter key is pressed here, the word with the reading "kobe" notation "Kobe" part-of-speech "surname" is deleted from the dictionary, and the end message is 3
It is displayed as shown in -7.
第4図は辞書DICの構成を示した図である。辞書はR
OM上に存在する。従って、内容を変更することはでき
ない。FIG. 4 is a diagram showing the structure of the dictionary DIC. Dictionary is R
Present on OM. Therefore, the contents cannot be changed.
辞書は先頭に「辞書バージョン」が格納される。これは
辞書の内容に変更があった時に更新されるようなデータ
であり、全く同じ内容を持つ辞書は同じ辞書バージョン
を持つ。後述するように削除単語のアドレス部を更新す
る必要があるかどうかはこの辞書バージョンで管理され
る。The dictionary stores "dictionary version" at the beginning. This is data that is updated when the contents of the dictionary are changed, and dictionaries with exactly the same contents have the same dictionary version. Whether or not the address part of the deleted word needs to be updated as described later is managed by this dictionary version.
辞書バージョンに引き続いて、単語データが格納され
る。各単語データは「読み」「表記」「品詞」からな
る。Word data is stored following the dictionary version. Each word data consists of "reading", "notation" and "part of speech".
「読み」には単語の読み情報、例えば、「神戸」であれ
ば「こうべ」が記憶される。コードはJIS X 0208コード
の下位バイトなどを使用し、1文字1バイトで格納され
る。"Yomi" stores word reading information, for example, "Kobe" for "Kobe". The code uses the lower byte of JIS X 0208 code and is stored as 1 byte per character.
「表記」には単語の表記情報、例えば、「神戸」であれ
ば、「神戸」という字面が1文字2バイトでJIS X 0208
コード等を使用して格納される。In the "notation", the notation information of the word, for example, if "Kobe" is used, the character "Kobe" is 2 bytes per character JIS X 0208
It is stored using code.
「品詞」は単語の品詞、例えば、「神戸」であれば、
「姓」「地名」などが格納される。“Part of speech” is the word's part of speech, for example, “Kobe”
“Last name”, “place name”, etc. are stored.
第5図は辞書DICに格納されるデータの例を示した図
である。図に示すように辞書の単語データが読みの昇順
(辞書式配列)で格納される。FIG. 5 is a diagram showing an example of data stored in the dictionary DIC. As shown in the figure, the word data of the dictionary is stored in ascending order of reading (lexicographic array).
第6図は削除単語辞書DELDの構成を示した図であ
る。FIG. 6 is a diagram showing the structure of the deleted word dictionary DELD.
削除単語辞書は外部メモリに保存されている。電源立ち
上げ時に必要部分が外部メモリから読み込まれ、RAM
にロードされる。The deleted word dictionary is stored in the external memory. The necessary parts are read from the external memory when the power is turned on, and the RAM
Loaded in.
削除単語辞書は3つの部分に分かれる。The deleted word dictionary is divided into three parts.
6−1は「辞書バージョン」を記憶する部分である。辞
書バージョンは削除単語辞書のアドレス部が作成された
時の辞書DICの辞書バージョンがそのまま記憶され
る。6-1 is a part for storing the "dictionary version". As the dictionary version, the dictionary version of the dictionary DIC when the address part of the deleted word dictionary is created is stored as it is.
6−2は実体部であり、第7図に詳述するように削除単
語の読み、表記、品詞が記憶される。Reference numeral 6-2 is an entity portion, in which readings, notations and parts of speech of deleted words are stored as will be described in detail with reference to FIG.
6−3はアドレス部であり、第8図に詳述するように削
除単語が辞書DIC上のどこに存在するかを示すポイン
タを記憶する。An address portion 6-3 stores a pointer indicating where the deleted word is on the dictionary DIC as described in detail in FIG.
なお、RAM上に常に存在するのは6−1の辞書バージ
ョンと6−3のアドレス部のみである。6−2の実体部
は普段は外部メモリにのみ存在する。アドレス部を再作
成する必要が生じた時に6−2の実体部が外部メモリよ
り一時的にRAMにロードされる。それ以外の状況で
は、実体部に相当するメモリは開放されており、別の目
的のために有効利用されている。Note that only the dictionary version 6-1 and the address part 6-3 are always present in the RAM. The entity portion 6-2 normally exists only in the external memory. When it becomes necessary to recreate the address part, the substance part 6-2 is temporarily loaded from external memory into RAM. In other situations, the memory corresponding to the real part is released and is effectively used for another purpose.
第7図は削除単語辞書実体部の詳細構成を示した図であ
る。FIG. 7 is a diagram showing the detailed structure of the deleted word dictionary entity.
「読み」「表記」「品詞」の3つのフィールドからな
り、削除単語の読み、表記、品詞が記憶される。It consists of three fields, "reading", "notation" and "part of speech", and stores the reading, notation and part of speech of the deleted word.
削除単語は、通常、辞書DICに存在するはずであり、
存在する時は辞書DIC上の読み、表記、品詞がそのま
ま記憶されることになる。The deleted word should normally be present in the dictionary DIC,
When it exists, the reading, the notation, and the part of speech on the dictionary DIC are stored as they are.
図中では削除単語1は「神戸」(姓)、削除単語2は
「内閣」(名詞)となっている。In the figure, the deleted word 1 is "Kobe" (surname) and the deleted word 2 is "Cabinet" (noun).
なお、削除単語として辞書DICに存在しない単語が記
述されていても一向に差し支えない。存在しない削除単
語は単に無視されるだけである。In addition, even if a word that does not exist in the dictionary DIC is described as a deleted word, it does not matter. Deleted words that do not exist are simply ignored.
第8図は削除単語辞書アドレス部の詳細構成を示した図
である。FIG. 8 is a diagram showing a detailed configuration of the deleted word dictionary address part.
削除単語辞書アドレス部には削除単語実体部に格納され
ている削除単語一つ一つに対して、その単語が辞書DI
Cのどこに存在するかを記憶している。In the deleted word dictionary address section, for each deleted word stored in the deleted word entity section, the word DI
It remembers where it exists in C.
削除単語辞書アドレス部は仮名漢字変換処理の高速化の
ために存在するデータであり、このデータがなくても、
実体部と、辞書DICとからいつでも再作成できる。The deleted word dictionary address part is data that exists for speeding up the kana-kanji conversion process. Even without this data,
It can be recreated at any time from the entity part and the dictionary DIC.
例えば、削除単語1は第7図によると「神戸」(姓)で
あるので、辞書DIC上の「神戸」(姓)の存在するア
ドレスを第1エントリーとして格納する。同様に削除単
語2については「内閣」(名詞)の存在するアドレスを
第2エントリーとして格納する。For example, since the deleted word 1 is “Kobe” (surname) according to FIG. 7, the address where “Kobe” (surname) on the dictionary DIC exists is stored as the first entry. Similarly, for the deleted word 2, the address where "Cabinet" (noun) exists is stored as the second entry.
削除単語辞書アドレス部は、辞書DICのバージョンに
依存するデータであり、作成された時の辞書DICの辞
書バージョンが削除単語辞書の先頭に格納される。ま
た、辞書DICのバージョンが変更した時は、削除単語
辞書実体部のデータを参照して再作成される。The deleted word dictionary address part is data depending on the version of the dictionary DIC, and the dictionary version of the dictionary DIC at the time of creation is stored at the head of the deleted word dictionary. Also, when the version of the dictionary DIC is changed, it is recreated by referring to the data of the deleted word dictionary entity.
第9図はサーチ単語テーブルSWTBLの構成を示した
図である。FIG. 9 is a diagram showing the structure of the search word table SWTBL.
サーチ単語テーブルは仮名漢字変換処理を行なう過程に
おいて、入力読み列の解析を行なうのに必要な単語が辞
書DICのどこに存在するかを一時的に記憶したテーブ
ルである。The search word table is a table that temporarily stores where in the dictionary DIC the words necessary for analyzing the input reading string are in the process of performing the kana-kanji conversion process.
例えば、入力読み列が「こうべこう」であったときは、
その解析のために「こ」「こう」「こうべ」「う」「う
べ」「べこ」「こう」などの単語が必要であり、それら
の単語の辞書DIC上の存在位置がフィールド「ポイン
タ」に記憶される。For example, when the input reading string is "Koubekou",
For this analysis, words such as "ko", "kou", "koube", "uu", "uube", "beko", "kou", etc. are necessary, and the location of those words on the dictionary DIC is the field "pointer". Memorized in.
上述の実施例の動作をフローに従って説明する。The operation of the above embodiment will be described according to the flow.
第10図はキー入力を取り込み、処理を行なう部分のフ
ローチャートである。FIG. 10 is a flow chart of a part for receiving a key input and performing a process.
ステップ10−1はアドレス作成処理であり、第11図
に示すように削除単語辞書の初期設定を行なう。この処
理は通常、電源ON直後に回だけ実行される。Step 10-1 is an address creating process, which initializes the deleted word dictionary as shown in FIG. This process is normally executed only immediately after the power is turned on.
ステップ10−2はキーボードからのデータを取り込む
処理である。ステップ10−3で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。Step 10-2 is a process of fetching data from the keyboard. The type of the key fetched in step 10-3 is determined, and the process branches to each key processing routine.
変換キーが入力されたときはステップ10−4に分岐
し、ステップ10−4において第12図に詳述するよう
に仮名漢字変換の変換処理が行なわれる。その後ステッ
プ10−2に分岐する。When the conversion key is input, the process branches to step 10-4, and the conversion process of kana-kanji conversion is performed in step 10-4 as described in detail in FIG. After that, the process branches to step 10-2.
単語削除キーが入力されたときはステップ10−5に分
岐し、ステップ10−5において第14図に詳述する単
語削除補処理が行なわれる。その後ステップ10−2に
分岐する。When the word deletion key is input, the process branches to step 10-5, and in step 10-5, the word deletion supplemental processing described in detail in FIG. 14 is performed. After that, the process branches to step 10-2.
その他のキーのときはステップ10−6に分岐し、挿
入、削除等の通常の文字処理装置において行なわれるそ
の他の処理が行なわれる。その後ステップ10−2に分
岐する。If the key is any other key, the process branches to step 10-6, and other processes such as insertion and deletion that are carried out in a normal character processing device are carried out. After that, the process branches to step 10-2.
第11図はステップ10−1の「アドレス作成処理」を
詳細化したフローチャートである。FIG. 11 is a detailed flowchart of the "address creation process" of step 10-1.
ステップ11−1において削除単語辞書の「辞書バージ
ョン」「アドレス部」を外部メモリからRAMにロード
する。In step 11-1, the "dictionary version" and "address part" of the deleted word dictionary are loaded from the external memory into the RAM.
ステップ11−2において削除単語辞書の辞書バージョ
ンと辞書DICの辞書バージョンを比較する。一致した
時はそのままリターンするが、一致しない時は削除単語
辞書アドレス部を再作成する必要があるので、ステップ
11−3に進む。In step 11-2, the dictionary version of the deleted word dictionary is compared with the dictionary version of the dictionary DIC. If they match, the process returns as it is, but if they do not match, it is necessary to recreate the deleted word dictionary address part, so the process proceeds to step 11-3.
ステップ11−3において、再作成のためにまずアドレ
ス部を初期化し、辞書DICの辞書バージョンを辞書バ
ージョンとして削除単語辞書に設定する。また、削除単
語辞書実体部を外部メモリからRAMに読み込む。In step 11-3, the address part is first initialized for re-creation, and the dictionary version of the dictionary DIC is set as the dictionary version in the deleted word dictionary. Also, the deleted word dictionary entity is read from the external memory into the RAM.
ステップ11−4において、削除単語を実体部から1単
語取り出す。In step 11-4, one word is deleted from the actual part.
ステップ11−5において全ての削除単語について処理
が終了したかどうか判定し、処理が終了している時はリ
ターンする。処理が終了していない時はステップ11−
6の削除単語アドレス決定に進む。In step 11-5, it is determined whether the processing has been completed for all the deleted words, and if the processing has been completed, the process returns. When the processing is not completed, step 11-
Proceed to 6 to determine the deleted word address.
ステップ11−6において、取り出された削除単語と同
じものが辞書DIC上のどこに存在するかサーチし、そ
のアドレスを求める。In step 11-6, it is searched where the same word as the extracted deleted word exists in the dictionary DIC to obtain the address.
ステップ11−7において、上記求めたアドレスを削除
単語辞書アドレス部に設定する。In step 11-7, the obtained address is set in the deleted word dictionary address part.
ついで、次の削除単語の処理を行なわないといけないの
でステップ11−4に分岐する。Then, since the next deleted word must be processed, the process branches to step 11-4.
第12図はステップ10−4の「変換処理」を詳細化し
たフローチャートである。FIG. 12 is a detailed flowchart of the “conversion process” in step 10-4.
ステップ12−1において入力読み列の解析に必要な単
語をサーチ単語テーブルSWTBLに登録するために第
13に詳述する単語サーチ処理を行なう。In step 12-1, the word search processing described in detail in the thirteenth step is performed in order to register the words necessary for analyzing the input reading string in the search word table SWTBL.
ステップ12−2において、形態素解析、構文解析等を
行なって入力読み列を解析し、文節候補を作成する。In step 12-2, morphological analysis, syntactic analysis, etc. are performed to analyze the input reading string, and bunsetsu candidates are created.
ステップ12−3において、各文節候補の尤度を計算
し、どの文節を変換するのが最も尤もらしいかを判断
し、第1候補として決定する。In step 12-3, the likelihood of each bunsetsu candidate is calculated, which bunsetsu is most likely to be converted is determined, and it is determined as the first candidate.
ステップ12−4において、決定された第1候補に基づ
いて変換結果を作成し、出力する。In step 12-4, a conversion result is created and output based on the determined first candidate.
第13図はステップ12−1の「単語サーチ処理」を詳
細化したフローチャートである。FIG. 13 is a detailed flowchart of the "word search process" in step 12-1.
ステップ13−1において、辞書DICより入力読み列
の解析に必要な単語の読み(サーチすべき読み)を1つ
決定する。In step 13-1, one reading (reading to be searched) of a word necessary for analyzing the input reading string is determined from the dictionary DIC.
ステップ13−2においてサーチすべき読みがなくなっ
たかどうか判定し、なくなった時はリターンする。In step 13-2, it is judged whether or not there are no more readings to be searched for, and when there is no more reading, the process returns.
ステップ13−3においてサーチすべき読みについて実
際に辞書DICをサーチし、アドレスを求める。In step 13-3, the dictionary DIC is actually searched for the reading to be searched for the address.
ステップ13−4において見つかったアドレスが削除単
語辞書アドレス部に記載されているかどうかを判定する
ため削除単語辞書アドレス部をサーチする。The deleted word dictionary address part is searched to determine whether the address found in step 13-4 is described in the deleted word dictionary address part.
ステップ13−5において一致するアドレスがあったか
どうか判定し、もし、存在すれば、その単語は削除され
たと見なされるから、そのまま、ステップ13−1に分
岐し、次のサーチ読みの処理に移る。存在しない時はそ
の単語は削除されていないからステップ13−6に進
み、サーチ単語テーブルにそのアドレスを登録する。In step 13-5, it is judged whether or not there is a matching address, and if it exists, it is considered that the word has been deleted. Therefore, the process directly branches to step 13-1 to proceed to the next search reading process. If it does not exist, the word has not been deleted, so the process proceeds to step 13-6, and the address is registered in the search word table.
第14図はステップ10−5の「単語削除処理」を詳細
化したフローチャートである。FIG. 14 is a detailed flowchart of the "word deletion process" in step 10-5.
ステップ14−1において、画面上に単語削除のための
表記入力のウインドウを表示する。In step 14-1, a notation input window for deleting words is displayed on the screen.
ステップ14−2において、削除単語の表記をオペレー
タから受付ける処理を行なう。オペレータが入力した読
み、選択した表記は内部メモリに一時的に取り込まれ
る。オペレータが表記を入力し、実行キーを打鍵した時
にステップ14−3に移ることになる。In step 14-2, a process of accepting the notation of the deleted word from the operator is performed. The reading entered by the operator and the selected notation are temporarily stored in the internal memory. When the operator inputs the notation and hits the execution key, the process proceeds to step 14-3.
ステップ14−3において、品詞入力のウインドウが表
示される。ここでオペレータの入力する品詞が内部メモ
リに取り込まれることになる。オペレータが品詞を入力
し、実行キーを打鍵すると次のステップ14−4に移
る。In step 14-3, a window for entering a part of speech is displayed. Here, the part of speech input by the operator is captured in the internal memory. When the operator inputs a part of speech and hits the execution key, the process proceeds to the next step 14-4.
ステップ14−4において、これまでの処理の結果得ら
れた読み、表記、品詞を削除単語データ実体部に登録す
る。実体部は通常RAM上に存在しないから外部メモリ
から読み込まれ登録されることになる。In step 14-4, the reading, the notation, and the part of speech obtained as a result of the processing so far are registered in the deleted word data entity part. Since the actual part does not normally exist in the RAM, it is read from the external memory and registered.
ステップ14−5において、今削除された単語の辞書D
IC上でのアドレスを求める。In step 14-5, the dictionary D of the word just deleted
Find the address on the IC.
ステップ14−6において、求められたアドレスを削除
単語データアドレスにも登録する。In step 14-6, the obtained address is also registered in the deleted word data address.
ステップ14−7において単語削除の終了処理を行な
う。すなわち、削除単語辞書全体を外部メモリに保存
し、RAM上にある実体部の領域を開放し、終了メッセ
ージをウインドウ上に表示する。適当なタイミングでウ
インドウを消去してからリターンする。In step 14-7, the word deletion ending process is performed. That is, the entire deleted word dictionary is stored in the external memory, the real part area in the RAM is opened, and the end message is displayed on the window. Delete the window at an appropriate timing and then return.
[他の実施例] 以上の説明において、辞書の格納されるメモリとしてR
OMの場合を説明したが、書込不可なメモリであれば事
情は全て同じであり、本発明を適用可能である。例え
ば、光ディスク、CDROMなどであっても、書込がで
きないため直接単語を削除することはできないが、本発
明の原理で削除することはできる。[Other Embodiments] In the above description, R is used as the memory for storing the dictionary.
Although the case of the OM has been described, the situation is the same for all non-writable memories, and the present invention is applicable. For example, even if it is an optical disk, a CDROM, etc., it is not possible to directly delete the word because it cannot be written, but it can be deleted according to the principle of the present invention.
また、削除単語辞書の持ち方としてアドレスを持つよう
にしたが、アドレス以外であっても辞書のバージョンに
依存するような持ち方であれば、やはり事情が同じであ
るので、本発明を適用できる。例えば、辞書の先頭から
の単語の連番で記憶するようにしても同様の構成で処理
することができる。Further, although the deletion word dictionary has an address as a way of holding, if the way of holding other than the address depends on the version of the dictionary, the situation is the same, so the present invention can be applied. . For example, the same configuration can be performed by storing the serial numbers of words from the beginning of the dictionary.
また、削除単語辞書の持ち方として単語の読み、表記、
品詞を持つようにしたが、他にも記憶すべき単語情報が
あれば、記憶する必要があり、また、マッチングに関係
のない情報であれば、記憶を省略することができる。例
えば、辞書中に、頻度が異なり、読み、表記、品詞が一
致する単語が存在するなら、頻度も削除単語辞書に記憶
する必要がある。ところが、読み、表記、品詞が一致
し、頻度のみ異なる単語が存在しないのであれば、無理
をして頻度を削除単語辞書に記憶する必要はない。Also, as a way of holding a deleted word dictionary, reading, notation of words,
Although it has a part of speech, if there is other word information to be stored, it is necessary to store it, and if it is information that is not related to matching, the storage can be omitted. For example, if there are words in the dictionary that differ in frequency and have the same reading, notation, and part of speech, the frequency also needs to be stored in the deleted word dictionary. However, if there are no words that have the same reading, notation, and part of speech and differ only in frequency, there is no need to overdo and store the frequency in the deleted word dictionary.
[発明の効果] 以上説明したように、本発明によれば、書き換え不可能
な辞書にある単語について、無効とすべき単語の辞書上
のポインタを記憶し、このポインタを参照して、書き換
え不可能な辞書中の単語を無効とするようにし、このポ
インタを得るために、ある辞書において定めた無効とす
べき単語について、その辞書上のポインタと単語情報自
体とを記憶しておき、辞書の識別情報が一致する場合
は、そのポインタをロードして利用し、不一致の場合
は、単語情報から新たにポインタを作成して利用するよ
うにしたので、辞書のバージョンが異なっても、以前に
定めた無効とすべき単語を無効にでき、特に辞書のバー
ジョンが一致している場合は、新たにポインタを作成す
る必要がなく、無効を実現するためのポインタが簡単に
得られるという効果がある。[Effects of the Invention] As described above, according to the present invention, for a word in a dictionary that cannot be rewritten, a pointer in the dictionary of the word that should be invalidated is stored, and by referring to this pointer, rewriting cannot be performed. In order to invalidate a word in a possible dictionary and obtain this pointer, the pointer in the dictionary and the word information itself are stored for the word to be invalid defined in a dictionary, and the dictionary If the identification information matches, the pointer is loaded and used, and if it does not match, a new pointer is created from the word information and used. You can invalidate a word that should be invalidated, especially if the dictionary versions match, you do not need to create a new pointer and you can easily obtain a pointer to realize invalidation. Has the effect of
第1図は本発明の全体構成のブロック図、 第2図は本発明における仮名漢字変換の操作例を示した
図、 第3図は本発明における単語削除の操作の例を示した
図、 第4図は本発明における辞書DICの構成を示した図、 第5図は本発明における辞書DICに格納される単語の
例を示した図、 第6図は本発明における削除単語辞書の全体構成をを示
した図、 第7図は本発明における削除単語辞書実体部の構成を示
した図、 第8図は本発明における削除単語辞書アドレス部の構成
を示した図、 第9図は本発明におけるサーチ単語テーブルの構成を示
した図、 第10図〜第14図は本発明文字処理装置の動作を示す
フローチャート。 DISK…外部メモリ CPU…マイクロプロセッサ ROM…読出し専用メモリ RAM…ランダムアクセスメモリ DIC…仮名漢字変換用辞書 DELD…削除単語辞書 SWTBL…サーチ単語テーブルFIG. 1 is a block diagram of the overall configuration of the present invention, FIG. 2 is a diagram showing an operation example of kana-kanji conversion in the present invention, FIG. 3 is a diagram showing an example of operation of word deletion in the present invention, FIG. 4 is a diagram showing the structure of the dictionary DIC of the present invention, FIG. 5 is a diagram showing an example of words stored in the dictionary DIC of the present invention, and FIG. 6 is a general structure of the deleted word dictionary of the present invention. FIG. 7, FIG. 7 is a diagram showing a configuration of a deleted word dictionary entity part in the present invention, FIG. 8 is a diagram showing a configuration of a deleted word dictionary address part in the present invention, and FIG. The figure which showed the structure of the search word table, FIGS. 10-14 are the flowcharts which show operation | movement of the character processing apparatus of this invention. DISK ... External memory CPU ... Microprocessor ROM ... Read-only memory RAM ... Random access memory DIC ... Kana-kanji conversion dictionary DELD ... Deleted word dictionary SWTBL ... Search word table
Claims (1)
させて記憶するとともに、当該辞書を識別するための辞
書識別情報が記憶された書き換え不可能な第1の辞書手
段と、 該第1の辞書手段を参照して、前記入力手段より入力さ
れた仮名文字列を、当該仮名文字列を読みとする単語の
表記に変換する変換手段と、 該変換手段による変換の際に無効とすべき単語の、書き
換え不可能な辞書におけるポインタである第1のポイン
タと、該書き換え不可能な辞書の辞書識別情報とを記憶
するとともに、前記無効とすべき単語の読みと、表記を
含む当該無効とすべき単語の単語情報とを対応させて記
憶する第2の辞書手段と、 前記第1の辞書手段に記憶された単語のうち、前記変換
手段による変換において無効とすべき単語の前記第1の
辞書手段におけるポインタである第2のポインタを記憶
するための無効単語ポインタ記憶手段と、 前記第2の辞書手段より前記無効単語ポインタ記憶手段
へ、前記第1のポインタを前記第2のポインタとしてロ
ードするロード手段と、 起動時に、前記第1の辞書手段に記憶されている辞書識
別情報と、前記第2の辞書手段に記憶されている辞書識
別情報とが一致するかを判定する判定手段と、 該判定手段によって、一致すると判定されたときには、
前記無効単語ポインタ記憶手段に、前記ロード手段によ
ってロードされる第1のポインタを前記第2のポインタ
として記憶し、不一致と判定されたときには、前記第1
の辞書手段を検索して前記第2の辞書手段に記憶されて
いる単語と読み及び単語情報が一致する単語の当該辞書
手段におけるポインタを求めて、前記無効単語ポインタ
記憶手段に、求められた該ポインタを第2のポインタと
して記憶するように制御する第1の制御手段と、 前記変換手段による変換において、前記入力された仮名
文字列を読みとする単語の前記第1の辞書手段における
ポインタを求め、求められた当該ポインタと一致するポ
インタが前記無効単語ポインタ記憶手段に記憶されてい
るかを判定し、記憶されていると判定された場合には、
当該ポインタに対応する単語を変換対象から除外するよ
うに制御する第2の制御手段とを有することを特徴とす
る文字処理装置。1. An input means for inputting a kana character string, a word reading, and word information of the word including a notation are stored in association with each other, and dictionary identification information for identifying the dictionary is stored. The stored non-rewritable first dictionary means, and referring to the first dictionary means, converts the kana character string input from the input means into a notation of a word in which the kana character string is read. And a first identification point, which is a pointer in a non-rewritable dictionary of a word to be invalidated in the conversion by the conversion means, and dictionary identification information of the non-rewritable dictionary. A second dictionary means for storing the reading of the word to be invalidated and the word information of the word to be invalidated including the notation in association with each other, and among the words stored in the first dictionary means , By the conversion means Invalid word pointer storage means for storing a second pointer which is a pointer in the first dictionary means of a word to be invalidated in the conversion, and the second dictionary means to the invalid word pointer storage means, Loading means for loading the first pointer as the second pointer, dictionary identification information stored in the first dictionary means at startup, and dictionary identification stored in the second dictionary means Determining means for determining whether the information matches, and when the determining means determines that they match,
The first pointer loaded by the loading means is stored as the second pointer in the invalid word pointer storage means, and when it is determined that there is a mismatch, the first pointer is stored.
Of the dictionary means to find a pointer in the dictionary means for a word whose reading and word information matches the word stored in the second dictionary means, and the invalid word pointer storage means obtains the pointer. A first control means for controlling the pointer to be stored as a second pointer; and a pointer in the first dictionary means for the word whose reading is the input kana character string in the conversion by the conversion means. , It is determined whether a pointer that matches the obtained pointer is stored in the invalid word pointer storage means, and if it is determined that the pointer is stored,
A character processing device comprising: a second control unit that controls so as to exclude the word corresponding to the pointer from the conversion target.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1255492A JPH0628059B2 (en) | 1989-09-29 | 1989-09-29 | Character processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1255492A JPH0628059B2 (en) | 1989-09-29 | 1989-09-29 | Character processor |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03116367A JPH03116367A (en) | 1991-05-17 |
| JPH0628059B2 true JPH0628059B2 (en) | 1994-04-13 |
Family
ID=17279506
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1255492A Expired - Fee Related JPH0628059B2 (en) | 1989-09-29 | 1989-09-29 | Character processor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0628059B2 (en) |
-
1989
- 1989-09-29 JP JP1255492A patent/JPH0628059B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH03116367A (en) | 1991-05-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS619753A (en) | Automatic registration method of frequently occurring phrases in a document processing device | |
| JPH0628059B2 (en) | Character processor | |
| JPH0630104B2 (en) | Character processor | |
| JPH0628060B2 (en) | Character processor | |
| JPH03116366A (en) | Character processor | |
| JP2786260B2 (en) | Kana-Kanji conversion device | |
| JP3809238B2 (en) | Document processing method and apparatus | |
| JPS6246029B2 (en) | ||
| JPH0576066B2 (en) | ||
| JP2862236B2 (en) | Character processor | |
| JPH0447451A (en) | character processing device | |
| JPH0351959A (en) | Electronic dictionary | |
| JPH0628062B2 (en) | Character processing apparatus and method | |
| JPH05135010A (en) | Character processing method and device therefor | |
| JPH01204174A (en) | Character processor | |
| JPH02165270A (en) | character processing device | |
| JPH0628061B2 (en) | Character processing apparatus and method | |
| JPH0447442A (en) | Character processing device and method | |
| JPH01214967A (en) | Character processing device and method | |
| JPH0731679B2 (en) | Character processor | |
| JPH056359A (en) | Character processor | |
| JPH0769907B2 (en) | Character processor | |
| JPH0447443A (en) | character processing device | |
| JPH03116364A (en) | Character processor | |
| JPH0769906B2 (en) | Character processor |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |