Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0628064B2 - Character processor - Google Patents
[go: Go Back, main page]

JPH0628064B2 - Character processor - Google Patents

Character processor

Info

Publication number
JPH0628064B2
JPH0628064B2 JP63319922A JP31992288A JPH0628064B2 JP H0628064 B2 JPH0628064 B2 JP H0628064B2 JP 63319922 A JP63319922 A JP 63319922A JP 31992288 A JP31992288 A JP 31992288A JP H0628064 B2 JPH0628064 B2 JP H0628064B2
Authority
JP
Japan
Prior art keywords
character string
character
document
constraint condition
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63319922A
Other languages
Japanese (ja)
Other versions
JPH02165270A (en
Inventor
博康 伊藤
和世 池田
英一郎 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63319922A priority Critical patent/JPH0628064B2/en
Publication of JPH02165270A publication Critical patent/JPH02165270A/en
Publication of JPH0628064B2 publication Critical patent/JPH0628064B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文書中からある条件を満たす文字列を抽出する
機能を有する文字処理装置に関するものである。
TECHNICAL FIELD The present invention relates to a character processing device having a function of extracting a character string satisfying a certain condition from a document.

[従来の技術] 日本語ワード・プロセッサなど日本文を処理する文字処
理装置において、文書中からある条件を満たす文字列を
抽出する手段として、抽出の対象となる文字列を格納し
た「パターン・マッチング辞書」を用意し、文書中の文
字列とパターン・マッチング辞書中の文字列とのマッチ
ングを行い、マッチングが取れた文字列を抽出する方法
がある。
[Prior Art] In a character processing device such as a Japanese word processor for processing Japanese sentences, as a means for extracting a character string satisfying a certain condition from a document, "pattern matching" in which a character string to be extracted is stored. There is a method of preparing a “dictionary”, matching the character string in the document with the character string in the pattern matching dictionary, and extracting the matched character string.

例えば校正指摘処理において、あいまいな表現の「的」
という文字列を指摘したい場合、パターン・マッチング
辞書に「的」を登録しておけば、「質的」「慣用的」等
の「的」を指摘することができる。
For example, in the proofreading process, the ambiguous "target"
If you want to point out the character string, you can point out "target" such as "qualitative" or "conventional" by registering "target" in the pattern matching dictionary.

[発明が解決しようとしている課題] しかしこの方法によって、単純にマッチングを取っただ
けでは、形態素解析、構文解析等を行っていないので、
パターン・マッチング辞書中の文字列と違った意味で用
いられている文字列ともマッチングが取れてしまうこと
がある。
[Problems to be solved by the invention] However, since morphological analysis, syntactic analysis, etc. are not performed by simply matching with this method,
In some cases, a character string used in a different meaning from the character string in the pattern matching dictionary may be matched.

例えば、先の校正指摘処理の例において、あるまいな表
現の「的」を指摘したい場合、「質的」「慣用的」等と
共に、あいまいな表現ではない「的確」「目的」「的を
射る」等の「的」も指摘されてしまう欠点があった。
For example, in the previous example of proofreading processing, if you want to point out the "target" of a vague expression, "qualitative""purpose" and "target" that are not ambiguous with "qualitative""conventional" There was a drawback that "target" such as "is pointed out.

[課題を解決するための手段(及び作用)] 本発明によれば、文字処理装置に、文書を記憶する文書
記憶手段と、文書中より検出すべき文字列を格納した辞
書手段と、該辞書手段に記憶された文字列と一致する文
字列を前記文書記憶手段に記憶された文書中より検索す
る検索手段と、前記辞書手段に記憶された検出すべき文
字列に関して、文書中で当該検出すべき文字列の前後の
文字列が満たすべき、あるいは満たすべきでない制約条
件を記憶する制約条件記憶手段と、前記検索手段により
文書中から検索された文字列の前後の文書列が、該検索
された文字列を検出すべき文字列とするときの前後の文
字列として適するか否かを、前記制約条件記憶手段に記
憶された制約条件に基づいて判定する判定手段と、前記
検索手段により検索された文字列のうち、該文字列の前
後の文字列が前記判定手段により適すると判定された文
字列を、文書中で他の文字列と識別表示させる表示制御
手段とを具えることにより、単に文字列そのものが検出
すべき文字列と一致するばかりでなく、前後の文字列も
制約条件に基づいて適切である場合に、検出され、識別
表示されるようにしたものである。
[Means (and Action) for Solving the Problem] According to the present invention, the character processing device includes a document storage unit that stores a document, a dictionary unit that stores a character string to be detected from the document, and the dictionary. The search means for searching the document stored in the document storage means for a character string that matches the character string stored in the means, and the character string to be detected stored in the dictionary means are detected in the document. The constraint condition storage means for storing constraint conditions that should be satisfied or not satisfied by the character strings before and after the power string, and the document strings before and after the character string retrieved from the document by the retrieval means are searched. A determination unit that determines whether or not the character string is suitable as a character string before and after the character string is to be detected based on the constraint condition stored in the constraint condition storage unit, and is searched by the search unit. Sentence A character string that is determined by the judging means to be suitable for the character strings before and after the character string is provided with display control means for distinguishing the character string from other character strings in the document. Not only does the string itself match the character string to be detected, but the character strings before and after it are also detected based on the constraint conditions and are detected and displayed.

[実施例] 以下図面を参照しながら本発明の実施例を詳細に説明す
る。
Embodiments Embodiments of the present invention will be described in detail below with reference to the drawings.

第1図は、本発明の実施例に係る文字処理装置の全体構
成を示すブロック図である。
FIG. 1 is a block diagram showing the overall configuration of a character processing device according to an embodiment of the present invention.

図示の構成において、1は、マイクロプロセッサCPU
であり、文字処理のための演算、論理判断等を行い、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
In the configuration shown, 1 is a microprocessor CPU
The address bus AB, the control bus CB, and the data bus D are used to perform calculations and logical judgments for character processing.
Via B, each component connected to those buses is controlled.

アドレスバスABはマイクロプロセッサCPU1の制御
の対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
1の制御の対象とする各構成要素のコントロール信号を
転送して印加する。データバスDBは各構成機器相互間
のデータの転送を行う。
The address bus AB transfers an address signal indicating a component to be controlled by the microprocessor CPU1. Control bus CB is a microprocessor CPU
The control signals of the respective constituent elements to be controlled by No. 1 are transferred and applied. The data bus DB transfers data between the constituent devices.

つぎに2は、読出し専用の固定メモリROMであり、第
4図〜第7図につき後述するマイクロプロセッサCPU
1による制御の手順、及び、パターン・マッチング辞書
KSPMD2a、単語辞書WD2b、文法辞書GD2c
等の固定データを記憶させておく。
Next, reference numeral 2 denotes a read-only fixed memory ROM, which is a microprocessor CPU described later with reference to FIGS.
1, the pattern matching dictionary KSPMD2a, the word dictionary WD2b, the grammar dictionary GD2c
Store fixed data such as.

また、3は、1ワード16ビットの構成の書込み可能の
ランダムアクセスメモリRAMであって、各構成要素か
らの各種データの一時記憶に用いる。3aはテキストバ
ッファTBUFであり、作成編集される文書データを記
憶するエリアである。
Reference numeral 3 is a writable random access memory RAM having a structure of 1 word and 16 bits, and is used for temporary storage of various data from each constituent element. A text buffer TBUF 3a is an area for storing document data to be created and edited.

4はキーボードKBであって、アルファベットキー、ひ
らかなキー、カタカナキー等の文字記号入力キー、及
び、カーソル移動キー、仮名漢字変換キー、校正指摘キ
ー、指摘項目選択キー等の本文字処理装置に対する各種
機能を指示するための各種のファンクションキーを備え
ている。
Reference numeral 4 denotes a keyboard KB for inputting character symbols such as alphabet keys, hiragana keys, katakana keys, etc., and this character processing device such as cursor movement keys, kana-kanji conversion keys, proofreading pointing keys, pointing item selecting keys, etc. It is equipped with various function keys for instructing various functions.

5は文書データを記憶するための外部記憶装置DISK
であり、テキストバッファTBUF3a上に作成された
文書データの保管を行い、保管された文書データはキー
ボードKB4の指示により、必要な時呼び出される。
5 is an external storage device DISK for storing document data
The document data created in the text buffer TBUF3a is stored, and the stored document data is called when necessary by the instruction of the keyboard KB4.

6はカーソルレジスタCRである。CPU1により、カ
ーソルレジスタCR6の内容を読み書きできる。
Reference numeral 6 is a cursor register CR. The CPU 1 can read and write the contents of the cursor register CR6.

7は表示用バッファメモリDBUFで、表示すべきデー
タのパターンを蓄える。文書データの内容の表示を行う
ときは、テキストバッファTBUF3a上のデータに基
いてDBUF7上にパターンを展開することにより行わ
れる。
A display buffer memory DBUF 7 stores a pattern of data to be displayed. When displaying the contents of the document data, the pattern is developed on the DBUF 7 based on the data on the text buffer TBUF 3a.

8はカーソルレジスタCR及びバッファDBUFに蓄え
られた内容を表示器CRT9に表示する役割を担うCR
TコントローラCRTCである。
Reference numeral 8 is a CR which plays a role of displaying the contents stored in the cursor register CR and the buffer DBUF on the display CRT9.
It is a T controller CRTC.

また9は陰極線管等を用いた表示装置CRTであり、そ
の表示装置CRT9におけるドット構成の表示パターン
およびカーソルの表示をCRTコントローラ8で制御す
る。
Further, reference numeral 9 is a display device CRT using a cathode ray tube or the like, and the display pattern of the dot configuration and the display of the cursor on the display device CRT 9 are controlled by the CRT controller 8.

さらに、10はキャラクタジェネレータCGであって、
表示装置CRT9に表示する文字、記号のパターンを記
憶するものである。
Further, 10 is a character generator CG,
It stores a pattern of characters and symbols displayed on the display device CRT9.

かかる各構成要素からなる本発明文字処理装置において
は、キーボードKB4からの各種の入力に応じて作動す
るものであって、キーボードKB4からの入力が供給さ
れると、まず、インタラプト信号がマイクロプロセッサ
CPU1に送られ、そのマイクロプロセッサCPU1が
ROM2内に記憶してある各種の制御信号を読出し、そ
れらの制御信号に従って各種の制御が行われる。
The character processing device of the present invention comprising the above-described components operates in response to various inputs from the keyboard KB4. When an input from the keyboard KB4 is supplied, first, an interrupt signal is sent to the microprocessor CPU1. The microprocessor CPU1 reads out various control signals stored in the ROM2, and various controls are performed in accordance with these control signals.

第2図は、本発明におけるCRT表示装置9の画面表示
の一例である。図中、9aは表示画面を意味する。この
表示画面9aには、テキストバッファTBUF3aに記
憶されている文書データの内容が表示される。
FIG. 2 is an example of a screen display of the CRT display device 9 in the present invention. In the figure, 9a means a display screen. The contents of the document data stored in the text buffer TBUF3a are displayed on the display screen 9a.

第2図(a)に示すように、表示画面9a上の文書「質
的」「慣用的」「的確」「目的」「的を射る」に対し、
操作者が校正指摘キーを入力すると、表示画面9a上に
指摘項目選択メニュー9bがウインドウ表示される。
As shown in FIG. 2 (a), for the document "qualitative""conventional""correct""purpose""shoot at target" on the display screen 9a,
When the operator inputs the proofreading pointing key, the pointing item selection menu 9b is displayed in a window on the display screen 9a.

指摘項目選択キーによりあいまいな表現の指摘を選択し
これを入力すると、第2図(b)に示すように指摘項目
「あいまいな表現」9cがウインドウ表示され、マッチ
ングが行われ、「質的」「慣用的」の「的」があいまい
な表現として指摘されるが、「的確」「目的」「的を射
る」の「的」は指摘されない。ここで、指摘箇所にはア
ンダーラインが引かれる。
When you point out an ambiguous expression with the pointing item selection key and enter it, the pointing item "Ambiguous expression" 9c is displayed in a window as shown in FIG. The "target" of "conventional" is pointed out as a vague expression, but the "target" of "appropriate", "purpose" and "shooting" is not pointed out. Here, the indicated point is underlined.

第3図は、本発明におけるパターン・マッチング辞書K
SPMD2aの構成の一例である。
FIG. 3 shows the pattern matching dictionary K in the present invention.
It is an example of a structure of SPMD2a.

「見出し」にはマッチングの対象となる文字列データが
記憶されている。
Character string data to be matched is stored in the “heading”.

「制約条件」には制約条件の種類が記憶されており、こ
れに従いそれぞれの処理を行う。また「制約条件」が記
憶されていない場合は、制約条件がないと見なす。「制
約条件パラメータ」には制約条件の詳細が記憶されてい
る。また制約条件がない場合、「制約条件パラメータ」
は記憶されていない。
The type of the constraint condition is stored in the “constraint condition”, and each processing is performed according to this. If the "constraint condition" is not stored, it is considered that there is no constraint condition. The details of the constraint condition are stored in the “constraint condition parameter”. If there is no constraint condition, "Constraint condition parameter"
Is not remembered.

例えば、「的」という見出しにおいて、制約条件は
「1」であり、制約条件パラメータは「(的)確」
「(的)中」「[文頭](的)」「目(的)」「射
(的)」である。ここで[文頭]は文字そのものではな
く文字の種類を意味し、「文頭を表す文字」のことであ
る。また制約条件「1」は、「マッチングの取れた文書
データ中の文字列データの前後の文字列データが、制約
条件パラメーに記述された文字列データと一致しない場
合のみマッチングが取れたとする」ことを意味する。
For example, in the heading "Target", the constraint condition is "1" and the constraint condition parameter is "(target) accurate".
They are “(target) middle”, “[sentence] (target)”, “eye (target)” and “shoot (target)”. Here, the [text beginning] means not the character itself but the type of the character, and is the “character representing the beginning of the text”. The constraint condition “1” is “assuming that the matching can be achieved only when the character string data before and after the character string data in the matched document data does not match the character string data described in the constraint condition parameter”. Means

第4図は、本発明に係る文字処理装置の校正指摘処理を
示すフロー・チャートである。
FIG. 4 is a flow chart showing the proofreading process of the character processing device according to the present invention.

ステップ4−1において、操作者が校正指摘キーを入力
すると、ステップ4−2において「指摘項目メニュー」
を表示装置9の表示画面に表示する。
When the operator inputs the proofreading pointing key in step 4-1, "pointing item menu" is displayed in step 4-2.
Is displayed on the display screen of the display device 9.

次に、ステップ4−3において、操作者が指摘項目選択
キーを入力する。
Next, in step 4-3, the operator inputs the indicated item selection key.

ステップ4−4において、文書データ中の文字列データ
と、パターン・マッチング辞書中の文字列データとのマ
ッチングを行い、マッチングが取れている場合はマッチ
ングの取れた文書データ中の文字列データの前後の文字
列データが制約条件を満たしているか否かの判定を行
う。マッチングが取れかつ制約条件を満たしている場
合、またはマッチングが取れかつ制約条件がない場合は
マッチング取れたとし、マッチングが取れなかった場
合、またはマッチングは取れたが制約条件を満たしてい
ない場合はマッチングが取れなかったとし、ステップ4
−5に進む。ステップ4−5におけるパターンマッチン
グの詳細は第5図に示す。
In step 4-4, the character string data in the document data is matched with the character string data in the pattern matching dictionary, and if there is a match, before and after the character string data in the matched document data. It is determined whether or not the character string data of is satisfying the constraint condition. Matching is possible if matching is possible and the constraint conditions are satisfied, or if matching is possible and there is no constraint condition, and matching is not possible, or if matching is successful but the constraint conditions are not satisfied. If you can't get it, step 4
Go to -5. Details of the pattern matching in step 4-5 are shown in FIG.

ステップ4−5において、マッチングが取れていればス
テップ4−6に分岐する。マッチングが取れていなけれ
ばステップ4−7に分岐する。
If matching is found in step 4-5, the process branches to step 4-6. If no match is found, the process branches to step 4-7.

ステップ4−5においては、表示されている文書データ
中の文字列データをアンダーライン等により指摘する。
ステップ4−6においては、文書データ中の文字列デー
タに何もせず指摘しない。
In step 4-5, the character string data in the displayed document data is pointed out by underlining or the like.
In step 4-6, nothing is done on the character string data in the document data and no indication is made.

第5図は、第4図に示すステップ4−4の詳細をを示す
フロー・チャートである。
FIG. 5 is a flow chart showing details of step 4-4 shown in FIG.

ステップ5−1において、指摘項目を判別し、ステップ
5−2に進む。
In step 5-1, the pointed item is discriminated and the process proceeds to step 5-2.

ステップ5−2において、文書データ中の文字列データ
とパターン・マッチング辞書中の文字列データとのマッ
チングが取れているか否かの判定を行い、ステップ5−
3に進む。
In step 5-2, it is determined whether or not the character string data in the document data and the character string data in the pattern matching dictionary have been matched, and then in step 5-
Go to 3.

ステップ5−3において、マッチングが取れていればス
テップ5−4に分岐する。マッチングが取れていなけれ
ばステップ5−7に分岐する。
If matching is found in step 5-3, the process branches to step 5-4. If no match is found, the process branches to step 5-7.

ステップ5−4において、マッチングの取れた文書デー
タの文字列データの前後の文字列データがパターン・マ
ッチング辞書中に記述された制約条件を満たしているか
否かの判定を行い、ステップ5−5に進む。ステップ5
−5の制約条件を満たしているか否かの判定の詳細は第
6図に示す。
In step 5-4, it is determined whether or not the character string data before and after the character string data of the matched document data satisfies the constraint condition described in the pattern matching dictionary, and the process proceeds to step 5-5. move on. Step 5
Details of the determination as to whether or not the constraint condition of -5 is satisfied are shown in FIG.

ステップ5−5において、制約条件を満たしていればス
テップ5−6に分岐する。制約条件を満たしていなけれ
ばステップ5−7に分岐するしてステップ5−6におい
てマッチングが取れたとする。制約条件を満たしていな
ければ、ステップ5−7においてマッチングが取れなか
ったとする。
If the constraint condition is satisfied in step 5-5, the process branches to step 5-6. If the constraint condition is not satisfied, the process branches to step 5-7, and it is assumed that the matching is obtained in step 5-6. If the constraint condition is not satisfied, it is assumed that no matching is obtained in step 5-7.

第6図は、第5図のステップ5−4の詳細をを示すフロ
ー・チャートである。
FIG. 6 is a flow chart showing details of step 5-4 in FIG.

ステップ6−1において、制約条件が記憶されているか
否かの判定を行い、ステップ6−2に進む。
In step 6-1, it is determined whether or not the constraint condition is stored, and the process proceeds to step 6-2.

ステップ6−2において、制約条件が記憶されていれば
ステップ6−3に分岐する。制約条件が記憶されていな
ければステップ6−6に分岐する。
If the constraint condition is stored in step 6-2, the process branches to step 6-3. If the constraint condition is not stored, the process branches to step 6-6.

ステップ6−3において制約条件の種類を判別し、ステ
ップ6−4に進む。
In step 6-3, the type of constraint condition is determined, and the process proceeds to step 6-4.

ステップ6−4において、マッチングの取れた文書デー
タ中の文字列データの前後の文字列データが、制約条件
の種類に基づき制約条件パラメータに記憶された条件を
満たすか否かの判定を行い、ステップ6−5に進む。
In step 6-4, it is determined whether or not the character string data before and after the character string data in the matched document data satisfies the condition stored in the constraint condition parameter based on the type of constraint condition. Go to 6-5.

ステップ6−5において、条件を満たしていればステッ
プ6−6に分岐する。条件を満たしていなければステッ
プ6−7に分岐する。
If the conditions are satisfied in step 6-5, the process branches to step 6-6. If the condition is not satisfied, the process branches to step 6-7.

ステップ6−6においては、制約条件を満たすとし、ス
テップ6−7において、制約条件を満たさないとする。
In step 6-6, the constraint condition is satisfied, and in step 6-7, the constraint condition is not satisfied.

[他の実施例] 以上の説明においてはパターン・マッチング辞書の構成
として、制約条件「1」の場合について述べたが、他の
制約条件の場合について以下に示す。
[Other Embodiments] In the above description, as the configuration of the pattern matching dictionary, the case of the constraint condition “1” has been described, but the case of other constraint conditions will be described below.

第7図は、この場合におけるパターン・マッチング辞書
の構成の一例である。
FIG. 7 shows an example of the structure of the pattern matching dictionary in this case.

制約条件「2」は、「マッチングの取れた文書中の文字
列の前後の文字列が、制約条件パラメータに記憶された
文字列と一致した場合のみマッチングが取れたとする」
ことを意味する。また[数詞]は文字の種類を表し、数
字と漢数字のことである。
The constraint condition “2” is “the matching is successful only when the character strings before and after the character string in the matched document match the character string stored in the constraint parameter”.
Means that. [Numerical words] represent the type of character, and are numbers and Chinese numerals.

例えば、「1割方」「二割方」等の「割方」とマッチン
グが取れ、「洋酒の割方」「分割方法」等の「割方」と
はマッチングが取れないことになる。
For example, "warikata" such as "10% way" and "20% way" can be matched, and "wari way" such as "western sake way of breaking" and "dividing method" cannot be matched.

また、制約条件パラメータに用言の活用形を記述するこ
ともできる。
In addition, it is possible to describe the inflectional form of a noun in the constraint condition parameter.

制約条件「3」は、「マッチングの取れた文書中の文字
列の後に続く文字列が、制約条件パラメータに記憶され
た活用形の活用語尾と一致した場合のみマッチングが取
れたとする」ことを意味する。
The constraint condition “3” means that “a match is found only when the character string following the character string in the matched document matches the inflectional inflection ending stored in the constraint parameter”. To do.

例えば、「読む」「読んだ」等の「読」とマッチングが
取れ、「読書」「講読する」等の「読」とはマッチング
が取れないことになる。
For example, it can be matched with "reading" such as "read" and "read", but cannot be matched with "reading" such as "reading" and "reading".

また、制約条件パラメータに文字列と用言の活用形とを
併せて記述することもできる。
It is also possible to describe the constraint condition parameter together with the character string and the inflectional form of the noun.

制約条件「4」は、「マッチングの取れた文書中の文字
列の前後の文字列が、制約条件パラメータに記述され
た文字列と一致せず、かつマッチングの取れた文書中の
文字列の後に続く文字列が制約条件パラメータに記述
された活用形の活用語尾と一致した場合のみマッチング
が取れたとする」ことを意味する。また[漢字]は、文
字の種類を表す。
The constraint condition "4" is "the character string before and after the character string in the matched document does not match the character string described in the constraint parameter, and after the character string in the matched document It is assumed that the matching is obtained only when the following character string matches the inflectional ending of the inflectional form described in the constraint parameter. ” [Kanji] represents the type of character.

例えば、「手紙を書する」等の「書」とマッチングが取
れ、「書く」「書籍」「読書する」等の「書」とはマッ
チングが取れないことになる。
For example, a “writing” such as “writing a letter” can be matched, and a “writing” such as “writing”, “book”, or “reading” cannot be matched.

[発明の効果] 以上説明したように、本発明によれば、単に文字列その
ものが検出すべき文字列と一致するばかりでなく、前後
の文字列も制約条件に基づいて適切である場合に、はじ
めて検出されるようにしたので、誤った検出が減少し、
文字列検出の精度が向上するという効果がある。
[Effects of the Invention] As described above, according to the present invention, when not only the character string itself matches the character string to be detected, but also the character strings before and after are appropriate based on the constraint condition, Since it is detected for the first time, false detections are reduced,
This has the effect of improving the accuracy of character string detection.

【図面の簡単な説明】[Brief description of drawings]

第1図は、本発明に係る文字処理装置の全体構成を示す
ブロック図、 第2図(a)(b)は、本発明の画面表示の一例を示す
図、 第3図は、パターン・マッチング辞書の構成の一例を示
す図、 第4図は、本発明の校正指摘処理を示すフロー・チャー
ト、 第5図は、第4図におけるステップ4−4の詳細を示す
フローチャート、 第6図は、第5図におけるステップ5−4の詳細を示す
フローチャート、 第7図は、パターン・マッチング辞書の構成の一例を示
す図である。 1……CPU、 2……ROM、 3……RAM、 4……キーボードKB、 5……外部記憶装置DISK、 6……カーソルレジスタCR、 7……表示用バッファメモリDBUF、 8……CRTコントローラCRTC、 9……表示装置CRT、 10……キャラクタジェネレータCG。
FIG. 1 is a block diagram showing an overall configuration of a character processing device according to the present invention, FIGS. 2 (a) and 2 (b) are diagrams showing an example of a screen display of the present invention, and FIG. 3 is a pattern matching. The figure which shows an example of a structure of a dictionary, FIG. 4 is a flow chart which shows the proofreading | inclination process of this invention, FIG. 5 is the flowchart which shows the detail of step 4-4 in FIG. 4, FIG. FIG. 5 is a flowchart showing details of step 5-4, and FIG. 7 is a diagram showing an example of the configuration of the pattern matching dictionary. 1 ... CPU, 2 ... ROM, 3 ... RAM, 4 ... Keyboard KB, 5 ... External storage device DISK, 6 ... Cursor register CR, 7 ... Display buffer memory DBUF, 8 ... CRT controller CRTC, 9 ... Display device CRT, 10 ... Character generator CG.

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−282364(JP,A) 特開 昭63−234348(JP,A) 特開 昭63−27928(JP,A) Richard Stallman著、 竹内郁雄・天海良治 監訳、「GNU E macs マニュアル」(bit 1988年 2月号別冊)、S63.2.15発行、共立出 版株式会社 P.55−63 ─────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP 62-282364 (JP, A) JP 63-234348 (JP, A) JP 63-27928 (JP, A) Richard Stallman, Takeuchi Translated by Ikuo and Ryoji Amami, “GNU E macs Manual” (bit 1988 issue, separate volume), S63.2.2.15, published by Kyoritsu Publishing Co., Ltd. 55-63

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】文書を記憶する文書記憶手段と、 文書中より検出すべき文字列を格納した辞書手段と、 該辞書手段に記憶された文字列と一致する文字列を前記
文書記憶手段に記憶された文書中より検索する検索手段
と、 前記辞書手段に記憶された検出すべき文字列に関して、
文書中で当該検出すべき文字列の前後の文字列が満たす
べき、あるいは満たすべきでない制約条件を記憶する制
約条件記憶手段と、 前記検索手段により文書中から検索された文字列の前後
の文字列が、該検索された文字列を検出すべき文字列と
するときの前後の文字列として適するか否かを、前記制
約条件記憶手段に記憶された制約条件に基づいて判定す
る判定手段と、 前記検索手段により検索された文字列のうち、該文字列
の前後の文字列が前記判定手段により適すると判定され
た文字列を、文書中で他の文字列と識別表示させる表示
制御手段とを具えたことを特徴とする文字処理装置。
1. A document storage unit for storing a document, a dictionary unit for storing a character string to be detected in the document, and a character string matching the character string stored in the dictionary unit, stored in the document storage unit. With respect to the search means for searching from the document that has been searched, and the character string to be detected stored in the dictionary means,
Constraint condition storage means for storing constraint conditions that the character strings before and after the character string to be detected in the document should or should not be satisfied, and the character strings before and after the character string retrieved from the document by the retrieval means A determining unit that determines whether or not the searched character string is suitable as a character string before and after the character string to be detected is based on the constraint condition stored in the constraint condition storage unit; And a display control unit for displaying the character strings, which are determined by the determination unit, as the character strings before and after the character string searched by the search unit, to be distinguished from other character strings in the document. A character processing device characterized in that
【請求項2】前記制約条件記憶手段が、前記検出すべき
文字列の前後の文字列が一致すべき、あるいは一致すべ
きでない文字列の表記を記憶することを特徴とする請求
項1に記載の文字処理装置。
2. The constraint condition storage means stores the notation of a character string in which the character strings before and after the character string to be detected should or should not match. Character processor.
【請求項3】前記制約条件記憶手段が、前記検出すべき
文字列の前後の文字列が満足すべき、あるいは満足すべ
きでない文字列の文法属性を記憶することを特徴とする
請求項1に記載の文字処理装置。
3. The constraint condition storage means stores a grammatical attribute of a character string that should or should not satisfy a character string before and after the character string to be detected. Character processing device described.
JP63319922A 1988-12-19 1988-12-19 Character processor Expired - Fee Related JPH0628064B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63319922A JPH0628064B2 (en) 1988-12-19 1988-12-19 Character processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63319922A JPH0628064B2 (en) 1988-12-19 1988-12-19 Character processor

Publications (2)

Publication Number Publication Date
JPH02165270A JPH02165270A (en) 1990-06-26
JPH0628064B2 true JPH0628064B2 (en) 1994-04-13

Family

ID=18115730

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63319922A Expired - Fee Related JPH0628064B2 (en) 1988-12-19 1988-12-19 Character processor

Country Status (1)

Country Link
JP (1) JPH0628064B2 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62282364A (en) * 1986-05-30 1987-12-08 Nec Corp Character string retrieval system
JPS63234348A (en) * 1987-03-23 1988-09-29 Fujitsu Ltd Back-up system for correction of sentence

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RichardStallman著、竹内郁雄・天海良治監訳、「GNUEmacsマニュアル」(bit1988年2月号別冊)、S63.2.15発行、共立出版株式会社P.55−63

Also Published As

Publication number Publication date
JPH02165270A (en) 1990-06-26

Similar Documents

Publication Publication Date Title
US5734749A (en) Character string input system for completing an input character string with an incomplete input indicative sign
US5418718A (en) Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters
JP3290451B2 (en) Electronic dictionary
JPH0628064B2 (en) Character processor
JP2621999B2 (en) Document processing device
JP3847801B2 (en) Character processing apparatus and processing method thereof
JPH0746355B2 (en) Kana-Kanji converter
JP2862236B2 (en) Character processor
JPS5832418B2 (en) Kanji-mixed sentence input device
JP2675912B2 (en) Character processor
JPH11338859A (en) Name input device and program recording medium
JP2714239B2 (en) Character processor
JP2575650B2 (en) Kana-Kanji conversion device
JP2899087B2 (en) Character processor
JP3176588B2 (en) Handwritten character input conversion device, document creation device, and computer-readable recording medium
JP2962718B2 (en) Character processor
JPH11184854A (en) Electronic dictionary
JPH06149791A (en) Kanji sentence input device
JPS60189573A (en) Character convertor
JPH08194701A (en) Character processor
JPH08202703A (en) Character processing device and its kana-kanji conversion method
JPH07200569A (en) Character processor
JPH0468466A (en) Kana / kanji converting device
JPH08241315A (en) Document processing device word registration mechanism
JPH11175528A (en) Electronic dictionary

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees