Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0628064B2 - 文字処理装置 - Google Patents
[go: Go Back, main page]

JPH0628064B2 - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0628064B2
JPH0628064B2 JP63319922A JP31992288A JPH0628064B2 JP H0628064 B2 JPH0628064 B2 JP H0628064B2 JP 63319922 A JP63319922 A JP 63319922A JP 31992288 A JP31992288 A JP 31992288A JP H0628064 B2 JPH0628064 B2 JP H0628064B2
Authority
JP
Japan
Prior art keywords
character string
character
document
constraint condition
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63319922A
Other languages
English (en)
Other versions
JPH02165270A (ja
Inventor
博康 伊藤
和世 池田
英一郎 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63319922A priority Critical patent/JPH0628064B2/ja
Publication of JPH02165270A publication Critical patent/JPH02165270A/ja
Publication of JPH0628064B2 publication Critical patent/JPH0628064B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文書中からある条件を満たす文字列を抽出する
機能を有する文字処理装置に関するものである。
[従来の技術] 日本語ワード・プロセッサなど日本文を処理する文字処
理装置において、文書中からある条件を満たす文字列を
抽出する手段として、抽出の対象となる文字列を格納し
た「パターン・マッチング辞書」を用意し、文書中の文
字列とパターン・マッチング辞書中の文字列とのマッチ
ングを行い、マッチングが取れた文字列を抽出する方法
がある。
例えば校正指摘処理において、あいまいな表現の「的」
という文字列を指摘したい場合、パターン・マッチング
辞書に「的」を登録しておけば、「質的」「慣用的」等
の「的」を指摘することができる。
[発明が解決しようとしている課題] しかしこの方法によって、単純にマッチングを取っただ
けでは、形態素解析、構文解析等を行っていないので、
パターン・マッチング辞書中の文字列と違った意味で用
いられている文字列ともマッチングが取れてしまうこと
がある。
例えば、先の校正指摘処理の例において、あるまいな表
現の「的」を指摘したい場合、「質的」「慣用的」等と
共に、あいまいな表現ではない「的確」「目的」「的を
射る」等の「的」も指摘されてしまう欠点があった。
[課題を解決するための手段(及び作用)] 本発明によれば、文字処理装置に、文書を記憶する文書
記憶手段と、文書中より検出すべき文字列を格納した辞
書手段と、該辞書手段に記憶された文字列と一致する文
字列を前記文書記憶手段に記憶された文書中より検索す
る検索手段と、前記辞書手段に記憶された検出すべき文
字列に関して、文書中で当該検出すべき文字列の前後の
文字列が満たすべき、あるいは満たすべきでない制約条
件を記憶する制約条件記憶手段と、前記検索手段により
文書中から検索された文字列の前後の文書列が、該検索
された文字列を検出すべき文字列とするときの前後の文
字列として適するか否かを、前記制約条件記憶手段に記
憶された制約条件に基づいて判定する判定手段と、前記
検索手段により検索された文字列のうち、該文字列の前
後の文字列が前記判定手段により適すると判定された文
字列を、文書中で他の文字列と識別表示させる表示制御
手段とを具えることにより、単に文字列そのものが検出
すべき文字列と一致するばかりでなく、前後の文字列も
制約条件に基づいて適切である場合に、検出され、識別
表示されるようにしたものである。
[実施例] 以下図面を参照しながら本発明の実施例を詳細に説明す
る。
第1図は、本発明の実施例に係る文字処理装置の全体構
成を示すブロック図である。
図示の構成において、1は、マイクロプロセッサCPU
であり、文字処理のための演算、論理判断等を行い、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPU1の制御
の対象とする構成要素を指示するアドレス信号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
1の制御の対象とする各構成要素のコントロール信号を
転送して印加する。データバスDBは各構成機器相互間
のデータの転送を行う。
つぎに2は、読出し専用の固定メモリROMであり、第
4図〜第7図につき後述するマイクロプロセッサCPU
1による制御の手順、及び、パターン・マッチング辞書
KSPMD2a、単語辞書WD2b、文法辞書GD2c
等の固定データを記憶させておく。
また、3は、1ワード16ビットの構成の書込み可能の
ランダムアクセスメモリRAMであって、各構成要素か
らの各種データの一時記憶に用いる。3aはテキストバ
ッファTBUFであり、作成編集される文書データを記
憶するエリアである。
4はキーボードKBであって、アルファベットキー、ひ
らかなキー、カタカナキー等の文字記号入力キー、及
び、カーソル移動キー、仮名漢字変換キー、校正指摘キ
ー、指摘項目選択キー等の本文字処理装置に対する各種
機能を指示するための各種のファンクションキーを備え
ている。
5は文書データを記憶するための外部記憶装置DISK
であり、テキストバッファTBUF3a上に作成された
文書データの保管を行い、保管された文書データはキー
ボードKB4の指示により、必要な時呼び出される。
6はカーソルレジスタCRである。CPU1により、カ
ーソルレジスタCR6の内容を読み書きできる。
7は表示用バッファメモリDBUFで、表示すべきデー
タのパターンを蓄える。文書データの内容の表示を行う
ときは、テキストバッファTBUF3a上のデータに基
いてDBUF7上にパターンを展開することにより行わ
れる。
8はカーソルレジスタCR及びバッファDBUFに蓄え
られた内容を表示器CRT9に表示する役割を担うCR
TコントローラCRTCである。
また9は陰極線管等を用いた表示装置CRTであり、そ
の表示装置CRT9におけるドット構成の表示パターン
およびカーソルの表示をCRTコントローラ8で制御す
る。
さらに、10はキャラクタジェネレータCGであって、
表示装置CRT9に表示する文字、記号のパターンを記
憶するものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKB4からの各種の入力に応じて作動す
るものであって、キーボードKB4からの入力が供給さ
れると、まず、インタラプト信号がマイクロプロセッサ
CPU1に送られ、そのマイクロプロセッサCPU1が
ROM2内に記憶してある各種の制御信号を読出し、そ
れらの制御信号に従って各種の制御が行われる。
第2図は、本発明におけるCRT表示装置9の画面表示
の一例である。図中、9aは表示画面を意味する。この
表示画面9aには、テキストバッファTBUF3aに記
憶されている文書データの内容が表示される。
第2図(a)に示すように、表示画面9a上の文書「質
的」「慣用的」「的確」「目的」「的を射る」に対し、
操作者が校正指摘キーを入力すると、表示画面9a上に
指摘項目選択メニュー9bがウインドウ表示される。
指摘項目選択キーによりあいまいな表現の指摘を選択し
これを入力すると、第2図(b)に示すように指摘項目
「あいまいな表現」9cがウインドウ表示され、マッチ
ングが行われ、「質的」「慣用的」の「的」があいまい
な表現として指摘されるが、「的確」「目的」「的を射
る」の「的」は指摘されない。ここで、指摘箇所にはア
ンダーラインが引かれる。
第3図は、本発明におけるパターン・マッチング辞書K
SPMD2aの構成の一例である。
「見出し」にはマッチングの対象となる文字列データが
記憶されている。
「制約条件」には制約条件の種類が記憶されており、こ
れに従いそれぞれの処理を行う。また「制約条件」が記
憶されていない場合は、制約条件がないと見なす。「制
約条件パラメータ」には制約条件の詳細が記憶されてい
る。また制約条件がない場合、「制約条件パラメータ」
は記憶されていない。
例えば、「的」という見出しにおいて、制約条件は
「1」であり、制約条件パラメータは「(的)確」
「(的)中」「[文頭](的)」「目(的)」「射
(的)」である。ここで[文頭]は文字そのものではな
く文字の種類を意味し、「文頭を表す文字」のことであ
る。また制約条件「1」は、「マッチングの取れた文書
データ中の文字列データの前後の文字列データが、制約
条件パラメーに記述された文字列データと一致しない場
合のみマッチングが取れたとする」ことを意味する。
第4図は、本発明に係る文字処理装置の校正指摘処理を
示すフロー・チャートである。
ステップ4−1において、操作者が校正指摘キーを入力
すると、ステップ4−2において「指摘項目メニュー」
を表示装置9の表示画面に表示する。
次に、ステップ4−3において、操作者が指摘項目選択
キーを入力する。
ステップ4−4において、文書データ中の文字列データ
と、パターン・マッチング辞書中の文字列データとのマ
ッチングを行い、マッチングが取れている場合はマッチ
ングの取れた文書データ中の文字列データの前後の文字
列データが制約条件を満たしているか否かの判定を行
う。マッチングが取れかつ制約条件を満たしている場
合、またはマッチングが取れかつ制約条件がない場合は
マッチング取れたとし、マッチングが取れなかった場
合、またはマッチングは取れたが制約条件を満たしてい
ない場合はマッチングが取れなかったとし、ステップ4
−5に進む。ステップ4−5におけるパターンマッチン
グの詳細は第5図に示す。
ステップ4−5において、マッチングが取れていればス
テップ4−6に分岐する。マッチングが取れていなけれ
ばステップ4−7に分岐する。
ステップ4−5においては、表示されている文書データ
中の文字列データをアンダーライン等により指摘する。
ステップ4−6においては、文書データ中の文字列デー
タに何もせず指摘しない。
第5図は、第4図に示すステップ4−4の詳細をを示す
フロー・チャートである。
ステップ5−1において、指摘項目を判別し、ステップ
5−2に進む。
ステップ5−2において、文書データ中の文字列データ
とパターン・マッチング辞書中の文字列データとのマッ
チングが取れているか否かの判定を行い、ステップ5−
3に進む。
ステップ5−3において、マッチングが取れていればス
テップ5−4に分岐する。マッチングが取れていなけれ
ばステップ5−7に分岐する。
ステップ5−4において、マッチングの取れた文書デー
タの文字列データの前後の文字列データがパターン・マ
ッチング辞書中に記述された制約条件を満たしているか
否かの判定を行い、ステップ5−5に進む。ステップ5
−5の制約条件を満たしているか否かの判定の詳細は第
6図に示す。
ステップ5−5において、制約条件を満たしていればス
テップ5−6に分岐する。制約条件を満たしていなけれ
ばステップ5−7に分岐するしてステップ5−6におい
てマッチングが取れたとする。制約条件を満たしていな
ければ、ステップ5−7においてマッチングが取れなか
ったとする。
第6図は、第5図のステップ5−4の詳細をを示すフロ
ー・チャートである。
ステップ6−1において、制約条件が記憶されているか
否かの判定を行い、ステップ6−2に進む。
ステップ6−2において、制約条件が記憶されていれば
ステップ6−3に分岐する。制約条件が記憶されていな
ければステップ6−6に分岐する。
ステップ6−3において制約条件の種類を判別し、ステ
ップ6−4に進む。
ステップ6−4において、マッチングの取れた文書デー
タ中の文字列データの前後の文字列データが、制約条件
の種類に基づき制約条件パラメータに記憶された条件を
満たすか否かの判定を行い、ステップ6−5に進む。
ステップ6−5において、条件を満たしていればステッ
プ6−6に分岐する。条件を満たしていなければステッ
プ6−7に分岐する。
ステップ6−6においては、制約条件を満たすとし、ス
テップ6−7において、制約条件を満たさないとする。
[他の実施例] 以上の説明においてはパターン・マッチング辞書の構成
として、制約条件「1」の場合について述べたが、他の
制約条件の場合について以下に示す。
第7図は、この場合におけるパターン・マッチング辞書
の構成の一例である。
制約条件「2」は、「マッチングの取れた文書中の文字
列の前後の文字列が、制約条件パラメータに記憶された
文字列と一致した場合のみマッチングが取れたとする」
ことを意味する。また[数詞]は文字の種類を表し、数
字と漢数字のことである。
例えば、「1割方」「二割方」等の「割方」とマッチン
グが取れ、「洋酒の割方」「分割方法」等の「割方」と
はマッチングが取れないことになる。
また、制約条件パラメータに用言の活用形を記述するこ
ともできる。
制約条件「3」は、「マッチングの取れた文書中の文字
列の後に続く文字列が、制約条件パラメータに記憶され
た活用形の活用語尾と一致した場合のみマッチングが取
れたとする」ことを意味する。
例えば、「読む」「読んだ」等の「読」とマッチングが
取れ、「読書」「講読する」等の「読」とはマッチング
が取れないことになる。
また、制約条件パラメータに文字列と用言の活用形とを
併せて記述することもできる。
制約条件「4」は、「マッチングの取れた文書中の文字
列の前後の文字列が、制約条件パラメータに記述され
た文字列と一致せず、かつマッチングの取れた文書中の
文字列の後に続く文字列が制約条件パラメータに記述
された活用形の活用語尾と一致した場合のみマッチング
が取れたとする」ことを意味する。また[漢字]は、文
字の種類を表す。
例えば、「手紙を書する」等の「書」とマッチングが取
れ、「書く」「書籍」「読書する」等の「書」とはマッ
チングが取れないことになる。
[発明の効果] 以上説明したように、本発明によれば、単に文字列その
ものが検出すべき文字列と一致するばかりでなく、前後
の文字列も制約条件に基づいて適切である場合に、はじ
めて検出されるようにしたので、誤った検出が減少し、
文字列検出の精度が向上するという効果がある。
【図面の簡単な説明】
第1図は、本発明に係る文字処理装置の全体構成を示す
ブロック図、 第2図(a)(b)は、本発明の画面表示の一例を示す
図、 第3図は、パターン・マッチング辞書の構成の一例を示
す図、 第4図は、本発明の校正指摘処理を示すフロー・チャー
ト、 第5図は、第4図におけるステップ4−4の詳細を示す
フローチャート、 第6図は、第5図におけるステップ5−4の詳細を示す
フローチャート、 第7図は、パターン・マッチング辞書の構成の一例を示
す図である。 1……CPU、 2……ROM、 3……RAM、 4……キーボードKB、 5……外部記憶装置DISK、 6……カーソルレジスタCR、 7……表示用バッファメモリDBUF、 8……CRTコントローラCRTC、 9……表示装置CRT、 10……キャラクタジェネレータCG。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭62−282364(JP,A) 特開 昭63−234348(JP,A) 特開 昭63−27928(JP,A) Richard Stallman著、 竹内郁雄・天海良治 監訳、「GNU E macs マニュアル」(bit 1988年 2月号別冊)、S63.2.15発行、共立出 版株式会社 P.55−63

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】文書を記憶する文書記憶手段と、 文書中より検出すべき文字列を格納した辞書手段と、 該辞書手段に記憶された文字列と一致する文字列を前記
    文書記憶手段に記憶された文書中より検索する検索手段
    と、 前記辞書手段に記憶された検出すべき文字列に関して、
    文書中で当該検出すべき文字列の前後の文字列が満たす
    べき、あるいは満たすべきでない制約条件を記憶する制
    約条件記憶手段と、 前記検索手段により文書中から検索された文字列の前後
    の文字列が、該検索された文字列を検出すべき文字列と
    するときの前後の文字列として適するか否かを、前記制
    約条件記憶手段に記憶された制約条件に基づいて判定す
    る判定手段と、 前記検索手段により検索された文字列のうち、該文字列
    の前後の文字列が前記判定手段により適すると判定され
    た文字列を、文書中で他の文字列と識別表示させる表示
    制御手段とを具えたことを特徴とする文字処理装置。
  2. 【請求項2】前記制約条件記憶手段が、前記検出すべき
    文字列の前後の文字列が一致すべき、あるいは一致すべ
    きでない文字列の表記を記憶することを特徴とする請求
    項1に記載の文字処理装置。
  3. 【請求項3】前記制約条件記憶手段が、前記検出すべき
    文字列の前後の文字列が満足すべき、あるいは満足すべ
    きでない文字列の文法属性を記憶することを特徴とする
    請求項1に記載の文字処理装置。
JP63319922A 1988-12-19 1988-12-19 文字処理装置 Expired - Fee Related JPH0628064B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63319922A JPH0628064B2 (ja) 1988-12-19 1988-12-19 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63319922A JPH0628064B2 (ja) 1988-12-19 1988-12-19 文字処理装置

Publications (2)

Publication Number Publication Date
JPH02165270A JPH02165270A (ja) 1990-06-26
JPH0628064B2 true JPH0628064B2 (ja) 1994-04-13

Family

ID=18115730

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63319922A Expired - Fee Related JPH0628064B2 (ja) 1988-12-19 1988-12-19 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0628064B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62282364A (ja) * 1986-05-30 1987-12-08 Nec Corp 文字列検索方式
JPS63234348A (ja) * 1987-03-23 1988-09-29 Fujitsu Ltd 文章校正支援方式

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RichardStallman著、竹内郁雄・天海良治監訳、「GNUEmacsマニュアル」(bit1988年2月号別冊)、S63.2.15発行、共立出版株式会社P.55−63

Also Published As

Publication number Publication date
JPH02165270A (ja) 1990-06-26

Similar Documents

Publication Publication Date Title
US5734749A (en) Character string input system for completing an input character string with an incomplete input indicative sign
US5418718A (en) Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters
JP3290451B2 (ja) 電子辞書
JPH0628064B2 (ja) 文字処理装置
JP2621999B2 (ja) 文書処理装置
JP3847801B2 (ja) 文字処理装置及びその処理方法
JPH0746355B2 (ja) かな漢字変換装置
JP2862236B2 (ja) 文字処理装置
JPS5832418B2 (ja) 漢字まじり文入力装置
JP2675912B2 (ja) 文字処理装置
JPH11338859A (ja) 氏名入力装置及びプログラム記録媒体
JP2714239B2 (ja) 文字処理装置
JP2575650B2 (ja) かな漢字変換装置
JP2899087B2 (ja) 文字処理装置
JP3176588B2 (ja) 手書き文字入力変換装置及び文書作成装置とコンピュータ読み取り可能な記録媒体
JP2962718B2 (ja) 文字処理装置
JPH11184854A (ja) 電子辞書
JPH06149791A (ja) 漢字文章入力装置
JPS60189573A (ja) 文字変換装置
JPH08194701A (ja) 文字処理装置
JPH08202703A (ja) 文字処理装置およびそのかな漢字変換方法
JPH07200569A (ja) 文字処理装置
JPH0468466A (ja) かな漢字変換装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH11175528A (ja) 電子辞書

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees