Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0769906B2 - 文字処理装置 - Google Patents
[go: Go Back, main page]

JPH0769906B2 - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0769906B2
JPH0769906B2 JP62055856A JP5585687A JPH0769906B2 JP H0769906 B2 JPH0769906 B2 JP H0769906B2 JP 62055856 A JP62055856 A JP 62055856A JP 5585687 A JP5585687 A JP 5585687A JP H0769906 B2 JPH0769906 B2 JP H0769906B2
Authority
JP
Japan
Prior art keywords
dictionary
reading
conversion
string
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62055856A
Other languages
English (en)
Other versions
JPS63221466A (ja
Inventor
英一朗 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62055856A priority Critical patent/JPH0769906B2/ja
Publication of JPS63221466A publication Critical patent/JPS63221466A/ja
Publication of JPH0769906B2 publication Critical patent/JPH0769906B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は仮名漢字変換により読みを漢字に変換しながら
文書を作成していく文字処理装置、特に複数文節仮名漢
字変換により入力ができる文字処理装置に関する。
〔従来の技術〕
文節の区切りを指定せずにかな漢字変換が可能な複数文
節かな漢字変換による入力、いわゆる複数文節入力を実
現した装置は従来から存在している。このような複数文
節入力においては辞書サーチが頻繁に行われるため、変
換時間が長くかかるという問題があった。
この問題を解決するために従来装置には3つのタイプが
存在する。第1のタイプは高速アクセス可能なメモリを
使用するこにより上記問題を解決した装置であり、辞書
を高速アクセス可能なメモリにロードしておくことによ
り、頻繁に辞書サーチを行ってもリアルタイムで変換で
きるようにした装置である。第2のタイプの装置は低速
かつ安価なメモリを使用して装置自体は低価格に構成
し、そのかわり辞書のサーチ回数をできるだけ少なくす
るように工夫した装置である。
第3のタイプは第1のタイプと第2のタイプの両者を併
用する方式である。すなわち、装置の価格を安価なもの
にするために辞書そのものは低速のメモリに持つが、高
速にサーチ出来るように読み情報のみを高速のメモリに
持つ(読み辞書と呼ぶ)という方式である。この方式で
は読み列を変換単位に分割するときは高速メモリ上の読
み辞書を使用し、実際に漢字に変換するときにはじめて
低速メモリ上のおおもとの辞書を使用するので処理速度
をあまり落さずに低価格の装置を実現できる。
〔発明が解決すべき問題点〕
第1のタイプの欠点は高速であるために高価なメモリを
大量に使用するため、装置自体が高価なものとなってし
まう点である。
第2のタイプの装置の欠点は辞書サーチ回数を無数に少
なくしているため思うように変換精度を上げることがで
きず、変換率が悪いという点である。
第3のタイプの装置は2つの辞書が存在するために両者
が矛盾した内容になってしまう危険性があり、それを防
止するために辞書の内容が変化したときにオペレータが
指示して読み辞書をおおもとの辞書から再生成するとい
う操作をおこなわなければならないという欠点があっ
た。
〔問題点を解決するための手段〕
本発明の目的は上記の欠点を除去することにある。すな
わち、上記の様な無駄な辞書の再生成という処理を除去
し、変換時間の速い文字処理装置を実現することにあ
り、文書を作成する文字処理装置において読み列を入力
する読み列入力手段と、単語を読みと表記の対応をとっ
て記憶した第1の辞書手段と、前記第1の辞書手段の情
報のうち少なくとも読みに関する情報を記憶した第2の
辞書手段と、前記入力された読み列を前記第2の辞書手
段を参照することにより変換単位に分割する読み列分割
手段と、前記分割された読み列を前記第1の辞書手段を
参照することにより表記に変換する読み列変換手段と、
前記第1の辞書手段より前記第2の辞書手段を再生成す
る辞書再構成手段と前記第1の辞書手段の内容の変化を
検知する辞書変更検知手段とを具備し、前記辞書変更検
知手段による辞書内容変化の検知に応じて前記辞書再構
成手段により前記第2の辞書を再生成することにより実
現するものである。
〔実施例〕
以下図面を参照して本発明を詳細に説明する。
第1図は本発明による文字処理装置の概略図である。
読み列入力手段より入力された読み列を読み列分割手段
が第2の辞書を参照しつつ変換単位に分割し、分割され
た読み列を読み列変換手段が第1の辞書を参照しつつ漢
字かな混じり文に変換する。辞書変更検知手段は第1の
辞書の内容が変化したかどうかを検知し、もし、検知す
ると辞書再構成手段を起動する。辞書再構成手段は起動
されると第1の辞書から読み情報のみを抽出した第2の
辞書を再生する。
第2図は本発明の全体構成の一例である。
図示の構成においてCPUはマイクロプロセッサであり、
文字処理のための演算,論理判断等を行い、アドレスバ
スAB,コントロールバスCB,データバスDBを介してそれら
のバスに接続された各構成要素を制御する。
アドレスバスABはマイクロプロセッサCPUの制御の対象
とする構成要素を指示するアドレス信号を転送する。コ
ントロールバスCBはマイクロプロセッサCPUの制御の対
象とする各構成要素のコントロール信号を転送して印加
する。データバスDBは各構成機器相互間のデータの転送
を行う。
つぎにROMは読出し専用の固定メモリであり、第6図〜
第10図につき後述するマイクロプロセッサCPUによる制
御の手順等を記憶させておく。
また、RAMは1ワード16ビツトの構成の書込み可能のラ
ンダムアクセスメモリであって、各構成要素からの各種
データの一時記憶に用いる。
TBUFは文書バツフアであり、キーボードKBより入力され
た文書情報を蓄えるためのメモリである。
YDCは入力読み列を変換単位に分割するための読み辞書
である。
第3図は読み辞書の構成を示した図である。YMFは読み
部、GIFは文法情報部を示す。読み部,文法情報部の構
成は辞書の構成と同一である。最後尾には「んんん」が
入ってエンドマークとなっている。
KBはキーボードであって、アルフアベツトキー,ひらが
なキー,カタカナキー等の文字記号入力キー及び変換キ
ー,単語登録キー等の本文字処理装置に対する各種機能
を指示するための各種のフアンクシヨンキーを備えてい
る。
DISKは磁気デイスク等の低速である安価なメモリであ
り、かな漢字変換を行うための辞書および文書,読み辞
書,その他の保管が必要なデータを記憶するために使用
される。作成された読み辞書はDISKに保管され、更に保
管された読み辞書はキーボードの指示により必要な時呼
び出される。
DICはかな漢字変換用の辞書であり、DISK上に存在す
る。
第4図は辞書の構成を示した図である。各単語は1単語
18バイトで構成される。YMFは読み部であり、各単語の
読みを1読み1バイトでJISC-6226コードの下位バイト
で表現する。KJFは漢字部であり、JISC-6226コードを用
い1文字2バイトで表現する。GIFは文法情報部であり
各単語の品詞情報を2バイトで表現する。各単語は読み
の昇順にソートされている。
YDCSVはDISK上に存在する読み辞書退避用ワークエリア
である。
CRはカーソルレジスタである。CPUによりカーソルレジ
スタの内容を読み書きできる。後述するCRTコントロー
ラCRTCは、ここに蓄えられたアドレスに対応する表示装
置CRT上の位置にカーソルを表示する。
DBUFは表示バツフアメモリでTBUFに蓄えられた文書情報
等のパターンを蓄える。
CRTCはカーソルレジスタCR及びバツフアDBUFに蓄えられ
た内容を表示器CRTに表示する役割を担う。
またCRTは陰極線管等を用いた表示装置であり、その表
示装置CRTにおけるドツト構成の表示パターンおよびカ
ーソルの表示をCRTコントローラで制御する。
さらに、CGはキヤラクタジエネレータであって表示装置
CRTに表示する文字,記号のパターンを記憶するもので
ある。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動するも
のであってキーボードKBからの入力が供給されると、ま
ずインタラプト信号がマイクロプロセツサCPUに送ら
れ、そのマイクロプロセツサCPUがROM内に記憶してある
各種の制御信号を読出し、それらの制御信号に従って各
種の制御が行われる。
上述の如き構成から成る実施例の作動を説明する。
第5図は複数文節入力の概念を示した図である。
(5−1)はオペレータの入力した例文の1つである。
矢印に示すように単語がサーチされる。次にサーチ結果
に基づき(5−2)のように文節単位に入力読み列が分
割され、(5−3)に示すような漢字かな混じり文にな
る。
すなわち、複数文節入力では辞書サーチが処理時間のネ
ツクとなるため、高速メモリに辞書を持たなければなら
ない。
第6図は本発明文字処理装置の動作を示すフローチヤー
トである。
ステツプ6−1において、即ちイニシャル・プログラム
ロードの該のかかるステツプでシステム動作に必要な各
種変数の初期化を行う。例えば、辞書変更フラグFはこ
のときリセツトされる。
ステツプ6−2においてキーボードKBからキー入力の受
付を行い、キーが入力されるとキーの種類に応じて各処
理に分岐する。
ステツプ6−3はキーボードKB上の単語登録キーが入力
された場合であり、第7図に詳述する単語登録の処理を
行う。
ステツプ6−4は変換キーが入力された場合であり、第
8図に詳述する変換の処理を行う。
ステツプ6−5は文字キー,挿入キー,削除キー等の他
のキーが入力された場合の処理であり文字キーが操作さ
れた場合、入力バツフアIBに入り、その後TBUF,DBUFに
転送され、表示される。
ステツプ6−6はTBUF→DBUFに転送し、表示するステツ
プである。
第7図は単語登録を行う場合の処理である。ステツプ7
−1は単語登録処理である。オペレータの指定した読
み、漢字を持つ単語を新たに辞書DICに登録する処理で
ある。ステツプ7−2は単語登録終了後、辞書変更フラ
グFをONする処理である。
第8図は変換処理の詳細を記述した図である。
ステツプ8−1は第9図に詳述する入力バツフアIB中の
入力読み列を変換単位(文節)に分割する処理である。
ステツプ8−2は文節単位に分割された読み列を漢字に
変換する処理であり第11図に詳述される。
第9図は読み列分割処理の詳細を記述したフローであ
る。
ステツプ9−1において辞書変更フラグFをチエツク
し、もしOFFであれば辞書YDCは変更されていないのでス
テツプ9−2においてDISK上のYDCSVより読み辞書をYDC
にロードしステツプ9−5に分岐する。DISKよりロード
を実行する処理は通常の文字処理装置において、例えば
文書呼出等を実行するときに公知の技術であるので特に
説明は行わない。
もし、辞書変更フラグFがONならステツプ9−3に進み
第10図に詳述する読み辞書YDCの作成処理を行い、ステ
ツプ9−4において作成された読み辞書YDCをDISK上の
バツフアYDCSVにセーブしステツプ9−5に分岐する。D
ISKにデータをセーブする処理自体は通常の文字処理装
置において、例えば文書保存等を実行するときに公知の
技術であるので特に説明は行わない。
ステツプ9−5において読み辞書YDCをサーチし、どの
ような文節が可能であるかをバツフアL上にリストアツ
プする。
ステツプ9−6において上記リストアツプされた文節を
組み合せて入力バツフアIBの読み列を変換単位に分割す
る。このときの分割の方法に関しては、最長一致法,2文
節最長一致法,文節数最小法等の各種の方式が用いられ
る。
第10図は読み辞書作成を詳細化したフローである。
ステツプ10−1において行カウンタiをクリアする。
ステツプ10−2において行カウンタiが辞書単語数を超
えているかチエツクし、もし超えていれば10−8に分岐
する。
ステツプ10−3において辞書よりi番目の単語の読み情
報を取り出し、ステツプ10−4で読み辞書のi番目にセ
ツトする。
ステツプ10−5において辞書i番目の単語の文法情報を
取り出し、ステツプ10−6において読み辞書i番目にセ
ツトする。
ステツプ10−7において行カウンタiを更新しステツプ
10−2に戻る。
ステツプ10−8において読み辞書のエンドマーカのセツ
トを行う。
ステツプ10−9において辞書変更フラグFをOFFする。
第11図は文節変換の処理を詳細化したフローである。
ステツプ11−1において変換単位(文節)と一致する単
語が存在するかどうか調べるために辞書DICをサーチす
る。
ステツプ11−2において一致する単語が見つかったかど
うかを判定し、見つかったときはステツプ11−3に分岐
し辞書中に記載されている通りに漢字列に変換する。も
し見つからなかったときはステツプ11−4に分岐し、ひ
らがなのままを変換結果とする。
ステツプ11−5において上記の変換結果をTBUFの文書中
に出力しリターンする。
〔他の実施例〕
以上の実施例におていは読み列を変換単位に分割するた
めの辞書としては読みのみを持つ辞書を想定している
が、読み以外にも変換率を上げるために必要な情報がも
っても何ら本発明の趣旨を損なうものではない。要は、
変換に必要な辞書のうち変換単位に分割するために必要
な情報のみを分離して高速メモリ上に持つことを特徴と
している。
また、仮名を漢字に変換する日本文作成装置を実施例と
して説明しているが、本発明の成果は、他のもの、例え
ばローマ字表記を漢字仮名混じり文に変換する装置、発
音記号を英文に変換する装置などにも応用が可能であ
る。
以上述べたことから明らかなように、辞書は低速メモリ
上にあるので装置自体は安価であり、しかも読み情報の
みは高速メモリ上に持つので変換時間も速く、しかも変
換率の高い文字処理装置を実現することができる。
しかも、読み辞書はイニシャルプログラムロードIPL時
にオリジナルの辞書から自動的に再生成されるのではな
く、オリジナルの辞書の内容に変化があったとき再生成
され、変化がなかったときは保存されていた読み辞書を
呼び出すだけであるので無駄な読み辞書再生成の処理を
行うことがなく変換時間の速い文字処理情報を実現でき
る。
〔効果〕
以上述べたことから明らかなように、本発明によれば辞
書は低速メモリ上にあるので装置自体は安価であり、し
かも読み情報のみは高速メモリ上に持つので変換時間も
速く、しかも変換率の高い文字処理装置を実現すること
ができる。
しかも、読み辞書はオリジナルの辞書が変更されたとき
に自動的に再生成されるので、辞書本体と読み辞書の内
容が食い違って変換結果に悪影響を及ぼすこともなく首
尾一貫した変換を行う操作性の高い文字処理装置を実現
できる。
【図面の簡単な説明】
第1図は本発明による文字処理装置の概略図、 第2図は本発明の全体構成の一例を示す図、 第3図は複数文節入力の例を示す図、 第4図は辞書DICの構成の例を示す図、 第5図は読み辞書の構成の例を示す図、 第6図〜第11図は本発明文字処理装置の動作を示すフロ
ーチヤートの例を示す図。 CPUはマイクロプロセツサ、ABはアドレスバス、CBはコ
ントロールバス、DBはデータバス、ROMは固定メモリ、R
AMはランダムアクセスメモリ、TBUFは文書バツフア、YD
Cは読み辞書、KBはキーボード、DISKは磁気デイスク、D
ICは辞書、YDCSVは読み辞書退避エリア、CRはカーソル
レジスタ、CRTCはCRTコントローラ、DBUFは表示用バツ
フアメモリ、CGはキヤラクタジエネレータ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文書を作成する文字処理装置において、読
    み列を入力する読み列入力手段と、単語を読みと表記の
    対応をとって記憶した第1の辞書手段と、前記第1の辞
    書手段の情報のうち少なくとも読みに関する情報を記憶
    した第2の辞書手段と、前記入力された読み列を前記第
    2の辞書手段を参照することにより変換単位に分割する
    読み列分割手段と、前記分割された読み列を前記第1の
    辞書手段を参照することにより表記に変換する読み列変
    換手段と、前記第1の辞書手段より前記第2の辞書手段
    を再生成する辞書再構成手段と前記第1の辞書手段の内
    容の変化を検知する辞書変更検知手段とを具備し、前記
    辞書変更検知手段による辞書内容変化の検知に応じて前
    記辞書再構成手段により前記第2の辞書を再生成するこ
    とを特徴とする文字処理装置。
JP62055856A 1987-03-11 1987-03-11 文字処理装置 Expired - Lifetime JPH0769906B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62055856A JPH0769906B2 (ja) 1987-03-11 1987-03-11 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62055856A JPH0769906B2 (ja) 1987-03-11 1987-03-11 文字処理装置

Publications (2)

Publication Number Publication Date
JPS63221466A JPS63221466A (ja) 1988-09-14
JPH0769906B2 true JPH0769906B2 (ja) 1995-07-31

Family

ID=13010697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62055856A Expired - Lifetime JPH0769906B2 (ja) 1987-03-11 1987-03-11 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0769906B2 (ja)

Also Published As

Publication number Publication date
JPS63221466A (ja) 1988-09-14

Similar Documents

Publication Publication Date Title
US5418718A (en) Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters
JPH0769906B2 (ja) 文字処理装置
JPH0769907B2 (ja) 文字処理装置
JPS63221469A (ja) 文字処理装置
JPS63221467A (ja) 文字処理装置
JPH0375912B2 (ja)
JPS63221468A (ja) 文字処理装置
JPS63221465A (ja) 文字処理装置
JP2862236B2 (ja) 文字処理装置
JP3058181B2 (ja) 文字処理装置及びその方法
JP3278148B2 (ja) 文字処理装置及びその方法
JPH03116366A (ja) 文字処理装置
JP2744241B2 (ja) 文字処理装置
JPH0628060B2 (ja) 文字処理装置
JPS62198957A (ja) 文字処理装置
JPS63259763A (ja) 文字処理装置
JPH03116367A (ja) 文字処理装置
JPS62198953A (ja) 文字処理装置
JPS62198956A (ja) 文字処理装置
JPS63263564A (ja) 文字処理装置
JPH03116369A (ja) 文字処理装置
JPH0628062B2 (ja) 文字処理装置及びその方法
JPH07191980A (ja) 文字処理装置
JPH0447446A (ja) 文字処理装置
JPH05135010A (ja) 文字処理方法及び装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term