Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0576066B2 - - Google Patents
[go: Go Back, main page]

JPH0576066B2 - - Google Patents

Info

Publication number
JPH0576066B2
JPH0576066B2 JP1255501A JP25550189A JPH0576066B2 JP H0576066 B2 JPH0576066 B2 JP H0576066B2 JP 1255501 A JP1255501 A JP 1255501A JP 25550189 A JP25550189 A JP 25550189A JP H0576066 B2 JPH0576066 B2 JP H0576066B2
Authority
JP
Japan
Prior art keywords
word
pointer
dictionary
learning
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1255501A
Other languages
English (en)
Other versions
JPH03116370A (ja
Inventor
Eiichiro Toshima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1255501A priority Critical patent/JPH03116370A/ja
Publication of JPH03116370A publication Critical patent/JPH03116370A/ja
Publication of JPH0576066B2 publication Critical patent/JPH0576066B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は仮名漢字変換により漢字仮名混り文を
入力する文字処理装置に関し、更にいえば、仮名
漢字変換の学習機構に関する。
[従来の技術] 現在、日本ワードプロセツサなどの文字処理装
置は漢字仮名混り文の入力を仮名漢字変換を使つ
て行なうことが一般的である。
従来、仮名漢字変換用辞書は外部メモリ(フロ
ツピーデイスク、ハードデイスク)に格納するこ
とが多かつた。ところが、一括変換等の変換方式
の改良が進むことにより辞書アクセスの回数が増
大し、他方、変換のスピードアツプ要求も高まつ
てきたことから、辞書を高速アクセス可能な内部
メモリに格納する方式が主流となつている。
内部メモリには、読込/書込ともに可能で揮発
性(電源を切ると記憶内容が消えてしまう)の
RAMと、書込が不可能であるが不揮発性(電源
を切つても記憶内容が消えない)のROMの2種
類が一般に広く使用されている。
辞書をRAMに持つ場合、仮名漢字変換する前
の準備として辞書を外部メモリからRAMにロー
ドすることになるが、ロード時間がかかるという
欠点があり、更に、RAMの方がROMよりも高
価であるためコストが高くなるという欠点もあ
る。このため、現在では、辞書をROMに記憶す
るのが一般的である。
このように辞書がROM化されるため、学習方
式も従来と変わつてきている。従来の学習方式
は、辞書内の単語の順位を実際に並べ替える、辞
書内に持つた順位情報(頻度情報)を更新して学
習する、などの手法が取られていたが、ROM内
の情報は変更できないので、辞書の領域とは別の
RAM領域に学習情報を記憶せざるをえない。そ
こで、以下に示すいくつかの手法が今までに提案
されている。
まず第1の方式は、辞書上の単語と対応づけて
頻度情報のみを記述した学習データを持つ方式で
ある。対応の取り方は辞書先頭から数えて何番目
の単語であるか(連番)などが使用される。すな
わち、辞書先頭の単語の頻度情報は学習データの
1番目に格納され、辞書先頭から2番目の単語の
頻度情報は学習データの2番目に格納される。以
下、同じように格納される。
第2の方式は、学習されている単語に対して、
該単語の辞書上での存在アドレスを記憶する方式
である。
第3の方式は、学習されている単語について単
にアドレスを記憶するのではなく、辞書上の単語
情報の全体(実体データ)を記憶した、本物の辞
書のサブセツトである学習辞書を作成し、変換時
に学習辞書に記載されている単語を優先的に変換
するという方式である。
[発明が解決しようとしている問題点] 以上、挙げた3つの学習方式はいずれも欠点が
ある。
第1の方式、第2の方式の欠点は、学習データ
が辞書ROMの内容に依存したデータとなるとい
う点である。
第1の方式では、新しい単語が追加された場合
や既にある単語が削除された場合、それ以降の学
習データをシフトしなければならない。
第2の方式では、更に状況が厳しくなり、辞書
に何らかの変化があつた場合、すなわち、新しい
単語が追加された場合、既にある単語が削除され
た場合、単語の情報が訂正された場合、各単語の
存在アドレスが狂うと、それ以降の単語に関する
学習データに対してアドレス値を補正しなければ
ならない。
もちろん、どの方式も、辞書の内容にどのよう
な修正があつたかが分かれば学習データを補正す
ることは可能であるが、一般に辞書内容を更新す
る際は、更新箇所が多岐に渡るので、辞書内容の
変化を知ることは現実的ではない。
また、第3の方式は辞書ROMの内容には依存
しないが、単語情報をそのままの形で持つので、
学習データ用に相当なメモリが必要であるという
欠点がある。例えば、1単語当たり10バイトの単
語情報が必要であれば、学習されている単語が1
万語あつたとすると、学習データとして約100K
バイトものメモリが必要であり、現実的にはこの
方式を採用することはできない。
すなわち、従来の学習方式では辞書の内容に変
化があつた場合、互換性を確保できないという欠
点があり、どうしても互換性を確保したい場合に
は膨大な学習データ用のメモリが要求されてい
た。
[問題点を解決するための手段(及び作用)] 上記問題点を解決するために、本発明によれ
ば、文字処理装置に、仮名文字列を入力するため
の入力手段と、単語の読みと、表記を含む単語情
報とが対応して記憶された辞書手段と、該辞書手
段を参照して、前記入力手段より入力された仮名
文字列を、当該仮名文字列を読みとする単語の表
記に変換する変換手段と、該変換手段により変換
された単語より、第1の指示に応答して1つの単
語を選択する選択手段と、該選択手段により選択
された単語の前記辞書手段におけるポインタを記
憶する学習単語ポインタ記憶手段と、前記変換手
段による変換の際に、前記入力された仮名文字列
を読みとする単語の前記辞書手段におけるポイン
タを求め、求められた当該ポインタと一致するポ
インタが前記学習単語ポインタ記憶手段に記憶さ
れているかを判定し、記憶されていると判定され
た場合には、当該ポインタに対応する単語を変換
結果として優先させる第1制御手段と、第2の指
示を受けて、前記辞書手段より、前記学習単語ポ
インタ記憶手段に記憶されたポインタの位置に記
憶された単語情報を抽出して、抽出された単語情
報を前記外部記憶手段に記憶させる記憶制御手段
と、起動時に、前記外部記憶手段に記憶された単
語と一致する単語を前記辞書手段より検索し、当
該検索により一致した単語の前記辞書手段上のポ
インタを求め、求められた当該ポインタにより前
記学習単語ポインタ記憶手段の記憶内容を更新さ
せる第2制御手段とを具えたことにより、変換の
際に参照する辞書の内容が異なつても、以前選択
された単語を優先して変換できるようにしたもの
である。
[実施例] 以下図面を参照しながら本発明を詳細に説明す
る。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロ
セツサであり、文字処理のための演算、論理判断
等を行ない、アドレスバスAB、コントロールバ
スCB、データバスDBを介して、それらのバスに
接続された各構成要素を制御する。
アドレスバスABはマイクロプロセツサCPUの
制御の対象とする構成要素を指示するアドレス信
号を転送する。コントロールバスCBはマイクロ
プロセツサCPUの制御の対象とする各構成要素
のコントロール信号を転送して印加する。データ
バスDBは各構成機器相互間のデータの転送を行
なう。
つぎにROMは、読出し専用の固定メモリであ
り、第10図〜第16図につき後述するマイクロ
プロセツサCPUによる制御の手順、及び、仮名
漢字変換用辞書DICを記憶させておく。
また、RAMは、1ワード16ビツトの構成の書
込み可能のランダムアクセスメモリであつて、各
構成要素からの各種データの一時記憶に用いる。
IBUFは入力バツフアであり、キーボードからの
入力キーデータが一時記憶される。TBUFはテ
キストバツフアであり、入力編集中のテキストデ
ータが記憶される。DOBUFは同音語バツフアで
あり、テキストバツフアTBUFは記憶される文
字に同音語候補が存在するときはその候補が記憶
される。MLEARNはメモリ学習データであり、
仮名漢字変換用辞書DIC上の単語のうち、学習さ
れているもののアドレスが記憶される。JCTBL
は自立語候補テーブルであり、仮名漢字変換中に
必要な自立語の存在位置、及び学習の有無を一時
的に記憶するためのテーブルである。
KBはキーボードであつて、アルフアベツトキ
ー、ひらかなキー、カタカナキー等の文字記号入
力キー、及び、変換キー、次候補キー、選択キ
ー、学習保存キー等の本文字処理装置に対する各
種機能を指示するための各種のフアンクシヨンキ
ーを備えている。
DISKはテキストデータ、デイスク学習データ
DLEARNを保存するための外部メモリである。
テキストデータ、デイスク学習データは必要に応
じて保管され、また、保管されたデータはキーボ
ードの指示により必要な時呼び出される。
CRはカーソルレジスタである。CPUにより、
カーソルレジスタの内容を読み書きできる。後述
するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置
にカーソルを表示する。
DBUFは表示用バツフアメモリで、表示すべ
きデータのパターンを蓄える。テキストの内容を
表示するときはテキストバツフアTBUFの内容
に応じて表示パターンがDBUFに作成されるこ
とにより、表示されることになる。
CRTCはカーソルレジスタCR及びバツフア
DBUFに蓄えられた内容を表示器CRTに表示す
る役割を担う。
またCRTは陰極線管等を用いた表示装置であ
り、その表示装置CRTにおけるドツト構成の表
示パターンおよびカーソルの表示をCRTコント
ローラで制御する。
さらに、CGはキヤラクタジエネレータであつ
て、表示装置CRTに表示する文字、記号のパタ
ーンを記憶するものである。
かかる各構成要素からなる本発明文字処理装置
においては、キーボードKBからの各種の入力に
応じて作動するものであつて、キーボードKBか
らの入力が供給されると、まず、インタラプト信
号がマイクロプロセツサCPUに送られ、そのマ
イクロプロセツサCPUがROM内に記憶してある
各種の制御信号を読出し、それらの制御信号に従
つて各種の制御が行なわれる。
第2図は本発明装置による変換操作の例を示し
た図である。2−1はまず初期画面を示したもの
である。2−2は読み列「きかい」を入力した時
の画面を示している。カーソルは入力読み列の次
に表示されている。ここで変換キーを打鍵すると
2−3の画面になる。2−3では読み列「きか
い」が「機械」と変換されている。これは望む変
換ではないので、次候補キーを打鍵すると2−4
の画面になる。ここで「きかい」の変換候補が表
示される。第1候補は「機械」であり、第2候補
は「機会」である。現在の候補は第2候補の「機
会」であり、2が反転表示している。ここで選択
キーを打鍵すると、2−5の画面になる。第2候
補の「機会」が確定してテキストデータの中に格
納され、同時に「機会」が学習される。学習結果
はメモリ上の学習データに記憶される。もう一度
「きかい」と入力すると2−6の画面になる。更
に変換キーを打鍵すると2−7の画面になり、今
度は「機会」学習されているので、第1候補とし
て「機会」が表示されている。
今までの操作では学習結果はメモリ内で反映さ
れているだけであり、保存するためには学習保存
キーを打鍵する必要がある。そうすると学習結果
が外部記憶に保存されることになる。
第3図は入力バツフアIBUFの構成を示した図
である。
入力バツフアはキーボードから入力されたキー
データを記憶するバツフアである。先頭の2バイ
トはバツフア長であり、入力バツフアに格納され
ているキーデータのうち有効なものの長さが図に
示すように格納される。3バイト目以降からキー
データが格納される。キーデータは1文字2バイ
トで格納される。例えば、JIS X 0208コードが
使用される。図中入力末にある「/」は変換キー
が打鍵されたことを意味する。
第4図はテキストバツフアTBUFの構成を示
した図である。
テキストバツフアは文字の羅列から構成され、
各文字は2バイトで構成される。各文字のMSB
は同音語フラグであり、0は通常文字、1が同音
語を意味する。残りの15ビツトは通常文字のとき
は文字コードを表現し、同音語のときは同音語番
号を表現する。文字コードは例えば、JIS X
0208コードを使用する。同音語番号は第5図に示
す同音語バツフアDOBUF上のどの同音語である
かを示す番号である。
第5図は同音語バツフアDOBUFの構成を示し
た図である。各同音語には同音語番号が付いてお
り、それによつて識別される。
各同音語は「読み」「現候補番号」「第i候補情
報」からなる。
「読み」はその同音語の読みを格納する。
「現候補番号」はその同音語の現在表示されて
いる候補番号が格納される。変換直後初値に第1
候補が表示されるから「1」が格納される。
「第i候補情報」は各候補の表記、及び、学習
のための自立語の存在アドレス等が格納される。
第6図は辞書DICの構成を示した図である。辞
書はROM上に存在する。従つて、内容を変更す
ることはできない。
各単語データは「読み」「表記」「品詞」からな
る。
「読み」には単語の読み情報、例えば、「機械」
であれば「きかい」が記憶される。コードはJIS
X 0208コードの下位バイトなどを使用し、1文
字1バイトで格納される。
「表記」には単語の表記情報、例えば、「機械」
であれば、「機械」という字面が1文字2バイト
でJIS X 0208コード等を使用して格納される。
「品詞」は単語の品詞、例えば、「機械」であ
れば、「名詞」が格納される。
辞書の単語データは読みの昇順(辞書式配列)
で格納される。
第6図はデイスク学習データDLEARNの構成
を示した図である。
デイスク学習データは外部メモリに保存されて
いる。電源立ち上げ時に外部メモリからRAM上
のワークエリアにロードされ、第7図に示すメモ
リ学習データを作成するために使用される。メモ
リ学習データの作成が終るとロードされたワーク
エリアは解放される。すなわち、デイスク学習デ
ータがRAM上に存在するのはほんの一瞬であ
る。
図に示すように学習されている単語の実体デー
タが「読み」「表記」「品詞」の3つのフイールド
から構成される。
学習単語は、通常、辞書DICに存在するはずで
あり、存在する時は辞書DIC上の読み、表記、品
詞がそのまま記憶されることになる。
図中では学習単語1は「機会」、学習単語2は
「校正」となつている。
辞書ROMがバージヨンアツプ(機能アツプ)
された場合など、学習単語として辞書DICに存在
しない単語が記述されている場合があるが、その
場合、存在しない削除単語はメモリ学習データに
は反映されない。
第8図はメモリ学習データMLEARNの詳細構
成を示した図である。
メモリ学習データにはデイスク学習データに格
納されている学習単語一つ一つに対して、その単
語が辞書DICのどこに存在するかを記憶してい
る。
例えば、学習単語1は第7図によると「機会」
であるので、辞書DIC上の「機会」の存在するア
ドレスを第1エントリーとして格納する。同様に
学習単語2については「校正」の存在するアドレ
スを第2エントリーとして格納する。
メモリ学習データは学習データの使用メモリを
減らすために存在するデータであり、このデータ
がなくても、デイスク学習データと、辞書DICと
からいつでも再作成できる。
このように、メモリ学習データは、辞書DICの
バージヨンに依存するデータである。辞書DICに
応じて再作成の必要がある。
第9図は自立語候補テーブルJCTBLの構成を
示した図である。
自立語候補テーブルは仮名漢字変換処理を行な
う過程において、入力読み列の解析を行なうのに
必要な単語が辞書DICのどこに存在するか、ある
いは学習されているかどうかを一時的に記憶した
テーブルである。
例えば、入力読み列が「きかいしんこうかいか
ん」であつたときは、その解析のために「き」
「きか」「きかい」「か」「かい」「かいし」「かいし
ん」などの単語が必要であり、それらの単語の辞
書DIC上での存在位置がフイールド「ポインタ」
に設定される。
また、メモリ学習データMLEARNに基づい
て、学習されているかどうかがビツト学習フラグ
に設定される。その単語が学習されているとき
「1」が格納され、学習されていないとき「0」
が格納される。
図の場合、「機会」「会心」のみが学習されてい
るとして、学習フラグには「1」が格納されてい
る。他の単語には「0」が格納されている。
上述の実施例の動作をフローに従つて説明す
る。
第10図はキー入力を取り込み、処理を行なう
部分のフローチヤートである。
ステツプ10−1はメモリ学習データ作成処理で
あり、第11図に示すようにメモリ学習データの
初期設定を行なう。この処理は通常、電源ON直
後に1回だけ実行される。
ステツプ10−2はキーボードからのデータを取
り込む処理である。ステツプ10−3で取り込まれ
たキーの種別を判定し、各キーの処理ルーチンに
分岐する。
変換キーが入力されたときはステツプ10−4に
分岐し、ステツプ10−4において第12図に詳述
するように仮名漢字変換の変換処理が行なわれ
る。その後ステツプ10−9の表示処理に分岐す
る。
次候補キーが入力されたときはステツプ10−5
に分岐し、ステツプ10−5において第14図に詳
述する次候補処理が行なわれる。その後ステツプ
10−9の表示処理に分岐する。
選択キーが入力されたときはステツプ10−6に
分岐し、ステツプ10−6において第15図に詳述
する選択処理が行なわれる。その後ステツプ10−
9の表示処理に分岐する。
学習保存キーが入力されたときはステツプ10−
7に分岐し、ステツプ10−7において第16図に
詳述する学習保存処理が行なわれる。その後ステ
ツプ10−9の表示処理に分岐する。
その他のキーのときはステツプ10−8に分岐
し、挿入、削除等の通常の文字処理装置において
行なわれるその他の処理が行なわれる。その後ス
テツプ10−9の表示処理に分岐する。
ステツプ10−9において今までの処理結果の表
示処理を行ない、その後10−2にループし、もう
一度キー入力をGETする。
第11図はステツプ10−1の「メモリ学習デー
タ作成処理」を詳細化したフローチヤートであ
る。
ステツプ11−1において、まずデイスク学習デ
ータをロードするのに必要なワーク領域をRAM
上に確保する。
ステツプ11−2においてデイスク学習データを
外部記憶から確保されたワーク領域にロードす
る。
ステツプ11−3においてメモリ学習データを初
期設定する。
ステツプ11−4において、学習単語をワーク領
域上のデイスク学習データから1単語取り出す。
ステツプ11−5において全ての学習単語につい
て処理が終了したかどうか判定し、処理が終了し
ている時はステツプ11−8のワーク領域解放処理
に分岐する。処理が終了していない時はステツプ
11−6の学習単語アドレス決定に進む。
ステツプ11−6において、取り出された学習単
語と同じものが辞書DIC上のどこに存在するかサ
ーチし、そのアドレスを求める。
ステツプ11−7において、上記求めたアドレス
をメモリ学習データアドレス部に設定する。辞書
DIC上に存在しなかつたときは設定は行なわれな
い。
ついで、次の学習単語の処理を行なわれないと
いけないのでステツプ11−4に分岐する。
ステツプ11−8において、デイスク学習データ
のために確保されたワーク領域を解放し、リター
ンする。
第12図はステツプ10−4の「変換処理」を詳
細化したフローチヤートである。
ステツプ12−1において入力読み列の解析に必
要な単語を自立語候補テーブルJCTBLに登録す
るために第13図に詳述する単語サーチ処理を行
なう。
ステツプ12−2において、形態素解析、構文解
析等を行なつて入力読み列を解析し、文節候補を
作成する。
ステツプ12−3において、各文節候補の尤度を
計算し、どの文節を変換するのが最も尤もらしい
かを判断し、第1候補として決定する。このと
き、自立語候補テーブルで学習フラグがONにな
つている単語は尤度的に有利であり、第1候補と
して変換され易い。
ステツプ12−4において、決定された第1候補
に基づいて同音語バツフアを作成し、変換結果を
テキストバツフアに出力する。
第13図はステツプ12−1の「単語サーチ処
理」を詳細化したフローチヤートである。
ステツプ13−1において、辞書DICより入力読
み列の解析に必要な単語の読み(サーチすべき読
み)を1つ決定する。
ステツプ13−2においてサーチすべき読みがな
くなつたかどうか判定し、なくなつた時はリター
ンする。
ステツプ13−3においてサーチすべき読みにつ
いて実際に辞書DICをサーチし、アドレスを求め
る。
ステツプ13−4において見つかつたアドレスが
メモリ学習データに記載されているかどうかを判
定するためメモリ学習データをサーチする。
ステツプ13−5において一致するアドレスがあ
つたかどうか判定し、もし、存在すれば、その単
語は学習されていると見なされるから、ステツプ
13−6において自立語候補テーブルの学習フラグ
に「1」をセツトし、存在しなければ、学習され
ていないわけであるからステツプ13−7において
学習フラグに「0」を設定する。その後、ステツ
プ13−1に分岐し、次のサーチ読みの処理に移
る。
第14図はステツプ10−5の「次候補処理」を
詳細化したフローチヤートである。
ステツプ14−1において、次候補を見るべき同
音語の同音語番号をテキストバツフアTBUFよ
り求める。
ステツプ14−2において、同音語番号から同音
語バツフアの位置を求めて、現候補番号をカウン
トアツプする。
第15図はステツプ10−6の「選択処理」を詳
細化したフローチヤートである。
ステツプ15−1において、選択すべき同音語の
同音語番号をテキストバツフアTBUFより求め
る。
ステツプ15−2において、同音語番号から同音
語バツフアの位置を求めて、現候補番号の示す候
補情報から表記を取り出し、テキストバツフア
TBUFに確定文字として設定する。
ステツプ15−3において、同様に、現候補番号
の示す候補情報から自立語の存在するアドレスを
求め、メモリ学習データMLEARNに登録する。
第16図はステツプ10−7の「学習保存処理」
を詳細化したフローチヤートである。
ステツプ16−1において、まずデイスク学習デ
ータに必要なワーク領域をRAM上に確保する。
ステツプ16−2においてワーク領域をデイスク
学習データとして初期設定する。
ステツプ16−3においてメモリ学習データから
学習単語のポインタを1つ取り出す。
ステツプ16−4において、取り出された学習単
語ポインタに基づき、辞書DICを参照し、その位
置の単語情報である実体データ(読み、表記、品
詞)を取り出す。
ステツプ16−5において、取り出された実体デ
ータをワーク領域上に設定されているデイスク学
習データに登録する。
ステツプ16−6において、全ての学習単語につ
いて処理が終了しているかどうか判定し、終了し
ていないときは、ステツプ16−1にループ子、今
までの処理を繰り返す。終了しているときは、ス
テツプ16−7に分岐する。
ステツプ16−7においてワーク領域上のデイス
ク学習データを外部メモリに保存する。
ステツプ16−8においてデイスク学習データの
ために確保されたワーク領域を解放し、処理を終
了する。
[他の実施例] 以上の説明において、辞書の格納されるメモリ
としてROMの場合を説明したが、書込不可メモ
リであれば事情は全て同じであり、本発明を適用
可能である。例えば、光デイスク、CDROMなど
であつても、書込ができないため直接単語に対応
した学習データ(頻度データ)を持つことができ
ないが、本発明の原理で辞書のバージヨンに依存
しない学習データを構成することができる。
また、メモリ学習データの持ち方としてアドレ
スを持つようにしたが、メモリ容量が少なくて済
む代わりに辞書内容に依存する持ち方であれば、
どのような持ち方でも同様である。例えば、辞書
の先頭からの単語の連番に対応して頻度情報を記
憶するようにしても同様の構成で処理することが
できる。
デイスク学習データの持ち方として単語情報
(実体データ)を全て持つように構成したが、辞
書中の単語を識別できるだけの情報を最小限持つ
様にも構成できる。その場合もやはり、メモリの
使用量は多大であるので事情が同じである。例え
ば、単語情報として「読み」「表記」だけを持つ
ようにすれば、通常は単語を特定できる。従つて
デイスク学習データには「読み」「表記」のみを
格納するに構成しても良い。
[発明の効果] 以上説明したごとく、本発明によれば、起動時
に、外部に記憶された学習単語の実体データに基
づいて、この学習単語の辞書上のポインタを求め
ておき、仮名漢字変換の際には、このポインタに
対応する単語を優先させて変換を行うことによ
り、少ないメモリ使用量で、辞書の内容に依存し
ない学習が実現できるという効果がある。
【図面の簡単な説明】
第1図は本発明の全体構成のブロツク図、第2
図は本発明における仮名漢字変換の操作例を示し
た図、第3図は本発明における入力バツフア
IBUFの構成を示した図、第4図は本発明におけ
るテキストバツフアTBUFの構成を示した図、
第5図は本発明における同音語バツフアDOBUF
の構成を示した図、第6図は本発明における辞書
DIC構成を示した図、第7図は本発明におけるデ
イスク学習データDLEARNの構成を示した図、
第8図は本発明におけるメモリ学習データ
MLEARNの構成を示した図、第9図は本発明に
おける自立語候補テーブルJCTBLの構成を示し
た図、第10図〜第16図は本発明文字処理装置
の動作を示すフローチヤート。 DISK……外部メモリ、CPU……マイクロプロ
セツサ、ROM……読出し専用メモリ、RAM…
…ランダムアクセスメモリ、DIC……仮名漢字変
換用辞書、IBUF……入力バツフア、TBUF……
テキストバツフア、DOBUF……同音語バツフ
ア、MLEARN……メモリ学習データ、JCTBL
……自立語候補テーブル、DLEARN……デイス
ク学習データ。

Claims (1)

  1. 【特許請求の範囲】 1 仮名文字列を入力するための入力手段と、 単語の読みと、表記を含む単語情報とが対応し
    て記憶された辞書手段と、 該辞書手段を参照して、前記入力手段より入力
    された仮名文字列を、当該仮名文字列を読みとす
    る単語の表記に変換する変換手段と、 該変換手段により変換された単語より、第1の
    指示に応答して1つの単語を選択する選択手段
    と、 該選択手段により選択された単語の前記辞書手
    段におけるポインタを記憶する学習単語ポインタ
    記憶手段と、 前記変換手段による変換の際に、前記入力され
    た仮名文字列を読みとする単語の前記辞書手段に
    おけるポインタを求め、求められた当該ポインタ
    と一致するポインタが前記学習単語ポインタ記憶
    手段に記憶されているかを判定し、記憶されてい
    ると判定された場合には、当該ポインタに対応す
    る単語を変換結果として優先させる第1制御手段
    と、 第2の指示を受けて、前記辞書手段より、前記
    学習単語ポインタ記憶手段に記憶されたポインタ
    の位置に記憶された単語情報を抽出して、抽出さ
    れた単語情報を前記外部記憶手段に記憶させる記
    憶制御手段と、 起動時に、前記外部記憶手段に記憶された単語
    と一致する単語を前記辞書手段より検索し、当該
    検索により一致した単語の前記辞書手段上のポイ
    ンタを求め、求められた当該ポインタにより前記
    学習単語ポインタ記憶手段の記憶内容を更新させ
    る第2制御手段とを有することを特徴とする文字
    処理装置。
JP1255501A 1989-09-29 1989-09-29 文字処理装置 Granted JPH03116370A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1255501A JPH03116370A (ja) 1989-09-29 1989-09-29 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1255501A JPH03116370A (ja) 1989-09-29 1989-09-29 文字処理装置

Publications (2)

Publication Number Publication Date
JPH03116370A JPH03116370A (ja) 1991-05-17
JPH0576066B2 true JPH0576066B2 (ja) 1993-10-21

Family

ID=17279629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1255501A Granted JPH03116370A (ja) 1989-09-29 1989-09-29 文字処理装置

Country Status (1)

Country Link
JP (1) JPH03116370A (ja)

Also Published As

Publication number Publication date
JPH03116370A (ja) 1991-05-17

Similar Documents

Publication Publication Date Title
JP3337161B2 (ja) 構造化文書を編集するための方法
US5802482A (en) System and method for processing graphic language characters
US5742838A (en) Method for conversion mode selection in hangeul to hanja character conversion
JPH0576066B2 (ja)
JP2862236B2 (ja) 文字処理装置
JPH0576065B2 (ja)
JP3847801B2 (ja) 文字処理装置及びその処理方法
JPH0630104B2 (ja) 文字処理装置
JPH0628059B2 (ja) 文字処理装置
JPS646499B2 (ja)
JP2771020B2 (ja) 文字処理装置
JPH0628060B2 (ja) 文字処理装置
JPH03118661A (ja) 単語検索装置
JPS61265633A (ja) 発音記号による辞書検索処理方式
JPH11184854A (ja) 電子辞書
JPH0638254B2 (ja) 仮名漢字変換装置
JPS6380361A (ja) 言語情報処理装置
JPS6116117B2 (ja)
JPS59165124A (ja) 日本語ワ−ド・プロセツサ
JPS62282364A (ja) 文字列検索方式
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JPH01204174A (ja) 文字処理装置
JPH0724057B2 (ja) 電子機器
JPS6278673A (ja) 仮名漢字変換装置
JPS63298564A (ja) 日本語文書作成装置