JPH0576066B2

JPH0576066B2 -

Info

Publication number: JPH0576066B2
Application number: JP1255501A
Authority: JP
Inventors: Eiichiro Toshima
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1989-09-29
Filing date: 1989-09-29
Publication date: 1993-10-21
Also published as: JPH03116370A

Description

【発明の詳細な説明】［産業上の利用分野］本発明は仮名漢字変換により漢字仮名混り文を
入力する文字処理装置に関し、更にいえば、仮名
漢字変換の学習機構に関する。

［従来の技術］現在、日本ワードプロセツサなどの文字処理装
置は漢字仮名混り文の入力を仮名漢字変換を使つ
て行なうことが一般的である。

従来、仮名漢字変換用辞書は外部メモリ（フロ
ツピーデイスク、ハードデイスク）に格納するこ
とが多かつた。ところが、一括変換等の変換方式
の改良が進むことにより辞書アクセスの回数が増
大し、他方、変換のスピードアツプ要求も高まつ
てきたことから、辞書を高速アクセス可能な内部
メモリに格納する方式が主流となつている。

内部メモリには、読込／書込ともに可能で揮発
性（電源を切ると記憶内容が消えてしまう）の
RAMと、書込が不可能であるが不揮発性（電源
を切つても記憶内容が消えない）のROMの２種
類が一般に広く使用されている。

辞書をRAMに持つ場合、仮名漢字変換する前
の準備として辞書を外部メモリからRAMにロー
ドすることになるが、ロード時間がかかるという
欠点があり、更に、RAMの方がROMよりも高
価であるためコストが高くなるという欠点もあ
る。このため、現在では、辞書をROMに記憶す
るのが一般的である。

このように辞書がROM化されるため、学習方
式も従来と変わつてきている。従来の学習方式
は、辞書内の単語の順位を実際に並べ替える、辞
書内に持つた順位情報（頻度情報）を更新して学
習する、などの手法が取られていたが、ROM内
の情報は変更できないので、辞書の領域とは別の
RAM領域に学習情報を記憶せざるをえない。そ
こで、以下に示すいくつかの手法が今までに提案
されている。

まず第１の方式は、辞書上の単語と対応づけて
頻度情報のみを記述した学習データを持つ方式で
ある。対応の取り方は辞書先頭から数えて何番目
の単語であるか（連番）などが使用される。すな
わち、辞書先頭の単語の頻度情報は学習データの
１番目に格納され、辞書先頭から２番目の単語の
頻度情報は学習データの２番目に格納される。以
下、同じように格納される。

第２の方式は、学習されている単語に対して、
該単語の辞書上での存在アドレスを記憶する方式
である。

第３の方式は、学習されている単語について単
にアドレスを記憶するのではなく、辞書上の単語
情報の全体（実体データ）を記憶した、本物の辞
書のサブセツトである学習辞書を作成し、変換時
に学習辞書に記載されている単語を優先的に変換
するという方式である。

［発明が解決しようとしている問題点］以上、挙げた３つの学習方式はいずれも欠点が
ある。

第１の方式、第２の方式の欠点は、学習データ
が辞書ROMの内容に依存したデータとなるとい
う点である。

第１の方式では、新しい単語が追加された場合
や既にある単語が削除された場合、それ以降の学
習データをシフトしなければならない。

第２の方式では、更に状況が厳しくなり、辞書
に何らかの変化があつた場合、すなわち、新しい
単語が追加された場合、既にある単語が削除され
た場合、単語の情報が訂正された場合、各単語の
存在アドレスが狂うと、それ以降の単語に関する
学習データに対してアドレス値を補正しなければ
ならない。

もちろん、どの方式も、辞書の内容にどのよう
な修正があつたかが分かれば学習データを補正す
ることは可能であるが、一般に辞書内容を更新す
る際は、更新箇所が多岐に渡るので、辞書内容の
変化を知ることは現実的ではない。

また、第３の方式は辞書ROMの内容には依存
しないが、単語情報をそのままの形で持つので、
学習データ用に相当なメモリが必要であるという
欠点がある。例えば、１単語当たり10バイトの単
語情報が必要であれば、学習されている単語が１
万語あつたとすると、学習データとして約100K
バイトものメモリが必要であり、現実的にはこの
方式を採用することはできない。

すなわち、従来の学習方式では辞書の内容に変
化があつた場合、互換性を確保できないという欠
点があり、どうしても互換性を確保したい場合に
は膨大な学習データ用のメモリが要求されてい
た。

［問題点を解決するための手段（及び作用）］上記問題点を解決するために、本発明によれ
ば、文字処理装置に、仮名文字列を入力するため
の入力手段と、単語の読みと、表記を含む単語情
報とが対応して記憶された辞書手段と、該辞書手
段を参照して、前記入力手段より入力された仮名
文字列を、当該仮名文字列を読みとする単語の表
記に変換する変換手段と、該変換手段により変換
された単語より、第１の指示に応答して１つの単
語を選択する選択手段と、該選択手段により選択
された単語の前記辞書手段におけるポインタを記
憶する学習単語ポインタ記憶手段と、前記変換手
段による変換の際に、前記入力された仮名文字列
を読みとする単語の前記辞書手段におけるポイン
タを求め、求められた当該ポインタと一致するポ
インタが前記学習単語ポインタ記憶手段に記憶さ
れているかを判定し、記憶されていると判定され
た場合には、当該ポインタに対応する単語を変換
結果として優先させる第１制御手段と、第２の指
示を受けて、前記辞書手段より、前記学習単語ポ
インタ記憶手段に記憶されたポインタの位置に記
憶された単語情報を抽出して、抽出された単語情
報を前記外部記憶手段に記憶させる記憶制御手段
と、起動時に、前記外部記憶手段に記憶された単
語と一致する単語を前記辞書手段より検索し、当
該検索により一致した単語の前記辞書手段上のポ
インタを求め、求められた当該ポインタにより前
記学習単語ポインタ記憶手段の記憶内容を更新さ
せる第２制御手段とを具えたことにより、変換の
際に参照する辞書の内容が異なつても、以前選択
された単語を優先して変換できるようにしたもの
である。

［実施例］以下図面を参照しながら本発明を詳細に説明す
る。

第１図は本発明の全体構成の一例である。

図示の構成において、CPUは、マイクロプロ
セツサであり、文字処理のための演算、論理判断
等を行ない、アドレスバスAB、コントロールバ
スCB、データバスDBを介して、それらのバスに
接続された各構成要素を制御する。

アドレスバスABはマイクロプロセツサCPUの
制御の対象とする構成要素を指示するアドレス信
号を転送する。コントロールバスCBはマイクロ
プロセツサCPUの制御の対象とする各構成要素
のコントロール信号を転送して印加する。データ
バスDBは各構成機器相互間のデータの転送を行
なう。

つぎにROMは、読出し専用の固定メモリであ
り、第１０図〜第１６図につき後述するマイクロ
プロセツサCPUによる制御の手順、及び、仮名
漢字変換用辞書DICを記憶させておく。

また、RAMは、１ワード16ビツトの構成の書
込み可能のランダムアクセスメモリであつて、各
構成要素からの各種データの一時記憶に用いる。
IBUFは入力バツフアであり、キーボードからの
入力キーデータが一時記憶される。TBUFはテ
キストバツフアであり、入力編集中のテキストデ
ータが記憶される。DOBUFは同音語バツフアで
あり、テキストバツフアTBUFは記憶される文
字に同音語候補が存在するときはその候補が記憶
される。MLEARNはメモリ学習データであり、
仮名漢字変換用辞書DIC上の単語のうち、学習さ
れているもののアドレスが記憶される。JCTBL
は自立語候補テーブルであり、仮名漢字変換中に
必要な自立語の存在位置、及び学習の有無を一時
的に記憶するためのテーブルである。

KBはキーボードであつて、アルフアベツトキ
ー、ひらかなキー、カタカナキー等の文字記号入
力キー、及び、変換キー、次候補キー、選択キ
ー、学習保存キー等の本文字処理装置に対する各
種機能を指示するための各種のフアンクシヨンキ
ーを備えている。

DISKはテキストデータ、デイスク学習データ
DLEARNを保存するための外部メモリである。
テキストデータ、デイスク学習データは必要に応
じて保管され、また、保管されたデータはキーボ
ードの指示により必要な時呼び出される。

CRはカーソルレジスタである。CPUにより、
カーソルレジスタの内容を読み書きできる。後述
するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置
にカーソルを表示する。

DBUFは表示用バツフアメモリで、表示すべ
きデータのパターンを蓄える。テキストの内容を
表示するときはテキストバツフアTBUFの内容
に応じて表示パターンがDBUFに作成されるこ
とにより、表示されることになる。

CRTCはカーソルレジスタCR及びバツフア
DBUFに蓄えられた内容を表示器CRTに表示す
る役割を担う。

またCRTは陰極線管等を用いた表示装置であ
り、その表示装置CRTにおけるドツト構成の表
示パターンおよびカーソルの表示をCRTコント
ローラで制御する。

さらに、CGはキヤラクタジエネレータであつ
て、表示装置CRTに表示する文字、記号のパタ
ーンを記憶するものである。

かかる各構成要素からなる本発明文字処理装置
においては、キーボードKBからの各種の入力に
応じて作動するものであつて、キーボードKBか
らの入力が供給されると、まず、インタラプト信
号がマイクロプロセツサCPUに送られ、そのマ
イクロプロセツサCPUがROM内に記憶してある
各種の制御信号を読出し、それらの制御信号に従
つて各種の制御が行なわれる。

第２図は本発明装置による変換操作の例を示し
た図である。２−１はまず初期画面を示したもの
である。２−２は読み列「きかい」を入力した時
の画面を示している。カーソルは入力読み列の次
に表示されている。ここで変換キーを打鍵すると
２−３の画面になる。２−３では読み列「きか
い」が「機械」と変換されている。これは望む変
換ではないので、次候補キーを打鍵すると２−４
の画面になる。ここで「きかい」の変換候補が表
示される。第１候補は「機械」であり、第２候補
は「機会」である。現在の候補は第２候補の「機
会」であり、２が反転表示している。ここで選択
キーを打鍵すると、２−５の画面になる。第２候
補の「機会」が確定してテキストデータの中に格
納され、同時に「機会」が学習される。学習結果
はメモリ上の学習データに記憶される。もう一度
「きかい」と入力すると２−６の画面になる。更
に変換キーを打鍵すると２−７の画面になり、今
度は「機会」学習されているので、第１候補とし
て「機会」が表示されている。

今までの操作では学習結果はメモリ内で反映さ
れているだけであり、保存するためには学習保存
キーを打鍵する必要がある。そうすると学習結果
が外部記憶に保存されることになる。

第３図は入力バツフアIBUFの構成を示した図
である。

入力バツフアはキーボードから入力されたキー
データを記憶するバツフアである。先頭の２バイ
トはバツフア長であり、入力バツフアに格納され
ているキーデータのうち有効なものの長さが図に
示すように格納される。３バイト目以降からキー
データが格納される。キーデータは１文字２バイ
トで格納される。例えば、JIS Ｘ 0208コードが
使用される。図中入力末にある「／」は変換キー
が打鍵されたことを意味する。

第４図はテキストバツフアTBUFの構成を示
した図である。

テキストバツフアは文字の羅列から構成され、
各文字は２バイトで構成される。各文字のMSB
は同音語フラグであり、０は通常文字、１が同音
語を意味する。残りの15ビツトは通常文字のとき
は文字コードを表現し、同音語のときは同音語番
号を表現する。文字コードは例えば、JIS Ｘ
0208コードを使用する。同音語番号は第５図に示
す同音語バツフアDOBUF上のどの同音語である
かを示す番号である。

第５図は同音語バツフアDOBUFの構成を示し
た図である。各同音語には同音語番号が付いてお
り、それによつて識別される。

各同音語は「読み」「現候補番号」「第ｉ候補情
報」からなる。

「読み」はその同音語の読みを格納する。

「現候補番号」はその同音語の現在表示されて
いる候補番号が格納される。変換直後初値に第１
候補が表示されるから「１」が格納される。

「第ｉ候補情報」は各候補の表記、及び、学習
のための自立語の存在アドレス等が格納される。

第６図は辞書DICの構成を示した図である。辞
書はROM上に存在する。従つて、内容を変更す
ることはできない。

各単語データは「読み」「表記」「品詞」からな
る。

「読み」には単語の読み情報、例えば、「機械」
であれば「きかい」が記憶される。コードはJIS
Ｘ 0208コードの下位バイトなどを使用し、１文
字１バイトで格納される。

「表記」には単語の表記情報、例えば、「機械」
であれば、「機械」という字面が１文字２バイト
でJIS Ｘ 0208コード等を使用して格納される。

「品詞」は単語の品詞、例えば、「機械」であ
れば、「名詞」が格納される。

辞書の単語データは読みの昇順（辞書式配列）
で格納される。

第６図はデイスク学習データDLEARNの構成
を示した図である。

デイスク学習データは外部メモリに保存されて
いる。電源立ち上げ時に外部メモリからRAM上
のワークエリアにロードされ、第７図に示すメモ
リ学習データを作成するために使用される。メモ
リ学習データの作成が終るとロードされたワーク
エリアは解放される。すなわち、デイスク学習デ
ータがRAM上に存在するのはほんの一瞬であ
る。

図に示すように学習されている単語の実体デー
タが「読み」「表記」「品詞」の３つのフイールド
から構成される。

学習単語は、通常、辞書DICに存在するはずで
あり、存在する時は辞書DIC上の読み、表記、品
詞がそのまま記憶されることになる。

図中では学習単語１は「機会」、学習単語２は
「校正」となつている。

辞書ROMがバージヨンアツプ（機能アツプ）
された場合など、学習単語として辞書DICに存在
しない単語が記述されている場合があるが、その
場合、存在しない削除単語はメモリ学習データに
は反映されない。

第８図はメモリ学習データMLEARNの詳細構
成を示した図である。

メモリ学習データにはデイスク学習データに格
納されている学習単語一つ一つに対して、その単
語が辞書DICのどこに存在するかを記憶してい
る。

例えば、学習単語１は第７図によると「機会」
であるので、辞書DIC上の「機会」の存在するア
ドレスを第１エントリーとして格納する。同様に
学習単語２については「校正」の存在するアドレ
スを第２エントリーとして格納する。

メモリ学習データは学習データの使用メモリを
減らすために存在するデータであり、このデータ
がなくても、デイスク学習データと、辞書DICと
からいつでも再作成できる。

このように、メモリ学習データは、辞書DICの
バージヨンに依存するデータである。辞書DICに
応じて再作成の必要がある。

第９図は自立語候補テーブルJCTBLの構成を
示した図である。

自立語候補テーブルは仮名漢字変換処理を行な
う過程において、入力読み列の解析を行なうのに
必要な単語が辞書DICのどこに存在するか、ある
いは学習されているかどうかを一時的に記憶した
テーブルである。

例えば、入力読み列が「きかいしんこうかいか
ん」であつたときは、その解析のために「き」
「きか」「きかい」「か」「かい」「かいし」「かいし
ん」などの単語が必要であり、それらの単語の辞
書DIC上での存在位置がフイールド「ポインタ」
に設定される。

また、メモリ学習データMLEARNに基づい
て、学習されているかどうかがビツト学習フラグ
に設定される。その単語が学習されているとき
「１」が格納され、学習されていないとき「０」
が格納される。

図の場合、「機会」「会心」のみが学習されてい
るとして、学習フラグには「１」が格納されてい
る。他の単語には「０」が格納されている。

上述の実施例の動作をフローに従つて説明す
る。

第１０図はキー入力を取り込み、処理を行なう
部分のフローチヤートである。

ステツプ10−１はメモリ学習データ作成処理で
あり、第１１図に示すようにメモリ学習データの
初期設定を行なう。この処理は通常、電源ON直
後に１回だけ実行される。

ステツプ10−２はキーボードからのデータを取
り込む処理である。ステツプ10−３で取り込まれ
たキーの種別を判定し、各キーの処理ルーチンに
分岐する。

変換キーが入力されたときはステツプ10−４に
分岐し、ステツプ10−４において第１２図に詳述
するように仮名漢字変換の変換処理が行なわれ
る。その後ステツプ10−９の表示処理に分岐す
る。

次候補キーが入力されたときはステツプ10−５
に分岐し、ステツプ10−５において第１４図に詳
述する次候補処理が行なわれる。その後ステツプ
10−９の表示処理に分岐する。

選択キーが入力されたときはステツプ10−６に
分岐し、ステツプ10−６において第１５図に詳述
する選択処理が行なわれる。その後ステツプ10−
９の表示処理に分岐する。

学習保存キーが入力されたときはステツプ10−
７に分岐し、ステツプ10−７において第１６図に
詳述する学習保存処理が行なわれる。その後ステ
ツプ10−９の表示処理に分岐する。

その他のキーのときはステツプ10−８に分岐
し、挿入、削除等の通常の文字処理装置において
行なわれるその他の処理が行なわれる。その後ス
テツプ10−９の表示処理に分岐する。

ステツプ10−９において今までの処理結果の表
示処理を行ない、その後10−２にループし、もう
一度キー入力をGETする。

第１１図はステツプ10−１の「メモリ学習デー
タ作成処理」を詳細化したフローチヤートであ
る。

ステツプ11−１において、まずデイスク学習デ
ータをロードするのに必要なワーク領域をRAM
上に確保する。

ステツプ11−２においてデイスク学習データを
外部記憶から確保されたワーク領域にロードす
る。

ステツプ11−３においてメモリ学習データを初
期設定する。

ステツプ11−４において、学習単語をワーク領
域上のデイスク学習データから１単語取り出す。

ステツプ11−５において全ての学習単語につい
て処理が終了したかどうか判定し、処理が終了し
ている時はステツプ11−８のワーク領域解放処理
に分岐する。処理が終了していない時はステツプ
11−６の学習単語アドレス決定に進む。

ステツプ11−６において、取り出された学習単
語と同じものが辞書DIC上のどこに存在するかサ
ーチし、そのアドレスを求める。

ステツプ11−７において、上記求めたアドレス
をメモリ学習データアドレス部に設定する。辞書
DIC上に存在しなかつたときは設定は行なわれな
い。

ついで、次の学習単語の処理を行なわれないと
いけないのでステツプ11−４に分岐する。

ステツプ11−８において、デイスク学習データ
のために確保されたワーク領域を解放し、リター
ンする。

第１２図はステツプ10−４の「変換処理」を詳
細化したフローチヤートである。

ステツプ12−１において入力読み列の解析に必
要な単語を自立語候補テーブルJCTBLに登録す
るために第１３図に詳述する単語サーチ処理を行
なう。

ステツプ12−２において、形態素解析、構文解
析等を行なつて入力読み列を解析し、文節候補を
作成する。

ステツプ12−３において、各文節候補の尤度を
計算し、どの文節を変換するのが最も尤もらしい
かを判断し、第１候補として決定する。このと
き、自立語候補テーブルで学習フラグがONにな
つている単語は尤度的に有利であり、第１候補と
して変換され易い。

ステツプ12−４において、決定された第１候補
に基づいて同音語バツフアを作成し、変換結果を
テキストバツフアに出力する。

第１３図はステツプ12−１の「単語サーチ処
理」を詳細化したフローチヤートである。

ステツプ13−１において、辞書DICより入力読
み列の解析に必要な単語の読み（サーチすべき読
み）を１つ決定する。

ステツプ13−２においてサーチすべき読みがな
くなつたかどうか判定し、なくなつた時はリター
ンする。

ステツプ13−３においてサーチすべき読みにつ
いて実際に辞書DICをサーチし、アドレスを求め
る。

ステツプ13−４において見つかつたアドレスが
メモリ学習データに記載されているかどうかを判
定するためメモリ学習データをサーチする。

ステツプ13−５において一致するアドレスがあ
つたかどうか判定し、もし、存在すれば、その単
語は学習されていると見なされるから、ステツプ
13−６において自立語候補テーブルの学習フラグ
に「１」をセツトし、存在しなければ、学習され
ていないわけであるからステツプ13−７において
学習フラグに「０」を設定する。その後、ステツ
プ13−１に分岐し、次のサーチ読みの処理に移
る。

第１４図はステツプ10−５の「次候補処理」を
詳細化したフローチヤートである。

ステツプ14−１において、次候補を見るべき同
音語の同音語番号をテキストバツフアTBUFよ
り求める。

ステツプ14−２において、同音語番号から同音
語バツフアの位置を求めて、現候補番号をカウン
トアツプする。

第１５図はステツプ10−６の「選択処理」を詳
細化したフローチヤートである。

ステツプ15−１において、選択すべき同音語の
同音語番号をテキストバツフアTBUFより求め
る。

ステツプ15−２において、同音語番号から同音
語バツフアの位置を求めて、現候補番号の示す候
補情報から表記を取り出し、テキストバツフア
TBUFに確定文字として設定する。

ステツプ15−３において、同様に、現候補番号
の示す候補情報から自立語の存在するアドレスを
求め、メモリ学習データMLEARNに登録する。

第１６図はステツプ10−７の「学習保存処理」
を詳細化したフローチヤートである。

ステツプ16−１において、まずデイスク学習デ
ータに必要なワーク領域をRAM上に確保する。

ステツプ16−２においてワーク領域をデイスク
学習データとして初期設定する。

ステツプ16−３においてメモリ学習データから
学習単語のポインタを１つ取り出す。

ステツプ16−４において、取り出された学習単
語ポインタに基づき、辞書DICを参照し、その位
置の単語情報である実体データ（読み、表記、品
詞）を取り出す。

ステツプ16−５において、取り出された実体デ
ータをワーク領域上に設定されているデイスク学
習データに登録する。

ステツプ16−６において、全ての学習単語につ
いて処理が終了しているかどうか判定し、終了し
ていないときは、ステツプ16−１にループ子、今
までの処理を繰り返す。終了しているときは、ス
テツプ16−７に分岐する。

ステツプ16−７においてワーク領域上のデイス
ク学習データを外部メモリに保存する。

ステツプ16−８においてデイスク学習データの
ために確保されたワーク領域を解放し、処理を終
了する。

［他の実施例］以上の説明において、辞書の格納されるメモリ
としてROMの場合を説明したが、書込不可メモ
リであれば事情は全て同じであり、本発明を適用
可能である。例えば、光デイスク、CDROMなど
であつても、書込ができないため直接単語に対応
した学習データ（頻度データ）を持つことができ
ないが、本発明の原理で辞書のバージヨンに依存
しない学習データを構成することができる。

また、メモリ学習データの持ち方としてアドレ
スを持つようにしたが、メモリ容量が少なくて済
む代わりに辞書内容に依存する持ち方であれば、
どのような持ち方でも同様である。例えば、辞書
の先頭からの単語の連番に対応して頻度情報を記
憶するようにしても同様の構成で処理することが
できる。

デイスク学習データの持ち方として単語情報
（実体データ）を全て持つように構成したが、辞
書中の単語を識別できるだけの情報を最小限持つ
様にも構成できる。その場合もやはり、メモリの
使用量は多大であるので事情が同じである。例え
ば、単語情報として「読み」「表記」だけを持つ
ようにすれば、通常は単語を特定できる。従つて
デイスク学習データには「読み」「表記」のみを
格納するに構成しても良い。

［発明の効果］以上説明したごとく、本発明によれば、起動時
に、外部に記憶された学習単語の実体データに基
づいて、この学習単語の辞書上のポインタを求め
ておき、仮名漢字変換の際には、このポインタに
対応する単語を優先させて変換を行うことによ
り、少ないメモリ使用量で、辞書の内容に依存し
ない学習が実現できるという効果がある。

【図面の簡単な説明】

第１図は本発明の全体構成のブロツク図、第２
図は本発明における仮名漢字変換の操作例を示し
た図、第３図は本発明における入力バツフア
IBUFの構成を示した図、第４図は本発明におけ
るテキストバツフアTBUFの構成を示した図、
第５図は本発明における同音語バツフアDOBUF
の構成を示した図、第６図は本発明における辞書
DIC構成を示した図、第７図は本発明におけるデ
イスク学習データDLEARNの構成を示した図、
第８図は本発明におけるメモリ学習データ
MLEARNの構成を示した図、第９図は本発明に
おける自立語候補テーブルJCTBLの構成を示し
た図、第１０図〜第１６図は本発明文字処理装置
の動作を示すフローチヤート。 DISK……外部メモリ、CPU……マイクロプロ
セツサ、ROM……読出し専用メモリ、RAM…
…ランダムアクセスメモリ、DIC……仮名漢字変
換用辞書、IBUF……入力バツフア、TBUF……
テキストバツフア、DOBUF……同音語バツフ
ア、MLEARN……メモリ学習データ、JCTBL
……自立語候補テーブル、DLEARN……デイス
ク学習データ。

Claims

【特許請求の範囲】１仮名文字列を入力するための入力手段と、単語の読みと、表記を含む単語情報とが対応し
て記憶された辞書手段と、該辞書手段を参照して、前記入力手段より入力
された仮名文字列を、当該仮名文字列を読みとす
る単語の表記に変換する変換手段と、該変換手段により変換された単語より、第１の
指示に応答して１つの単語を選択する選択手段
と、該選択手段により選択された単語の前記辞書手
段におけるポインタを記憶する学習単語ポインタ
記憶手段と、前記変換手段による変換の際に、前記入力され
た仮名文字列を読みとする単語の前記辞書手段に
おけるポインタを求め、求められた当該ポインタ
と一致するポインタが前記学習単語ポインタ記憶
手段に記憶されているかを判定し、記憶されてい
ると判定された場合には、当該ポインタに対応す
る単語を変換結果として優先させる第１制御手段
と、第２の指示を受けて、前記辞書手段より、前記
学習単語ポインタ記憶手段に記憶されたポインタ
の位置に記憶された単語情報を抽出して、抽出さ
れた単語情報を前記外部記憶手段に記憶させる記
憶制御手段と、起動時に、前記外部記憶手段に記憶された単語
と一致する単語を前記辞書手段より検索し、当該
検索により一致した単語の前記辞書手段上のポイ
ンタを求め、求められた当該ポインタにより前記
学習単語ポインタ記憶手段の記憶内容を更新させ
る第２制御手段とを有することを特徴とする文字
処理装置。