Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP3154875B2 - Kanji conversion learning device - Google Patents
[go: Go Back, main page]

JP3154875B2 - Kanji conversion learning device - Google Patents

Kanji conversion learning device

Info

Publication number
JP3154875B2
JP3154875B2 JP19637293A JP19637293A JP3154875B2 JP 3154875 B2 JP3154875 B2 JP 3154875B2 JP 19637293 A JP19637293 A JP 19637293A JP 19637293 A JP19637293 A JP 19637293A JP 3154875 B2 JP3154875 B2 JP 3154875B2
Authority
JP
Japan
Prior art keywords
word
unit
user
learning
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP19637293A
Other languages
Japanese (ja)
Other versions
JPH0749863A (en
Inventor
俊桔 郭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP19637293A priority Critical patent/JP3154875B2/en
Priority to CN94104905.1A priority patent/CN1101732A/en
Publication of JPH0749863A publication Critical patent/JPH0749863A/en
Application granted granted Critical
Publication of JP3154875B2 publication Critical patent/JP3154875B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は漢字変換装置用の学習装
置に関し、特に長期学習と短期学習を併用する漢字変換
学習装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a learning device for a kanji conversion device, and more particularly to a kanji conversion learning device using both long-term learning and short-term learning.

【0002】[0002]

【従来の技術】中国語ワードプロセッサー等における漢
字の読みによる入力方式は、例えばキーボードから使用
者の意図する単語(単語とは、複数の漢字から構成され
ていることが多いが、漢字一字からなるものをも包む。
また、後に説明するように句、短文的なもの等を含
む。)や漢字の読みを表わす表音文字列(日本語におい
ては本来単数と複数の区別が明確でないため、本明細書
でも両者を厳密には使い分けないが、一応、漢字列、表
音文字列と「列」があれば複数を指すものとする。)か
らなる読み記号を入力することによりなされる。そし
て、この表音文字列の漢字への変換は、ワードプロセッ
サーが第1に構成する漢字の数(中国語においては、こ
の値は音節の数に等しい。)の多い単語を優先する、第
2に先に入力された表音文字を優先するという二つの原
則を採用した最長一致法等によりこの入力された表音文
字列からなる読み記号を切り出し(以下においては、こ
の切り出された表音文字列を「形態素」とよぶこともあ
る。)、この切り出した読み記号を検索の鍵として辞書
部を検索して対応する単語を見つけ出し、その単語を構
成する漢字列に変換をすることによりなされる。(な
お、最長一致法については、本願出願人が特願平5−7
5911号、特願平5−75912号等にて公開してい
るがごとく、いわば周知の技術であるため、その説明は
省略する。)そしてもし、変換された単語が文字入力者
たる使用者の意図するものでない場合には、人手により
修正が行われる。このため、同音異義の漢字、単語が存
在する場合には、それらのなかから正しい漢字、単語が
早く正確に選び出されるならば、この入力方式の効率が
向上することとなる。ところで、この同音異義の漢字、
単語の選択問題を解決するための手段として、一般には
学習機能といわれるものが利用される。これは、使用者
の使用する同音異義の漢字、単語の使用頻度や使用回数
等を記録し、これを同音異義の漢字や単語間での選択に
反映させることにより、その選択成功率を高めんとする
ものである。この際、この使用頻度等の記録の内容は、
学習対象とする時間の長、短により短期学習と長期学習
との2種に分けられる。
2. Description of the Related Art In a Chinese word processor or the like, an input method by reading kanji is, for example, a word intended by a user from a keyboard (a word is often composed of a plurality of kanji, but is composed of one kanji. Wrap things.
It also includes phrases, short sentences, etc., as described later. ) And phonetic character strings that represent kanji readings (in Japanese, the distinction between singular and plural is not clear, so in this specification we will not use them strictly. If there is a "column", it indicates a plurality of characters.) The conversion of the phonetic character string into kanji is performed by giving priority to a word having a large number of kanji (the value is equal to the number of syllables in Chinese) firstly constituted by the word processor. The phonetic symbol composed of the input phonetic character string is cut out by the longest matching method or the like that adopts the two principles of giving priority to the phonetic character string input earlier (hereinafter, the cut-off phonetic character string is used). Is sometimes referred to as a "morpheme."), By using the cut-out reading symbols as a search key to search a dictionary part to find a corresponding word, and converting it into a kanji string constituting the word. (Note that the longest match method is described in Japanese Patent Application No.
As disclosed in Japanese Patent Application No. 5911, Japanese Patent Application No. 5-75912, etc., since it is a well-known technique, description thereof will be omitted. If the converted word is not intended by the user who is the character inputting person, the correction is made manually. For this reason, if there are homonymous kanji and words, if the correct kanji and word are quickly and accurately selected from them, the efficiency of this input method will be improved. By the way, this homonymous kanji,
As a means for solving the word selection problem, what is generally called a learning function is used. This method improves the selection success rate by recording the usage and the number of times of use of homonymous kanji and words used by the user, and reflecting this in the selection between homonymous kanji and words. It is assumed that. At this time, the content of the record such as the frequency of use,
There are two types of learning, short-term learning and long-term learning, depending on the length of time to be learned.

【0003】短期学習とは、同音異義の漢字、単語の選
択に際して、最新の使用を優先するものである。例え
ば、中国語の読み記号″i4″に対応する同音異義の漢
字は、通常の使用頻度の順に記すなら″意、億、易、
亦、益、翼、…″等であり、これらがこの順に配列され
た上で辞書部に格納されている。そしてもし、これらの
同音異義の漢字のうち使用者の使用した最新の文字が″
翼″である場合、その格納順序は″翼、意、億、易、
亦、益、…″になり、次回に同じ読み記号″i4″が入
力されると、″翼″が自動的に最優先して選択されるこ
ととなる。但し、もし、使用者が次の″i4″の入力に
際して″益″を選んだならば、この″益″が次回の″i
4″の入力に際して最優先して漢字変換の対象とされる
べく先頭に配置される。このため、″翼″は優先順位が
1つ下がり、ひいては″i4″に対応する同音異義の漢
字の配置は″益、翼、意、億、易、亦、…″となる。こ
の方式の利点は、最新使用の漢字、単語は自動的に先頭
に配置されることとなるので、一般的には使用者の入力
に対して正確な漢字、単語を選択することにある。欠点
は、あまり使用されない漢字や単語さえも学習対象とさ
れるので、作成される文書の性質や使用者の文書作成に
あたっての単語、漢字選定の癖等のためたまたまかかる
漢字や単語の使用が多い場合には、これらの漢字や単語
が変換率に大きな悪影響を与えることにある。
[0003] Short-term learning is to prioritize the latest use when selecting homonymous kanji and words. For example, the homonymous kanji corresponding to the Chinese phonetic symbol "i4" can be written in the order of normal usage as "mean, million, easy,
In addition, the characters are arranged in this order and stored in the dictionary. If the latest character used by the user among these homonymous kanji is ″
If it is "wing," the order of storage is "wing, meaning, billion, easy,
When the same reading symbol "i4" is input next time, "wing" is automatically selected with the highest priority. If "benefit" is selected when inputting "i4", this "benefit" will be used in the next "i".
When inputting "4", it is placed at the top to be the subject of kanji conversion with the highest priority, so that "wing" has one lower priority, and consequently the arrangement of homonymous kanji corresponding to "i4" Is "Masu, Tsubasa, Min, Billion, Easy, ..." The advantage of this method is that the most recently used kanji and words are automatically placed at the beginning, so they are generally used. The disadvantage is to select the correct kanji and words for the user's input.The disadvantage is that even rarely used kanji and words are targeted for learning, so the nature of the created document and the user's When kanji or words that happen to be used frequently due to the habit of selecting words or kanji, etc., are frequently used, these kanji or words have a large adverse effect on the conversion rate.

【0004】長期学習とは、同音異義の漢字、単語毎に
それらの使用回数を記憶し、その使用頻度の高い順に、
同音異義の漢字、単語を配置の上格納する。この上で、
先に格納された同音異義の漢字、単語が優先して選択さ
れるものである。この方式の利点は、使用頻度の低い漢
字、単語が多々使用されるという例外的な場合に漢字の
正確な変換率が低くなることが避けられることにある。
その欠点は漢字、単語毎に、その使用頻度をも格納する
こととなるので、必要な記憶資源の量が増大することで
ある。また、現在入力している文書に使用される漢字、
単語に対しての応答が遅れがちとなるのも欠点とされ
る。
[0004] Long-term learning is to store the number of times of use of homonymous kanji and words for each word.
Place and store homonymous kanji and words. On this,
The previously stored homonymous kanji and words are preferentially selected. The advantage of this method is that the conversion rate of the kanji is not lowered accurately in exceptional cases where the kanji and words are used infrequently.
The disadvantage is that the frequency of use is also stored for each kanji and word, so that the amount of required storage resources increases. Also, the kanji used for the currently input document,
The disadvantage is that the response to words tends to be delayed.

【0005】なお、辞書部内の読み記号の配列の順序、
単語の配列の変更、特定の単語毎の使用回数の記憶、誤
って漢字変換された場合の正しい漢字への訂正操作、こ
の操作のため切り出された表音文字列に対応する単語が
優先順位に応じてCRTの所定位置へ表示され、この表
示の中から使用者が所望のものを選択すること、この表
示にも所望の単語が含まれていない場合には使用者によ
るその旨の指示により更に下位の順位の単語が表示され
ること等は、日本語ワードプロセッサーにも広く採用さ
れている周知の技術である。このため、それらの説明は
省略する。また、辞書部内の読み音や単語の登録、格
納、記憶は、実際にはコード化された上で電磁気的な形
式で処理されているが、これらもいわば周知の技術であ
るため、その説明は省略する。
[0005] The order of arrangement of reading symbols in the dictionary section,
Change the arrangement of words, remember the number of uses for each specific word, correct kanji if it is erroneously converted to kanji, and prioritize the word corresponding to the phonetic character string cut out for this operation In response, the message is displayed at a predetermined position on the CRT, and the user selects a desired one from the display. If the display does not include a desired word, the user further instructs to that effect. Displaying words of lower rank is a well-known technique widely used in Japanese word processors. Therefore, their description is omitted. In addition, registration, storage, and storage of reading sounds and words in the dictionary unit are actually coded and then processed in an electromagnetic format. Omitted.

【0006】一般に、漢字入力装置は、上記二つの学習
方法のいずれか一方を採用し、更に、いくつかの改良を
行うことにより、その漢字変換の成功率を高めている。
日本語ワードプロセッサーにおける同音異義語の学習装
置を例にとって説明する。図8は、日本国特開昭61−
157972号公報に示されているこの装置の構成図で
ある。本図において、100はかな入力部であり、20
0は単語辞書部であり、300は文字変換部であり、4
00は同音語順序記憶部であり、500は同音語選択部
であり、600は表示部であり、700は単語辞書更新
部であり、800は単語辞書更新指定部であり、900
は同音語指定部である。かな入力部100は、読み記号
として日本語のひらがな、カタカナ等の表音文字(厳密
には、ひらがな等は「音素文字」であるが、後に説明す
るように本明細書では両者を区別しない。)を入力す
る。単語辞書部200は、あいうえお順からなる日本語
の単語読みとこれに対応する漢字を中心とした単語の表
記を対応づけた表とした上で、この対応表を50音順に
並べて記憶する。文字変換部300は、入力部から入力
されたかな文字列を同音語順序記憶部400と単語辞書
部200とを順に検索して、これに対応する漢字若しく
は漢字とかな文字からなる単語表記を得る(なお、ここ
に「単語表記」という用語を使用しているのは、日本語
ワードプロセッサーでは入力されたかなが全て漢字に変
換されるとは限らないことによる。例えばかな列「よび
だす」は「呼び出す」と変換されることを考慮したもの
である。ただし、中国語ワードプロセッサーにおける
「漢字」、「単語」と実質的な相違はない。)。また、
単語辞書部200内の検索においては、検索の鍵たる入
力かな列と一致した読みを持つ単語表記が複数ある場合
には、これらを先に格納されている順に選択し、入力か
な列とともに同音語選択部500へ出力する。同音語順
序記憶部400は、同音語選択部500から選ばれた同
音異義の単語表記をその読みと対応づけて選択された順
に記憶する。従って、新しく選択されたものほど後位に
配列されることとなる。このため、同音語順序記憶部4
00内の検索の順序は、使用が新しいものほど、優先さ
れることとなるよう単語表記が格納された順番と逆にな
される。同音語選択部500は、文字変換部300から
出力される単語表記に同音異義のものが存在する場合に
は、後述する同音語指定部900により文字入力者が意
図する単語表記を選択可能とさせる。表示部600は、
同音語選択部500で選択された単語表記を画面上に表
示することにより、使用者による漢字変換結果の確認や
特定の単語表記の指定を可能とさせる。単語辞書更新部
700は、上記同音語順序記憶部400内に記憶された
同音異義の単語表記の各々について、その重複されて使
用された回数を数え上げ、この数が規定の値たる「3」
を越す単語表記については、単語辞書部200内での当
該単語表記と同音の単語の配列において、当該単語表記
が先頭にくるように配置換えを行う。単語辞書更新指定
部800は、使用者による辞書部の更新指示を入力す
る。同音語指定部900は、使用者による同音異義の複
数の単語表記のなかから特定のものの指定或いは変換終
了指示が入力されるものである。
Generally, the kanji input device employs one of the above two learning methods, and further improves the success rate of the kanji conversion by making some improvements.
The following describes an example of a homonym learning device in a Japanese word processor. FIG.
It is a block diagram of this apparatus shown in Japanese Patent No. 157972. In the figure, reference numeral 100 denotes a kana input unit;
0 is a word dictionary, 300 is a character converter, 4
00 is a homonym order storage unit, 500 is a homonym selection unit, 600 is a display unit, 700 is a word dictionary update unit, 800 is a word dictionary update designation unit, 900
Is a homophone designation part. The kana input unit 100 uses phonetic characters such as Japanese hiragana and katakana as reading symbols (strictly speaking, hiragana and the like are "phoneme characters", but they will not be distinguished in the present specification as described later. ). The word dictionary unit 200 makes a table in which the Japanese word readings in the order of Ai and the corresponding notations of words centered on kanji are associated with each other, and stores the correspondence table in the order of the Japanese syllabary. The character conversion unit 300 sequentially searches the homophone sequence storage unit 400 and the word dictionary unit 200 for a kana character string input from the input unit, and obtains a corresponding kanji or a word notation composed of kanji and kana characters. (Note that the term "word notation" is used here because the Japanese word processor does not always convert all the input kana to kanji. For example, the kana sequence "call out" ). However, there is no substantial difference from "kanji" and "word" in Chinese word processors.) Also,
In the search in the word dictionary unit 200, when there are a plurality of word expressions having readings that match the input kana sequence which is the key of the search, these are selected in the order stored first, and the same kana sequence is input together with the input kana sequence. Output to selection section 500. The homophone order storage unit 400 stores the homonymous word expressions selected from the homophone selection unit 500 in association with their readings in the order of selection. Therefore, the newly selected one is arranged at the rear. For this reason, the homophone order storage unit 4
The order of the search in 00 is reversed from the order in which the word notations were stored, so that the newer the use, the higher the priority. The homonym selection unit 500 allows the character utterer to select a word notation intended by the character input unit by using a homonym designation unit 900 described later when the word notation output from the character conversion unit 300 includes a homonymous one. . The display unit 600
By displaying the word notation selected by the homonym selection unit 500 on the screen, it is possible for the user to check the result of the kanji conversion and to specify a specific word notation. The word dictionary updating unit 700 counts the number of times that each of the homonymous word notations stored in the homonym order storage unit 400 has been duplicated and used, and this number is a prescribed value “3”.
Are rearranged so that the word notation comes first in the arrangement of words having the same sound as the word notation in the word dictionary unit 200. The word dictionary update designation unit 800 inputs a dictionary unit update instruction from the user. The homonym designation section 900 is used to designate a specific one of a plurality of homonymous word expressions by a user or to input a conversion end instruction.

【0007】実際には、日本語ワードプロセッサーにお
いては、「呼び出す」のような単語表記があるため全て
のひらがなが漢字変換されるとは限らないこと、2つの
ひらがな「かき」が「柿」、「夏期」に変換されえる等
ひらがなと変換される漢字との間に一音節一漢字のごと
き一定の数的関係がないこと等のため、中国語ワードプ
ロセッサーにおける最長一致法はそのままでは使用され
ない。しかし、これらの相違は本発明の趣旨には無関係
であること、その一方ひらがなを検索の鍵として辞書部
内を検索することという変換に際しての大原則は同じで
あること、またいわゆる周知技術であることのため、日
本語ワードプロセッサーでの、辞書部検索のための入力
されたひらがなの切り出しのアルゴリズム等についての
説明は省略する。
Actually, in a Japanese word processor, not all hiragana characters are converted into kanji characters because there is a word notation such as "call". The longest matching method in a Chinese word processor is not used as it is because there is no fixed numerical relationship such as one syllable and one kanji between the hiragana and the kanji that can be converted in the summer. However, these differences are irrelevant to the gist of the present invention. On the other hand, the principle of conversion, that is, searching in the dictionary part using Hiragana as a search key, is the same, and it is a well-known technique. Therefore, description of an algorithm for extracting a hiragana input for a dictionary part search in a Japanese word processor will be omitted.

【0008】次に、この同音異義語の学習装置が漢字変
換を行なう際の処理の様子を、図9に示す動作流れ図を
参照しつつ説明する。S91では、かな入力部からかな
列を入力する。S92では、文字変換部は入力された仮
名がひらがな表記であることを確認する。ひらがな表記
である場合にはS93へ行く。もし、ひらがな表記では
ない場合には、直接にS95に入り、変換された文字列
を表示した後入力待ち状態になる。
Next, a description will be given of how the homonym learning device performs the kanji conversion with reference to an operation flowchart shown in FIG. In S91, a kana sequence is input from a kana input unit. In S92, the character conversion unit confirms that the input kana is in hiragana notation. If it is in hiragana, go to S93. If it is not the hiragana notation, the process directly goes to step S95, where the converted character string is displayed, and then an input wait state is set.

【0009】S93では、漢字変換処理に入り単語検索
を行なう。S94では、同音語選択部は上記検索された
結果により、処理しようとするかな列が同音異義の単語
表記を含むか否かを判定する。もし、含む場合には、S
96に行く。もし、含まないと判定された場合には、S
95にいく。S95では、表示部600により変換され
た文字列を表示する。そして、入力待ち状態になる。
In S93, a kanji conversion process is started, and a word search is performed. In S94, the homonym selection unit determines whether or not the kana sequence to be processed includes a homonymous word expression based on the searched result. If included, S
Go to 96. If it is determined that it does not include,
Go to 95. In S95, the display unit 600 displays the converted character string. Then, an input waiting state is set.

【0010】S96では、使用者に対する同音語選択指
示のガイダンスを表示画面上に出す。次に、同音異義の
単語表記の選択を行う際の処理の様子を、図10に示す
動作流れ図を参照しつつ説明する。S101では、使用
者は同音語指定部により、文字変換部から受け取った同
音異義の単語表記の中から意図するものを選択する。
In S96, guidance for the user to select a homonym is displayed on the display screen. Next, a description will be given, with reference to an operation flow chart shown in FIG. 10, of a process at the time of selecting a homonymous word notation. In S101, the user uses the homophone designation unit to select an intended one from the homonymous word notations received from the character conversion unit.

【0011】S102では、その選択が正しいことの確
認、(確定)を行なう。S103では、確定されたこの
単語表記を選択された順に並べて同音語順序記憶部に格
納し、この上で再度入力待ち状態になる。次に、単語辞
書部の更新を行なう際の処理の様子を図11に示す動作
流れ図を参照しつつ説明する。
In S102, it is confirmed that the selection is correct, and (confirmation) is performed. In S103, the determined word expressions are arranged in the selected order and stored in the homophone order storage unit, and then the input standby state is set again. Next, a process of updating the word dictionary will be described with reference to an operation flowchart shown in FIG.

【0012】S111では、使用者が単語辞書更新指定
部に単語辞書更新指示を入力することにより、単語辞書
更新部が起動する。S112では、同音語順序記憶部の
記憶する単語表記を調べ、もし重複して記憶されている
ものがあれば、その重複度数を数える。S113では、
単語辞書部で重複度数が3以上の単語表記に対しては、
その同音語中での格納の順序が先に選択されるよう配列
を更新する。この上で、次の入力待ち状態になる。
In step S111, when the user inputs a word dictionary update instruction to the word dictionary update designation unit, the word dictionary update unit starts. In step S112, the word notation stored in the homophone order storage unit is checked, and if there is a word that is stored in duplicate, the number of duplications is counted. In S113,
For word notation with a duplication frequency of 3 or more in the word dictionary,
The array is updated so that the order of storage in the homophone is selected first. Then, the system enters the next input waiting state.

【0013】以上の手順により、日本語の漢字変換、そ
してそれに伴う学習がなされる。
With the above procedure, Japanese kanji conversion and associated learning are performed.

【0014】[0014]

【発明が解決しようとする課題】しかしながら、上記従
来のような構成の漢字変換学習装置においては、以下の
ような問題点がある。 (1)同音異義の漢字、単語、単語表記の選択と辞書部
の更新を人手でなす必要がある。
However, the kanji conversion learning device having the above-mentioned configuration has the following problems. (1) It is necessary to manually select kanji, words, and word notations having the same homonym and update the dictionary part manually.

【0015】(2)単語辞書部、同音語順序記憶部に格
納されている同音異義の単語等の格納順序は学習機能に
よって変化する。このため、変換対象としている文章の
性質、使用者の文字等選択の癖等が変わると、単語辞書
部の格納順序を更新する必要がある。 (3)辞書部がROM(Read only memo
ry、読み出しのみ可能な記憶素子)で構成されている
場合には、単語辞書部を更新することができない。
(2) The storage order of homonymous words and the like stored in the word dictionary unit and the homophone order storage unit changes depending on the learning function. Therefore, when the character of the text to be converted and the user's habit of selecting characters and the like change, it is necessary to update the storage order of the word dictionary unit. (3) The dictionary unit is a ROM (Read only memory)
ry, a read-only storage element), the word dictionary cannot be updated.

【0016】(4)学習の対象は単語辞書部に限定され
ており、使用者が文書作成の便宜のため定義する単語は
対象外である。このため、どうしても漢字変換の効率に
一定の限界がある。 本発明は、以上の課題に鑑みなされたものであり、上記
(1)〜(4)の問題点を解決し、ひいては漢字変換効
率の優れた漢字変換学習装置を提供することを目的とし
てなされたものである。
(4) The object of learning is limited to the word dictionary section, and words defined by the user for the convenience of document creation are excluded. For this reason, there is a certain limit to the efficiency of kanji conversion. The present invention has been made in view of the above problems, and has been made to solve the above problems (1) to (4), and to provide a kanji conversion learning device excellent in kanji conversion efficiency. Things.

【0017】[0017]

【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明においては読み記号とこれに対応す
る単語が、もし対応する単語が複数存在するならばその
使用頻度に従って配列の上、登録されている固定大型辞
書部と、読み記号とこれに対応する単語及びその使用回
数を第1に使用回数を、第2に使用の新しさを優先する
という原則に従って配列の上格納する学習辞書部と、入
力された読み記号を検索鍵として前記学習辞書部、固定
大型辞書部の順に検索して、対応する全ての単語を検出
し、もし対応する単語が唯一ならばその単語を、対応す
る単語が複数存在するならば一番先に配列されているも
のを変換対象として選択する変換部と、対応する単語が
複数存在する場合に、もし前記変換部の選択結果が誤っ
ていたときには、使用者によるその旨の指示により、前
記変換部にて検出された他の単語の中から使用者の意図
する単語を選択可能とした上で漢字変換結果とする選択
部と、前記変換部の選択が誤っており、それが文字入力
者の前記選択部を介しての指示により訂正された場合に
は、訂正後の単語がもしも学習辞書部に格納されていな
かったならば使用回数を1とした上で検索鍵とした読み
記号と対応させて新規に格納し、既に格納されているな
らばその単語の使用回数に1を加えた上で当該入力され
た読み記号での前記学習辞書部内の単語配列を第1に前
記使用回数の多さとを、第2に使用の新しさを優先する
という原則で見直す配列見直し部と、もし、前記配列見
直し部による1を加えた後の当該単語の使用回数が所定
値以上の場合には、これを検知した上で、前記学習辞書
部での全ての単語の使用回数を一定数減らした上で、別
途定められたしきい値と比較し、その値がしきい値未満
となる単語の学習辞書部からの削除を行なう更新部とを
有していることを特徴とする漢字変換学習装置としてい
る。
In order to achieve the above object, according to the first aspect of the present invention, the reading symbols and the corresponding words are arranged in accordance with the frequency of use if there are a plurality of corresponding words. In addition, the registered fixed large dictionary unit, the reading symbols and the corresponding words and the number of times of use thereof are stored in an array in accordance with the principle that the number of times of use is given first, and the newness of use is given priority. A learning dictionary section, the input dictionary is used as a search key, and the learning dictionary section and the fixed large dictionary section are searched in this order to detect all the corresponding words. If there are a plurality of corresponding words, a conversion unit that selects the one that is arranged first as a conversion target, and if there is a plurality of corresponding words, if the selection result of the conversion unit is incorrect , A selection unit that allows a user to select a word intended by the user from among the other words detected by the conversion unit according to an instruction to that effect by the user, and sets a kanji conversion result, and a selection of the conversion unit Is incorrect, and when it is corrected by the instruction of the character input person via the selection unit, if the corrected word is not stored in the learning dictionary unit, the number of times of use is set to 1. The word is newly stored in association with the reading symbol used as the search key above, and if the word has already been stored, one is added to the number of times the word is used, and then the word in the learning dictionary unit at the input reading symbol is entered. An array reviewing unit for reviewing the sequence firstly for the large number of times of use and secondly for the principle of giving priority to newness of use; and a number of times the word has been used after adding 1 to the sequence reviewing unit. If is greater than or equal to a predetermined value, this is detected. Then, after reducing the number of uses of all the words in the learning dictionary unit by a certain number, comparing with a separately determined threshold value, deleting words whose value is less than the threshold value from the learning dictionary unit And a kanji conversion learning device, characterized by having an updating unit for performing the conversion.

【0018】請求項2の発明においては、使用者からの
定義単語の作成指示により、使用者定義単語を作成し、
この検索鍵として入力された読み記号と対応させた上で
両者を前記学習辞書部に格納する使用者定義単語作成部
を有していることを特徴とする請求項1記載の漢字変換
学習装置としている。請求項3の発明においては、前記
使用者定義単語作成部は、オフライン方式を用いること
が可能であることを特徴とする請求項2記載の漢字変換
学習装置としている。
According to the second aspect of the present invention, a user-defined word is created according to a user-defined word creation instruction,
2. The kanji conversion learning device according to claim 1, further comprising a user-defined word creating unit that stores the user-defined word in the learning dictionary unit after associating with the reading symbol input as the search key. I have. In the invention according to claim 3, the kanji conversion learning device according to claim 2, wherein the user-defined word creating unit can use an off-line method.

【0019】請求項4の発明においては、前記配列見直
し部は、前記使用者定義単語作成部によって作成された
使用者定義単語の検索用読み記号と同音の他の単語が学
習辞書部に既に格納されている場合には、この新しい使
用者定義単語の使用回数をその同音異義の単語の使用回
数若しくは該使用回数とあらかじめ定められた値の多い
方に、もし同音異義の単語が複数格納されている場合に
はそれらの使用回数のうち最大値若しくは該最大値とあ
らかじめ定められた値の多い方に設定することを特徴と
する請求項2若しくは請求項3記載の漢字変換学習装置
としている。
In the fourth aspect of the present invention, the arrangement reviewing unit may store, in the learning dictionary unit, another word having the same sound as the search-reading symbol of the user-defined word created by the user-defined word creating unit. If the same user-defined word is used, the number of times of use of the new user-defined word is stored in the number of times of use of the same homonymous word or the larger of the number of uses and the predetermined value. In this case, the kanji conversion learning device according to claim 2 or 3, wherein the number of times of use is set to the maximum value or the larger of the maximum value and a predetermined value.

【0020】[0020]

【作用】上記構成により、請求項1の発明においては、
固定大型辞書部に読み記号(表音文字)とこれに対応す
る単語が、もし対応する単語が複数存在するならばをそ
の使用頻度に従って配列の上登録(あらかじめの記憶)
されている。学習辞書部が、読み記号とこれに対応する
単語及びその使用回数とを、第1に使用回数の多さ(若
しくは、その値の大きさ)、第2に使用の新しさを優先
するという原則に従って配列の上格納(配置変更等が可
能な態様での新規記憶及び記憶の維持)する。
According to the above construction, in the invention of claim 1,
Register the reading symbols (phonetic characters) and the corresponding words in the fixed large dictionary section in an array according to the frequency of use if there are multiple corresponding words (pre-stored)
Have been. The principle that the learning dictionary unit gives priority to the reading symbol, the corresponding word and the number of times of use thereof, firstly, the number of times of use (or the size of the value), and secondly, the newness of use. (New storage and maintenance of the storage in such a manner that the arrangement can be changed).

【0021】変換部が、入力された読み記号を検索鍵と
して前記学習辞書部、固定大型辞書部の順に検索して、
対応する全ての単語を検出し、もし対応する単語が唯一
ならばその単語を、対応する単語が複数存在する場合に
は一番先に配置されているものを漢字変換の対象として
選択する。対応する単語が複数存在するため、前記変換
部の選択結果が誤っていた場合には、選択部が使用者に
よるその旨の指示により、前記変換部にて検出された他
の単語の中から使用者の意図する単語を選択可能とした
上で漢字変換の結果とする。
The conversion unit searches the learning dictionary unit and the fixed large dictionary unit in order using the input reading symbols as a search key,
All corresponding words are detected, and if there is only one corresponding word, the word is selected as the target of kanji conversion if the corresponding word is present in plurals, if there is more than one corresponding word. Since there are a plurality of corresponding words, if the selection result of the conversion unit is incorrect, the selection unit is used from among the other words detected by the conversion unit in response to an instruction from the user to that effect. After selecting the word intended by the user, the result is converted to kanji.

【0022】前記変換部の選択が誤っており、それが使
用者の前記選択部を介しての指示により訂正されたとき
には、配列見直し部が訂正後の単語について前記学習辞
書部内に格納されていないならば使用回数を1とした上
で検索鍵とした読み記号と対応させて新規に格納し、既
に格納されているならばその使用回数に1を加え、この
上で当該入力された読み記号での単語の配列を前記第1
に使用回数の多さを、第2に使用の新しさを優先すると
いう原則で見直す。(このため、本配列見直し部は、配
列見直しと新規記憶と使用回数の値の追加という3種の
動作をなすこととなる。)更新部が、もし前記配列見直
し部による1を加えた後の当該単語の使用回数が所定値
以上となる場合には、これを検知した上で、学習辞書部
での全ての単語の使用回数を一定数減らした上で、別途
定められたしきい値と比較し、その値がしきい値未満と
なる単語については、学習辞書部からの削除を行う。
When the selection of the conversion unit is incorrect and the correction is made according to a user's instruction through the selection unit, the sequence review unit does not store the corrected word in the learning dictionary unit. Then, the number of times of use is set to 1, and newly stored in association with the reading symbol used as the search key. If it is already stored, 1 is added to the number of times of use, and then the input reading symbol is added. The word sequence of the first
Second, the number of times of use is reviewed based on the principle that the newness of use is prioritized. (Therefore, the present array reviewing unit performs three kinds of operations of reviewing the sequence, adding new storage, and adding the value of the number of times of use.) If the updating unit adds 1 by the sequence reviewing unit, If the number of times of use of the word is equal to or more than a predetermined value, after detecting this, the number of times of use of all words in the learning dictionary unit is reduced by a certain number, and compared with a separately determined threshold value Then, words whose values are less than the threshold value are deleted from the learning dictionary unit.

【0023】請求項2の発明においては、使用者定義単
語作成部が使用者からの単語定義の作成指示により、漢
字から単語を組合せて使用者定義単語を作成し、この検
索鍵として入力された読み記号と対応させた上で両者を
前記学習辞書部に格納する。請求項3の発明において
は、使用者定義単語作成部が、オフライン方式(他の文
字入力装置を使用してフロッピーディスク等の記憶媒体
に入力された使用者の文字入力についての操作を、この
フロッピーディスク等を装着された別の装置がこのフロ
ッピーディスク等から読み取ることにより入力された操
作の内容を知得する。)を用いることが可能であり、か
つ作られた使用者定義単語をその読み記号と共に前記学
習辞書部に格納する機能を有している。
According to the second aspect of the present invention, the user-defined word creating section creates a user-defined word by combining words from kanji in response to a word definition creating instruction from the user, and inputs the word as a search key. After making them correspond to the reading symbols, both are stored in the learning dictionary unit. According to the third aspect of the present invention, the user-defined word creating unit performs an operation for character input by a user who is input to a storage medium such as a floppy disk using another character input device. Another device equipped with a disk or the like can know the content of the input operation by reading from the floppy disk or the like.) And use the created user-defined word together with its reading symbol. It has a function of storing in the learning dictionary section.

【0024】請求項4の発明においては、配列見直し部
が、前記使用者定義単語作成部によって作られた単語の
検索用読み記号と同音の単語が既に学習辞書部に格納さ
れている場合には、この新しい使用者定義単語の使用回
数を、その単語の使用回数若しくは該使用回数とあらか
じめ定められた値の多い方に、もし同音異義の単語が複
数格納されている場合にはそれらの使用回数値のうち最
大値若しくは該使用回数とあらかじめ定められた値の多
い方に設定する。
According to the fourth aspect of the present invention, if the sequence reviewing unit has already stored in the learning dictionary unit a word having the same sound as the search symbol for the word created by the user-defined word creating unit, If the number of uses of this new user-defined word is stored in the number of times of use of the word or the value having a predetermined value greater than the number of times of use of the word, if a plurality of homonymous words are stored, The numerical value is set to the larger of the maximum value or the number of times of use and a predetermined value.

【0025】[0025]

【実施例】図1は、本発明に係る漢字変換学習装置の一
実施例の構成図である。本図において、10は入力部で
あり、20は変換部であり、25は表示部であり、30
は選択部であり、35は同音語/使用者定義単語指定部
であり、40は学習辞書部であり、45は固定大型辞書
部であり、50は更新部であり、60は第1バッファで
あり、65は第2バッファであり、70は出力部であ
り、80は使用者定義単語作成部である。以下、これら
各部の作用、構成等について説明する。
FIG. 1 is a block diagram of an embodiment of a kanji conversion learning apparatus according to the present invention. In this figure, 10 is an input unit, 20 is a conversion unit, 25 is a display unit, and 30 is a display unit.
Is a selection unit, 35 is a homophone / user-defined word designation unit, 40 is a learning dictionary unit, 45 is a fixed large dictionary unit, 50 is an update unit, and 60 is a first buffer. Yes, 65 is a second buffer, 70 is an output unit, and 80 is a user-defined word creation unit. Hereinafter, the operation, configuration, and the like of each of these units will be described.

【0026】入力部10は、キーボードが用いられ、C
RTを参照しつつ使用者が入力する変換対象の表音文字
列を受け取る。変換部20は、この入力された表音文字
列を固定大型辞書部45等を参照しつつ対応する漢字列
に変換する。表示部25は、CRTから構成され、変換
された漢字列或いはこれと同音の漢字列、単語、単語表
記(以下、明白な場合にはこれら3つを「単語」と記
す。)を選択の候補として表示する。選択部30は、C
RT、キーボード、押しボタン等と連動(調整をとりな
がら作動する)し、これにより同音の単語の選択を行な
い、また、上記変換部から出力される漢字をもとに使用
者定義単語を作成の上その旨を指定可能とするものであ
る。同音語/使用者定義単語指定部35は、使用者
が、″同音の漢字、単語、単語表記のなかから所望のも
のを選択″或いは″使用者定義単語を作成″の指示を行
なうものであり、CRT、キーボード等と連動してい
る。学習辞書部40は、揮発性の高速半導体メモリより
なり、読み記号とこれに対応する全ての単語とその使用
回数を格納し、同音の単語毎に、使用回数の高いものが
優先して変換対象とされるべく先に配置する。もし、同
じ使用回数であれば、最新使用のものを優先して変換さ
せるべく先にする。図6にその構成を概念的に示す。固
定大型辞書部45は不揮発性の磁気ディスクよりなり、
コード化された表音文字列からなる読み記号とこれに対
応する全ての単語、すなわち同音異義の単語が格納され
ており、その配列の順序は一般的な使用者や一般的に作
成される文書での使用頻度による。図7にその構成を概
念的に示す。更新部50は、配列見直し部51を内蔵
し、その作用と相って読み記号とこれに対応する単語及
び使用回数をもとに、所定の手順で学習辞書部40を更
新し、また単語の配列の見直しをも行なう。第1バッフ
ァ60は、同音の単語を選択する際に、切り出された表
音文字列のコードからなる形態素毎に、対応する全ての
同音の単語を一時格納する。第2バッファ65は、学習
辞書部を更新する際に、更新の基準となる単語の使用回
数の値を一時格納する。出力部70は、漢字変換された
単語を出力する。使用者定義単語作成部80は、使用者
が常用する、しかも固定大型辞書部にない、そして多く
の場合多数の漢字からなる単語を使用者定義単語として
作成するに際して中心的役割を課すものであり、作成に
あたってはキーボード、CRT、MCPU等と連動する
ようになっている。
The input unit 10 uses a keyboard,
The phonetic character string to be converted, which is input by the user while referring to the RT, is received. The conversion unit 20 converts the input phonogram string into a corresponding kanji string while referring to the fixed large dictionary unit 45 and the like. The display unit 25 is composed of a CRT, and is a candidate for selecting a converted kanji string or a kanji string having the same sound as this, a word, and a word notation (hereinafter, these three will be referred to as “words” in the clear case). Display as The selection unit 30
Interacts with the RT, keyboard, push buttons, etc. (operates while adjusting) to select words with the same sound, and to create user-defined words based on the kanji output from the conversion unit. In addition, it is possible to specify that. The homophone / user-defined word designation section 35 is used by the user to instruct “select a desired one from kanji, words, and word expressions of the same sound” or “create a user-defined word”. , CRT, keyboard, etc. The learning dictionary unit 40 is composed of a volatile high-speed semiconductor memory and stores reading symbols, all the words corresponding to the reading symbols, and the number of times of use, and for each word of the same sound, the word with the highest number of times of use is preferentially converted. And place it first. If the number of uses is the same, the latest use is prioritized for conversion. FIG. 6 conceptually shows the configuration. The fixed large dictionary unit 45 is made of a nonvolatile magnetic disk,
A phonetic symbol consisting of a coded phonetic character string and all corresponding words, that is, words that are homonymous, are stored. It depends on the frequency of use. FIG. 7 conceptually shows the configuration. The updating unit 50 has a built-in sequence reviewing unit 51, which updates the learning dictionary unit 40 in a predetermined procedure based on the reading symbols, the corresponding words and the number of times of use, and Review the sequence. When selecting the same sound word, the first buffer 60 temporarily stores all corresponding same sound words for each morpheme composed of the code of the cut-out phonetic character string. When updating the learning dictionary unit, the second buffer 65 temporarily stores the value of the number of times of use of the word serving as a reference for updating. The output unit 70 outputs the kanji-converted word. The user-defined word creating unit 80 has a central role in creating words that are frequently used by users and are not in the fixed large dictionary unit, and often consist of many kanji as user-defined words. In the creation, a keyboard, a CRT, an MCPU and the like are interlocked.

【0027】図2は、本実施例における漢字変換の動作
流れ図である。以下、本図をもとにその内容を説明す
る。S201では、入力された表音文字列の読み記号を
最長一致法で切り出す。S202では、切り出した形態
素毎の読み記号を検索キーとして、当該発音の単語の候
補を学習辞書部、固定大型辞書部の順に検索し、検出結
果たる単語群(単語が複数の場合が多いため「単語」に
「群」をつけたのであり、「群」にはさして意味はな
い。)を第1バッファに格納する。
FIG. 2 is a flowchart showing the operation of kanji conversion in this embodiment. Hereinafter, the contents will be described with reference to FIG. In S201, the reading symbol of the input phonetic character string is cut out by the longest match method. In step S202, using the phonetic symbols cut out for each morpheme as search keys, word candidates of the pronunciation are searched in the order of the learning dictionary unit and the fixed large dictionary unit, and a word group as a detection result (in many cases, there are a plurality of words; The word “group” is added to the “group”, and the “group” has no significance.) Is stored in the first buffer.

【0028】S203では、第1バッファに格納されて
いる漢字、単語群における第一番目の漢字、単語を変換
結果とする。S204では、変換結果を表示装置に表示
する。単語候補の中からの正しい選択と学習辞書更新処
理については、最終的には使用者が変換結果を表示装置
で確認することによりなされる。もし、変換結果が正し
ければ、使用者が指定装置に″確定″指示コードを入力
し、更新部により、正しい変換結果とされた単語を以て
当該読み音の学習辞書部を更新する。もし、使用者によ
り、変換結果が意図するものではないと判断された場合
には、選択部により変換結果が修正される。修正された
変換結果は表示装置に表示される。それから、使用者か
らの指示コードを待つ。もし、使用者が同音語/使用者
定義単語指定部から″使用者定義単語″指示コードを入
力すると、使用者定義単語作成部により、所望の使用者
定義単語が作られる。更新部内の配列見直し部は、当該
単語を構成する漢字列を特定する読み記号と共に学習辞
書部内へ格納する。その際、併せて設定される使用回数
の値については、後に説明する。
In S203, the first kanji and word in the kanji and word group stored in the first buffer are set as conversion results. In S204, the conversion result is displayed on the display device. The correct selection from the word candidates and the learning dictionary update process are finally performed by the user confirming the conversion result on the display device. If the conversion result is correct, the user inputs a "confirmation" instruction code to the designated device, and the updating unit updates the learning dictionary unit of the reading sound with the word obtained as the correct conversion result. If the user determines that the conversion result is not intended, the selection unit corrects the conversion result. The corrected conversion result is displayed on the display device. Then, it waits for an instruction code from the user. If the user inputs a "user-defined word" instruction code from the homophone / user-defined word designation section, a desired user-defined word is created by the user-defined word creation section. The arrangement reviewing unit in the updating unit stores in the learning dictionary unit together with the reading symbols that specify the kanji string that constitutes the word. The value of the number of times of use set at that time will be described later.

【0029】図3は、本実施例における同音の単語の選
択と学習辞書部の更新の動作流れ図である。以下、本図
を参照しつつこれらの動作を説明する。S301では、
表示装置に変換された漢字列とカーソル位置を表示す
る。S302では、使用者は同音語/使用者定義単語指
定部から指示コードを入力する。
FIG. 3 is a flowchart showing the operation of selecting a word having the same sound and updating the learning dictionary unit in this embodiment. Hereinafter, these operations will be described with reference to FIG. In S301,
The converted kanji string and the cursor position are displayed on a display device. In S302, the user inputs an instruction code from the homophone / user-defined word designation section.

【0030】S303では、指示コードが″確定″か否
かを判定する。確定ならばS304へ行く。″確定″で
ないならば、S306へ行く。S304では、更新処理
を示すフラグ(FLAG)を「一般」の値に設定する。
S305では、変換結果の単語毎に、その読み記号、単
語を以て学習辞書部に対して後述する更新、見直し処理
を行ない、その処理を終了する。
In S303, it is determined whether or not the instruction code is "determined". If confirmed, go to S304. If not "determined", the flow proceeds to S306. In S304, the flag (FLAG) indicating the update processing is set to the value of “general”.
In S305, for each word of the conversion result, the learning dictionary unit is subjected to an update and review process, which will be described later, using the pronunciation symbol and the word, and the process ends.

【0031】S306では、指示コードが″カーソル移
動″か否かを判定する。もし、″カーソル移動″ならば
S307へ行く。そうでないならばS308へ行く。S
307では、カーソルは修正しようとする単語の位置に
移されてからS301へ戻る。S308では、指示コー
ドが″同音の単語の表示″か否かを判定する。もし、そ
うでならばS309へ行く。そうでないならばS311
へ行く。
In S306, it is determined whether or not the instruction code is "cursor movement". If "cursor movement", go to S307. If not, go to S308. S
At 307, the cursor is moved to the position of the word to be corrected, and the process returns to S301. In S308, it is determined whether or not the instruction code is "display of the same sound word". If so, go to S309. Otherwise, S311
Go to

【0032】S309では、第1バッファから同音の候
補単語が取り出され、表示装置25に表示される。S3
10では、使用者は同音語/使用者定義単語指定部によ
り、同音異義の単語候補の中から所望のものを選択す
る。その上で、S315へ行く。S315では、S31
0で選択された単語を誤って変換された単語におきかえ
てからS301へ戻る。
In step S309, the same-word candidate word is extracted from the first buffer and displayed on the display device 25. S3
At 10, the user selects a desired word from homophonic word candidates by the homophone / user-defined word designation unit. Then, go to S315. In S315, S31
The process returns to S301 after replacing the word selected at 0 with the incorrectly converted word.

【0033】S311では、指示コードが″使用者定義
単語″か否かを判定する。もし、そうならばS312へ
行く。そうでないならばS301へ戻る。S312で
は、更新処理を示すフラグ(FLAG、電子的な印)を
「使用者定義単語」の値で設定する。S313では、ワ
ードプロセッサーを見つつ対話的に漢字変換なされるオ
ンライン方式或いは別途のワードプロセッサーで入力さ
れたフロッピーディスクに記憶された指示でなされるオ
フライン方式によって、読み記号とこれに対応する漢字
列からなる使用者定義単語を作る。なお、オフライン方
式の場合には、フロッピーディスク装着の際の使用者の
別途の指示及びフロッピーディスクに記憶されている所
定の信号により各種の指示、操作の内容を知得する。こ
の場合の所定の信号はあらかじめ定められており、特許
出願における明細書中の「〔」、「〕」の類似の記号等
が使用される。ただし、これはいわば周知の技術である
ため、その説明は省略する。その上で、S314へ行
く。
In S311, it is determined whether or not the instruction code is a "user-defined word". If so, go to S312. If not, the process returns to S301. In S312, a flag (FLAG, electronic mark) indicating the updating process is set by the value of the "user-defined word". In step S313, the kanji conversion is performed using an on-line method in which kanji conversion is performed interactively while looking at the word processor or an off-line method in accordance with an instruction stored in a floppy disk input by a separate word processor. Make user-defined words. In the case of the off-line system, various instructions and operation contents are obtained by a user's separate instruction when mounting the floppy disk and a predetermined signal stored in the floppy disk. The predetermined signal in this case is predetermined, and similar symbols such as "[" and "]" in the specification of the patent application are used. However, since this is a well-known technique, its description is omitted. Then, go to S314.

【0034】S314では、使用者定義単語の読み記
号、単語を構成する漢字列を学習辞書部に格納し、この
際後述する更新、配列見直し処理を行ない、S301へ
戻る。学習辞書部に単語を格納するに際しては、もし、
処理フラグが「一般」である場合に、入力された読みコ
ードと単語が学習辞書部に既に格納されているならば、
該当する単語の使用回数に1を増やす。読み記号は格納
されているが、単語が格納されていないときは、その読
み記号の欄に当該単語を追加し、更にその単語の使用回
数を1に設定する。また、読み記号も単語も格納されて
いない場合には、当該読み記号と単語を一つの学習デー
タエントリーとして学習辞書部に新規に記憶する。そし
て、その使用回数を1に設定する。もし、処理フラグが
「使用者定義単語」である場合には、使用者定義単語の
読み記号が学習辞書部に格納されているならば、使用者
定義単語の使用回数を学習データエントリーにおける最
大値で設定する。もし、何も格納されていないときに
は、使用者定義単語の読み記号と単語を一つの学習デー
タエントリーとして学習辞書部に新規に記憶する。そし
て、その使用回数を1に設定する。
In S314, the reading symbols of the user-defined word and the kanji string constituting the word are stored in the learning dictionary unit, and at this time, the updating and arrangement review processing described later is performed, and the process returns to S301. When storing words in the learning dictionary,
When the processing flag is “general” and the input reading code and word are already stored in the learning dictionary unit,
Increase the number of times the corresponding word is used by one. If the phonetic symbol is stored but no word is stored, the word is added to the phonetic symbol column, and the number of times the word is used is set to one. When neither a reading symbol nor a word is stored, the reading symbol and the word are newly stored in the learning dictionary unit as one learning data entry. Then, the number of times of use is set to 1. If the processing flag is “user-defined word”, if the reading symbol of the user-defined word is stored in the learning dictionary unit, the number of times the user-defined word is used is set to the maximum value in the learning data entry. Set with. If nothing is stored, the reading symbol and the word of the user-defined word are newly stored in the learning dictionary unit as one learning data entry. Then, the number of times of use is set to 1.

【0035】図4と図5は、本実施例の学習辞書部の単
語の新規記憶、格納されている単語の配列見直し、更新
の際の、すなわち図3におけるS305とS314のス
テップの詳しい動作流れを示すものである。なお、本来
両図は一葉とすべきものであるが、出願に際しての電子
情報処理システムへの入力の大きさの制限のため2葉に
分割したものである。以下、両図を参照しつつこの学習
辞書部内の単語の新規記憶、配列見直し及び更新を説明
する。
FIGS. 4 and 5 show the detailed operation flow of new storage of words in the learning dictionary section, review of the arrangement of stored words, and update of the words stored in the learning dictionary section of the present embodiment, ie, steps S305 and S314 in FIG. It shows. Note that both drawings should be originally one leaf, but they are divided into two leaves to limit the size of input to the electronic information processing system at the time of filing. Hereinafter, the new storage, arrangement review, and update of words in the learning dictionary unit will be described with reference to FIGS.

【0036】まず、図4に示す動作から説明する。S4
01では、入力された読み記号、単語、処理フラグをそ
れぞれ変数YOMI、LEX、FLAGとして、内蔵の
記憶部(図示せず)に格納する。かつ、使用回数の最大
値と更新に使用する定数値、それぞれTHとFUNMと
する、を同じく記憶部に格納してS402に入る。
First, the operation shown in FIG. 4 will be described. S4
In step 01, the input reading symbols, words, and processing flags are stored in a built-in storage unit (not shown) as variables YOMI, LEX, and FLAG, respectively. Further, the maximum value of the number of times of use and the constant values used for updating, TH and FUNM, respectively, are also stored in the storage unit, and the process proceeds to S402.

【0037】S402では、YOMIを検索キーとして
学習辞書部内を検索する。検索の値(単語、使用回数)
を第2バッファのレジスタ群Aに格納する。S403で
は、レジスタ群Aが空集合(何も入力されていない)か
否かを判定する。もし、空集合ならばS404に行く。
なお、空集合は、学習辞書部にこの読み記号がないこと
を示す。もし、空集合でないならばS406へ行く。
In step S402, a search is performed in the learning dictionary unit using YOMI as a search key. Search value (word, number of uses)
In the register group A of the second buffer. In S403, it is determined whether or not the register group A is an empty set (nothing is input). If it is an empty set, go to S404.
Note that an empty set indicates that there is no reading symbol in the learning dictionary unit. If it is not an empty set, go to S406.

【0038】S404では、使用回数を1に設定する。
S405では、YOMI、LEXと使用回数(この場合
は1)を学習辞書部に格納した後、処理を終了する。S
406では、FLAGが″使用者定義単語″か否かを判
定する。もし、″使用者定義単語″でないならばS40
7へ行き、″使用者定義単語″ならばS414へ行く。
In S404, the number of times of use is set to 1.
In S405, YOMI, LEX and the number of times of use (in this case, 1) are stored in the learning dictionary unit, and then the process ends. S
At 406, it is determined whether the FLAG is a "user-defined word". If it is not a "user-defined word", S40
7 and if it is a "user-defined word", go to S414.

【0039】S407では、LEXを検索のキーとして
レジスタ群Aを検索する。検索の値(LEXの使用回
数)を第2バッファのレジスタbに格納する。しかる後
S408へ行く。S408では、レジスタbが空集合か
否か判定する。もし、空集合でないならばS409へ行
く。もし、空集合ならばS412へ行く。
In S407, the register group A is searched using LEX as a search key. The search value (the number of times LEX is used) is stored in the register b of the second buffer. After a while, go to S408. In S408, it is determined whether or not the register b is an empty set. If it is not an empty set, go to S409. If it is an empty set, go to S412.

【0040】S409では、レジスタbの値を1増やし
てからS410へ行く。S410では、LEXを検索の
鍵(キー)としてレジスタbの値でレジスタ群A内の該
当する単語の使用回数の値を更新する。S411では、
使用回数の値の大小を基準としてレジスタ群Aの入力さ
れたYOMIに対して格納されている単語の配列の順序
を訂正する。それから、後述する図5の処理ノードBに
入る。
In S409, the value of the register b is incremented by 1, and the process proceeds to S410. In S410, the value of the number of times of use of the corresponding word in the register group A is updated with the value of the register b using LEX as a search key. In S411,
The order of the arrangement of the words stored for the input YOMI of the register group A is corrected based on the value of the number of times of use. Then, it enters the processing node B of FIG. 5 described later.

【0041】S412では、レジスタbの値を1に設定
する。S413では、LEXを検索の鍵としてレジスタ
bの値をレジスタ群Aの値の最後に格納する。しかる
後、図5に示す処理ノードBに行く。S414では、レ
ジスタAから使用回数の最大値を取り出してレジスタb
に格納する。
In S412, the value of the register b is set to 1. In S413, the value of the register b is stored at the end of the value of the register group A using LEX as a search key. Thereafter, the process goes to the processing node B shown in FIG. In S414, the maximum value of the number of times of use is extracted from the register A, and
To be stored.

【0042】S415では、LEXで表現される単語に
使用回数としてレジスタbの値を付して、レジスタ群A
の当該読み記号で示される単語群の最前に格納する。し
かる後、図5に示す処理ノードAに行く。次に、図5に
示す動作について説明する。処理ノードBから、S50
1に入る。
In S415, the value of the register b is added to the word represented by LEX as the number of times of use, and the register group A
Is stored at the forefront of the word group indicated by the reading symbol. Thereafter, the process goes to the processing node A shown in FIG. Next, the operation shown in FIG. 5 will be described. From processing node B, S50
Enter 1.

【0043】S501では、LEXを検索の鍵としてレ
ジスタ群AにおけるLEXとその使用回数を使用回数の
値の多い順に配置しなおす。S502では、YOMIを
検索の鍵としてレジスタ群Aの値で学習辞書部内の使用
者定義単語と単語の配列を変更する。S503では、レ
ジスタbの値がTHに相当するか否かを判定する。も
し、THならばS504へ行く。もし、レジスタbの値
がTHに相当しないならば、その処理を終了する。
In step S501, the LEX in the register group A and the number of times of use thereof are rearranged in descending order of the number of times of use, using LEX as a search key. In step S502, the user-defined word and the word arrangement in the learning dictionary unit are changed with the value of the register group A using YOMI as a search key. In S503, it is determined whether the value of the register b corresponds to TH. If it is TH, go to S504. If the value of the register b does not correspond to TH, the process ends.

【0044】S504では、学習辞書部における全ての
使用回数の値をFUNMだけ減らす。しかる後S505
に行く。S505では、学習辞書部における使用回数が
0或いは負数となる単語を学習辞書部から削除してその
処理を終了する。処理ノードAからS502に入る。
In S504, the values of all the times of use in the learning dictionary section are reduced by FUNM. S505
go to. In S505, words whose usage count in the learning dictionary unit is 0 or a negative number are deleted from the learning dictionary unit, and the processing is terminated. The processing node A enters S502.

【0045】図6は本実施例における学習辞書部の構成
の概念図である。本図において、漢字、単語の後方に記
載してある数字は、その漢字等の使用回数である。ま
た、漢字、単語の格納に際しての配置も使用回数の多い
順による。このため、各読み記号毎に一番前に配置され
ている漢字、単語が当該読み記号が検索鍵として入力さ
れた際に最優先して選択されることとなる。
FIG. 6 is a conceptual diagram of the configuration of the learning dictionary unit in this embodiment. In this figure, the numbers written after the kanji and words indicate the number of times the kanji and the like are used. In addition, the arrangement for storing kanji and words also depends on the order of use. For this reason, the kanji and word placed at the forefront of each reading symbol are selected with the highest priority when the reading symbol is input as a search key.

【0046】図7は、本実施例の固定大型辞書部の構成
の概念図である。同音異義の各漢字、単語の配列は、一
般的な使用者、文書(コーパス、 corpus,言語資料) で
の使用頻度の調査結果に応じたものとされ、その高いも
のから優先して配置され、これにより漢字変換の対象と
して優先して出力されるようになされている。以上のよ
うに構成された本実施例について、具体的に「di2ren2g
ong1sh4men3lie4 」を入力したときの中国語文書の漢字
変換の動作を説明する。
FIG. 7 is a conceptual diagram of the configuration of the fixed large dictionary section of this embodiment. The arrangement of homonymous kanji and words is determined according to the results of surveys on the frequency of use in general users and documents (corpora, corpus, language materials). As a result, the kanji is preferentially output as a kanji conversion target. About the present embodiment configured as described above, specifically, “di2ren2g
ong1sh4men3lie4 "will be described below.

【0047】学習辞書部と固定大型辞書部を参照して、
変換部を経てその結果は″敵人「公式」猛烈″(ここ
に、「と」とで囲まれた単語は、本発明の実施例として
説明の対象としている単語を指す。)となる。選択部に
よって処理された結果は″適人「攻勢」猛烈″となる。
次に、この段階で上記更新部によって配置が更新される
前後の学習辞書部の内容を示す。
Referring to the learning dictionary section and the fixed large dictionary section,
After the conversion unit, the result is “enemy“ official ”fierce” (here, the word surrounded by “to” indicates a word to be described as an embodiment of the present invention). The result processed by the selection unit is “suitable“ offensive ”fierce”.
Next, the contents of the learning dictionary unit before and after the arrangement is updated by the updating unit at this stage will be described.

【0048】 (前)gong1sh4 公式3、公事3、攻勢3、工事2 (後)gong1sh4 攻勢4、公式3、公事3、工事2 続いて″uo3xiou1gai3fang2yu4gong1sh4" が入力され、
変換部によって漢字変換された結果は″我修改防禦「攻
勢」″である。選択部によって修正された結果は″我修
改防禦「工事」″となる。この時点で、更新部によって
更新された後の学習辞書部の内容を以下に示す。
(Before) gong1sh4 formula 3, public affairs 3, offense 3, construction 2 (after) gong1sh4 offensive 4, formula 3, public affairs 3, construction 2 Then, "uo3xiou1gai3fang2yu4gong1sh4" is input,
The result of the kanji conversion by the conversion unit is “Improvement defense“ offensive ”.” The result modified by the selection portion is “Improvement defense“ construction. ”At this point, after being updated by the updating unit, The contents of the learning dictionary section are shown below.

【0049】 gong1sh4 攻勢4、工事3、公式3、公事3 続いて″di2ren2de0gong1sh4shou4zu3″が入力され、文
字変換部によって処理された結果は″敵人的「攻勢」受
阻″である。″敵人的「工事」受阻″にならず、直接″
敵人的「攻勢」受阻″が出力される。この時点で、上記
更新部によって処理された学習辞書部の内容を以下に示
す。
Gong1sh4 Offensive 4, Construction 3, Formula 3, Public affairs 3 Subsequently, “di2ren2de0gong1sh4shou4zu3” is input and processed by the character conversion unit. The result is “Enemy's“ Offensive ”obstruction”. Directly without being "blocked"
At this point, the contents of the learning dictionary unit processed by the updating unit are shown below.

【0050】 gong1sh4 攻勢5、工事3、公式3、公事3 尚、上記選択部で、同音語/使用者定義単語指示部から
受け取った入力コードが″使用者定義単語″である場合
には、使用者定義単語部に入る。もし、使用者が使用者
定義単語の読み記号″gong1sh4″と単語″宮室″を入力
した場合に、更新部によって処理された後の学習辞書部
のこの読み記号に対応する欄の構成を以下に示す。
Gong1sh4 Offensive 5, construction 3, formula 3, public affairs 3 If the input code received from the homophone / user-defined word designating unit is “user-defined word”, use Enter the user-defined word section. If the user inputs the reading symbol “gong1sh4” and the word “Miyamuro” of the user-defined word, the configuration of the column corresponding to this reading symbol in the learning dictionary unit after being processed by the updating unit is as follows. Show.

【0051】 gong1sh4 宮室5、攻勢5、工事3、公式3、公事3 この場合、″宮室″が使用回数値が最大の5となる単語
のなかでも最先に配置されているため、次回読み記号″
gong1sh4″を漢字変換する際には、この使用者定義単語
たる″宮室″が最優先して選択されることとなる。更
に、この後例えば″公事″が何度も使用され、このため
読み記号″gong1sh4″の最前部に行き、かつ使用回数も
6、ひいてはあらかじめ定められた上限値THに達した
場合には、学習辞書部に格納されている全ての各読み記
号に対する全ての単語の使用回数から一定値FUNM
(=3)を引く。
Gong1sh4 Miyamuro 5, Offensive 5, Construction 3, Formal 3, Public affairs 3 In this case, since “Miyamuro” is the earliest among the words having the maximum number of uses of 5, the next reading symbol ″
When converting gong1sh4 "to kanji, this user-defined word" Miyamuro "is selected with the highest priority. If it goes to the forefront of "gong1sh4" and the number of times of use reaches 6, and thus reaches a predetermined upper limit value TH, the number of times of use of all words for all the reading symbols stored in the learning dictionary unit Constant value FUNM from
(= 3) is subtracted.

【0052】そして、引き算の結果対応する使用回数が
0以下となった単語を学習辞書部から削除する。また、
対応する単語が全て削除された読み記号は、併せてその
読み記号そのものも削除する。これにより、学習辞書部
内に記憶される単語の総数の増大を防止し、処理速度の
向上とその記憶資源の必要量を一定値以下におさめる。
Then, words whose number of uses corresponding to the result of the subtraction is 0 or less are deleted from the learning dictionary section. Also,
The pronunciation symbol from which all the corresponding words have been deleted is also deleted. This prevents an increase in the total number of words stored in the learning dictionary unit, improves the processing speed, and keeps the required amount of storage resources below a certain value.

【0053】以上、本発明を実施例にもとづき説明して
きたが、本発明は何も上記実施例に限定されず、その要
旨を変更しない範囲で適宜変形して実施してもよいのは
勿論である。例えば (1)日本語ワードプロセッサーにおける漢字変換を行
なう場合に、その学習辞書部を更新するのに本発明を利
用する。
Although the present invention has been described based on the embodiments, the present invention is not limited to the above-described embodiments, and may be modified as appropriate without departing from the scope of the invention. is there. For example, (1) when performing kanji conversion in a Japanese word processor, the present invention is used to update the learning dictionary section.

【0054】(2)学習辞書部を更新する場合に使用す
るしきい値等も、単語に応じて適宜最適の値に設定可能
であるようにする。例えば、中国語において日本語にお
ける助詞的な役割をなす「的」、「是」等については、
更新部が作用するための所定値THを50、60等大き
なものとする。 (3)表音文字、読み記号とは、表意文字を特定するた
めに入力される文字や記号という意味であり、アルファ
ベットのごとき表音文字、かなのごとき音素文字、その
他アラビア数字のごとく表意文字的な要素を多分に有す
る文字や中華民国の注音符号、同注音符号第二式等も含
まれる。「入力」とは、キーボードによる入力でなく近
年実用化されだした手書き入力であってもよい。また、
漢字とは表意文字に限定されず、日本語における単語表
記中のかなのごとく表意文字と一体的に使用される表音
文字や音素文字をも含む。更にまた、表意文字とは中国
語における純粋な漢字に限定されず、日本でつくられた
「峠」等外国(中国からみて)の文字や漢字の繰り返し
を意味する「々」(のま)等、言語、国語の種類を問わ
ず通常の文章で使用される各種の記号をも含む。
(2) The threshold value and the like used when updating the learning dictionary section can be appropriately set to optimal values according to words. For example, in Chinese, "ro" and "ze", which play a role of Japanese particle,
The predetermined value TH for the operation of the updating unit is set to be large, such as 50 or 60. (3) Phonetic characters and reading symbols mean characters and symbols that are input to identify ideographic characters, and ideographic characters such as alphabetic phonetic characters, kana-like phonemic characters, and other Arabic numerals. Characters that have many common elements, the note code of the Republic of China, the second note code, and the like. The “input” may be a handwriting input that has recently been put into practical use, instead of a keyboard input. Also,
Kanji is not limited to ideographic characters, but also includes phonograms and phonemic characters used integrally with ideographs, such as in kana in word notation in Japanese. Furthermore, the ideographic characters are not limited to pure Chinese characters in Chinese, but also Japanese characters such as "toge", which means foreign characters (as viewed from China), and the characters "nama", which means repeated Chinese characters. It also includes various symbols used in ordinary sentences, regardless of language and language.

【0055】(4)本実施例においては、更新部と配列
見直し部とが一体的に製造されているがごとく、プログ
ラム作成、製造等の都合で、本発明の一の構成要素(要
件)を物理的に複数の物としたり、複数の構成要素を物
理的に一体にしたり、これらを適宜くみあわせている。
また、固定大型辞書部のメモリもROM、揮発性等その
種類を問わず、更に日本語、中国語等作成する文書に応
じて取り換え可能としている。
(4) In the present embodiment, as in the case where the updating section and the array reviewing section are integrally manufactured, one component (requirement) of the present invention is changed for the convenience of program creation and manufacturing. A plurality of objects are physically formed, a plurality of components are physically integrated, or these are appropriately combined.
Also, the memory of the fixed large dictionary unit can be replaced according to a document to be created, such as Japanese or Chinese, irrespective of its type such as ROM and volatility.

【0056】(5)学習辞書部に使用者定義単語を新規
に記憶する場合に、既に同音の単語が格納されていない
にもかかわらず、その使用回数は最低限更新部が更新の
ための減算に使用する数(FUNM)+しきい値+余裕
(1)とするようにしている。これにより、使用者定義
単語が唯一回の更新作用で学習辞書部から削除されるの
を防止する。
(5) When a user-defined word is newly stored in the learning dictionary unit, the number of times that the word is used is at least subtracted by the updating unit even if the same sound word is not already stored. (FUNM) + threshold + margin (1). This prevents the user-defined word from being deleted from the learning dictionary unit by only one update operation.

【0057】(6)使用者定義単語に対応づけられる読
み記号は、必ずしも該単語の正確な読み記号でなく、使
用者の便利性改善のため略音等としている。
(6) The pronunciation symbol associated with the user-defined word is not necessarily the exact pronunciation symbol of the word, but is abbreviated to improve user convenience.

【0058】[0058]

【発明の効果】以上説明したように、本発明に係る漢字
変換学習装置は長期学習と短期学習両方の長所を有して
いるため、以下のような効果が得られ、従来の問題点を
完全に解消可能となる。 (1)人手によらず、同音異義の漢字、単語、単語表記
を自動的に学習可能となり、漢字変換の正確率と入力速
度が向上する。
As described above, since the kanji conversion learning device according to the present invention has the advantages of both long-term learning and short-term learning, the following effects can be obtained and the conventional problems can be completely solved. Can be resolved. (1) It is possible to automatically learn kanji, words, and word notations having the same and different meanings independently of human hands, thereby improving the accuracy and input speed of kanji conversion.

【0059】(2)学習辞書部に使用者定義単語が記憶
されるため、従来の使用者定義単語辞書部が不要とな
る。このため、記憶資源の節約となり、併せて、同音の
単語が複数ある際にその候補を選択するために使用者定
義単語辞書部と学習辞書部のいずれを優先して検索する
かの判断も不必要となる。 (3)固定大型辞書部内の漢字、単語のうち使用された
ことがあるもののみが学習辞書部に格納されるため、更
に記憶資源の節約となる。また、基本となる固定大型辞
書部を更新する必要がないため、ROMを使用した辞書
部にも適用可能である。
(2) Since the user-defined words are stored in the learning dictionary section, the conventional user-defined word dictionary section becomes unnecessary. This saves storage resources and makes it difficult to determine which of the user-defined word dictionary unit and the learning dictionary unit should be searched first in order to select a candidate when there are multiple words with the same sound. Required. (3) Since only the kanji and words in the fixed large dictionary that have been used are stored in the learning dictionary, the storage resources can be further saved. Further, since there is no need to update the basic fixed large dictionary unit, the present invention can be applied to a dictionary unit using a ROM.

【0060】(4)長期学習経験、短期学習経験双方の
利点を有し、かつ各々の短所がなくなる。このため、漢
字変換の正確率が向上する。 (5)本発明で使用する単語の使用頻度は一般的なもの
である。ひいては、文字変換の正確率が向上する。
(4) It has the advantages of both a long-term learning experience and a short-term learning experience, and eliminates each disadvantage. For this reason, the kanji conversion accuracy rate is improved. (5) The frequency of use of words used in the present invention is general. As a result, the accuracy of character conversion is improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係る漢字変換学習装置の一実施例の構
成図である。
FIG. 1 is a configuration diagram of an embodiment of a kanji conversion learning device according to the present invention.

【図2】上記実施例における漢字変換処理の際の動作流
れ図である。
FIG. 2 is an operation flow chart at the time of a kanji conversion process in the embodiment.

【図3】上記実施例における同音語の選択と学習辞書部
の更新等の動作流れ図である。
FIG. 3 is an operation flowchart for selecting a homophone, updating a learning dictionary unit, and the like in the embodiment.

【図4】上記実施例における学習辞書部の更新等の際の
より詳しい動作流れ図である。
FIG. 4 is a more detailed operation flowchart at the time of updating a learning dictionary unit in the above embodiment.

【図5】上記実施例における学習辞書部の更新等の際の
より詳しい動作流れ図である。
FIG. 5 is a more detailed operation flowchart at the time of updating a learning dictionary unit in the above embodiment.

【図6】上記実施例における学習辞書部内の読み記号と
その読み記号に対応した漢字等及びその使用回数の格納
の構成を概念的に示す図である。
FIG. 6 is a diagram conceptually showing a configuration of storing a reading symbol in a learning dictionary unit, a kanji corresponding to the reading symbol, and the number of times of use thereof in the embodiment.

【図7】上記実施例における固定大型辞書部内の読み記
号とその読み記号に対応した漢字等の登録の構成を概念
的に示す図である。
FIG. 7 is a diagram conceptually showing a configuration of registration of a reading symbol in a fixed large dictionary unit and a kanji corresponding to the reading symbol in the embodiment.

【図8】従来の漢字変換学習装置の一例の構成図であ
る。
FIG. 8 is a configuration diagram of an example of a conventional kanji conversion learning device.

【図9】上記従来例における同音異義単語の学習装置
で、漢字変換を行なう際の動作流れ図である。
FIG. 9 is an operation flowchart when performing kanji conversion in the homonymous word learning device in the conventional example.

【図10】上記従来例における同音異義単語の学習装置
で、複数の同音異義単語から正しい単語の選択を行なう
際の動作流れ図である。
FIG. 10 is an operation flow chart when selecting a correct word from a plurality of homonymous words in the homonymous word learning device in the conventional example.

【図11】上記従来例における同音異義単語の学習装置
で、辞書部の更新を行なう際の動作流れ図である。
FIG. 11 is an operation flowchart when the dictionary unit is updated in the homonymous word learning device in the conventional example.

【符号の説明】[Explanation of symbols]

10 入力部 20 変換部 25 表示部 30 選択部 35 同音語/使用者定義単語指定部 40 学習辞書部 45 固定大型辞書部 50 更新部 51 配列見直し部 60 第1バッファ 65 第2バッファ 70 出力部 80 使用者定義単語作成部 Reference Signs List 10 input unit 20 conversion unit 25 display unit 30 selection unit 35 homophone / user-defined word designation unit 40 learning dictionary unit 45 fixed large dictionary unit 50 update unit 51 array review unit 60 first buffer 65 second buffer 70 output unit 80 User-defined word generator

フロントページの続き (56)参考文献 特開 平4−199456(JP,A) 特開 平4−77954(JP,A) 特開 昭63−136252(JP,A) 特開 昭63−106070(JP,A) 特開 平3−282875(JP,A) 特開 平5−2579(JP,A) 特開 平6−124301(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/26 Continuation of the front page (56) References JP-A-4-199456 (JP, A) JP-A-4-77954 (JP, A) JP-A-63-136252 (JP, A) JP-A-63-106070 (JP, A) JP-A-3-282875 (JP, A) JP-A-5-2579 (JP, A) JP-A-6-124301 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB G06F 17/21-17/26

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 読み記号とこれに対応する単語が、もし
対応する単語が複数存在するならばその使用頻度に従っ
て配列の上、登録されている固定大型辞書部と、読み記
号とこれに対応する単語及びその使用回数を第1に使用
回数の多さを、第2に使用の新しさを優先するという原
則に従って配列の上格納する学習辞書部と、 入力された読み記号を検索鍵として前記学習辞書部、固
定大型辞書部の順に検索して、対応する全ての単語を検
出し、もし対応する単語が唯一ならばその単語を、対応
する単語が複数存在する場合には一番先に配置されてい
るものを漢字変換の対象として選択する変換部と、 対応する単語が複数存在する場合に、もし前記変換部の
選択結果が誤っていたときには、使用者によるその旨の
指示により前記変換部にて検出された他の単語の中から
使用者の意図する単語を選択可能とした上で漢字変換の
結果とする選択部と、 前記変換部の選択が誤っており、それが使用者の前記選
択部を介しての指示により訂正されたときには、訂正後
の単語がもしも学習辞書部に格納されていなかったなら
ば使用回数を1とした上で検索鍵として読み記号と対応
させて新規に格納し、既に格納されているならばその単
語の使用回数に1を加えた上で当該入力された読み記号
での前記学習辞書部内の単語配列を前記第1に使用回数
の多さを、第2に使用の新しさを優先するという原則で
見直す配列見直し部と、 もし、前記配列見直し部による1を加えた後の当該単語
の使用回数が所定値以上となる場合には、これを検知し
た上で、前記学習辞書部での全ての単語の使用回数を一
定数減らした上で別途定められたしきい値と比較し、そ
の値がしきい値未満となる単語の学習辞書部からの削除
を行う更新部とを有していることを特徴とする漢字変換
学習装置。
1. If there are a plurality of corresponding words, the reading symbols and the corresponding words are arranged in accordance with the frequency of use, and the registered fixed large dictionary section, the reading symbols and the corresponding words are registered. A learning dictionary unit for storing words and the number of times of use firstly in an array in accordance with the principle that priority is given to the number of times of use and secondly to the priority of newness of use; The dictionary part is searched in the order of the fixed large dictionary part, and all the corresponding words are detected.If the corresponding word is unique, the word is arranged first, and if there is a plurality of corresponding words, the word is arranged first. A conversion unit for selecting a target word as a target of kanji conversion, and when there are a plurality of corresponding words, if the selection result of the conversion unit is incorrect, the conversion unit is instructed by the user to that effect. Detected A selection unit that allows the user to select a word intended by the user from among other words, and selects the conversion unit as a result of the kanji conversion. If the corrected word is not stored in the learning dictionary section, the number of times of use is set to 1 and the word is newly stored as a search key in association with the reading symbol, and is already stored. If the word has been used, 1 is added to the number of times the word is used, and then the word arrangement in the learning dictionary section at the input reading symbol is firstly used by a large number of times, and secondly A sequence review unit that revises the rule based on the principle that priority is given to the word. If the number of times the word is used after adding 1 by the sequence review unit becomes a predetermined value or more, this is detected, and then the learning is performed. A fixed number of times all words are used in the dictionary A kanji conversion learning method comprising: an updating unit that compares a reduced value with a separately determined threshold value and deletes a word whose value is less than the threshold value from the learning dictionary unit. apparatus.
【請求項2】 使用者からの定義単語の作成指示によ
り、使用者定義単語を作成し、これの検索鍵として入力
された読み記号と対応させた上で両者を前記学習辞書部
に格納する使用者定義単語作成部を有していることを特
徴とする請求項1記載の漢字変換学習装置。
2. A method in which a user-defined word is created in accordance with a definition word creation instruction from a user, and the user-defined word is made to correspond to a phonetic symbol input as a search key, and both are stored in the learning dictionary unit. 2. The kanji conversion learning device according to claim 1, further comprising a user-defined word creation unit.
【請求項3】 前記使用者定義単語作成部は、オフライ
ン方式を用いることが可能であることを特徴とする請求
項2記載の漢字変換学習装置。
3. The kanji conversion learning device according to claim 2, wherein the user-defined word creating unit can use an off-line method.
【請求項4】 前記配列見直し部は、前記使用者定義単
語作成部によって作成された使用者定義単語の検索用読
み記号と同音の他の単語が学習辞書部に既に格納されて
いる場合には、この新しい使用者定義単語の使用回数を
その同音異義の単語の使用回数若しくは該使用回数とあ
らかじめ定められた値の多い方に、もし同音異義の単語
が複数格納されている場合にはそれらの使用回数のうち
最大値若しくは該最大値とあらかじめ定められた値の多
い方に設定することを特徴とする請求項2若しくは請求
項3記載の漢字変換学習装置。
4. The method according to claim 1, wherein the sequence reviewing unit is configured to perform a search if the search-reading symbol of the user-defined word created by the user-defined word creation unit is already stored in the learning dictionary unit when another word having the same sound is already stored. If the number of uses of the new user-defined word is the same as the number of uses of the homonymous word or the larger of the number of uses and the predetermined value, if a plurality of homonymous words are stored, The kanji conversion learning device according to claim 2 or 3, wherein the kanji conversion learning device is set to a maximum value or a larger value of the maximum value and a predetermined value among the number of times of use.
JP19637293A 1993-08-06 1993-08-06 Kanji conversion learning device Expired - Fee Related JP3154875B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP19637293A JP3154875B2 (en) 1993-08-06 1993-08-06 Kanji conversion learning device
CN94104905.1A CN1101732A (en) 1993-08-06 1994-04-29 Chinese characters changing learning device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19637293A JP3154875B2 (en) 1993-08-06 1993-08-06 Kanji conversion learning device

Publications (2)

Publication Number Publication Date
JPH0749863A JPH0749863A (en) 1995-02-21
JP3154875B2 true JP3154875B2 (en) 2001-04-09

Family

ID=16356773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19637293A Expired - Fee Related JP3154875B2 (en) 1993-08-06 1993-08-06 Kanji conversion learning device

Country Status (2)

Country Link
JP (1) JP3154875B2 (en)
CN (1) CN1101732A (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101324878B (en) * 2007-06-15 2012-06-13 夏普株式会社 Method and apparatus for automatically learning new words and character input system
CN105069028B (en) * 2015-07-16 2018-05-25 广东小天才科技有限公司 Chinese character pushing method and Chinese character pushing device based on pinyin
CN112748809B (en) * 2019-10-16 2024-08-16 北京搜狗科技发展有限公司 Method and device for displaying entry of input method

Also Published As

Publication number Publication date
JPH0749863A (en) 1995-02-21
CN1101732A (en) 1995-04-19

Similar Documents

Publication Publication Date Title
US9471566B1 (en) Method and apparatus for converting phonetic language input to written language output
JP2013117978A (en) Generating method for typing candidate for improvement in typing efficiency
JP2003514304A (en) A linguistic input architecture that converts from one text format to another and is resistant to spelling, typing, and conversion errors
US8307281B2 (en) Predicting conversion candidates based on the current context and the attributes of previously selected conversion candidates
JP4005925B2 (en) Document processing method, document processing apparatus, and program
JP3154875B2 (en) Kanji conversion learning device
JP5245737B2 (en) Speech-to-speech generation device, speech-to-speech generation method, and speech-to-speech generation program
JPH10269204A (en) Automatic Chinese document proofing method and device
JP2001229162A (en) Automatic Chinese document proofing method and device
JP3762300B2 (en) Text input processing apparatus and method, and program
JP2002207728A (en) Phonetic character generation device and recording medium storing program for realizing the same
JP2003016055A (en) Sentence creation device and sentence creation method
JP3419205B2 (en) Information retrieval device
US6327560B1 (en) Chinese character conversion apparatus with no need to input tone symbols
JPH07129572A (en) Kanji converter
JP2014137636A (en) Information retrieval apparatus and information retrieval method
JPS646499B2 (en)
JPH0969104A (en) Device and method for kana-kanji conversion
JP2798931B2 (en) Chinese phonetic delimiter and phonetic kanji conversion
JP5338482B2 (en) Chinese sentence example search device and program
JPH1055360A (en) Address book processing device and address book processing method
JPH0785040A (en) Inconsistent notation detection method and kana-kanji conversion method
JP2963590B2 (en) Japanese input device
JP3236190B2 (en) Character processing apparatus and method
JP2008140074A (en) Example sentence search device and example sentence search processing program

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees