Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0638253B2 - Kana-Kanji conversion processor - Google Patents
[go: Go Back, main page]

JPH0638253B2 - Kana-Kanji conversion processor - Google Patents

Kana-Kanji conversion processor

Info

Publication number
JPH0638253B2
JPH0638253B2 JP59130567A JP13056784A JPH0638253B2 JP H0638253 B2 JPH0638253 B2 JP H0638253B2 JP 59130567 A JP59130567 A JP 59130567A JP 13056784 A JP13056784 A JP 13056784A JP H0638253 B2 JPH0638253 B2 JP H0638253B2
Authority
JP
Japan
Prior art keywords
kana
conversion
conversion result
word
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59130567A
Other languages
Japanese (ja)
Other versions
JPS619757A (en
Inventor
克彦 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59130567A priority Critical patent/JPH0638253B2/en
Publication of JPS619757A publication Critical patent/JPS619757A/en
Publication of JPH0638253B2 publication Critical patent/JPH0638253B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は、カナ漢字変換処理装置に関し、特にカナ漢字
変換結果の信頼性を向上せしめるのに好適なカナ漢字変
換処理装置に関する。
TECHNICAL FIELD The present invention relates to a kana-kanji conversion processing device, and more particularly to a kana-kanji conversion processing device suitable for improving the reliability of a kana-kanji conversion result.

従来技術 最近、日本語ワードプロセッサやコンピュータへの入力
方法として、カナ漢字変換方式が主流になってきた。全
文文字配列ペンタッチ・タブレットや、カナ2ストロー
クで1漢字を入力する方法も個々の特徴から依然として
使われているが、誰でもが使えるという手軽さの点で、
カナ漢字変換方式が完全にリードしている。
2. Description of the Related Art Recently, the kana-kanji conversion method has become the mainstream as an input method for Japanese word processors and computers. The full-text character arrangement pen touch tablet and the method of inputting one Kanji with two strokes of kana are still used due to their individual characteristics, but in terms of the ease of use by anyone,
The kana-kanji conversion method is completely leading.

カナ漢字変換方式では、カナ(平仮名、片仮名、、ロー
マ字)で入力された文章を適切な漢字カナ混じり文にす
るため、単語辞書を設けている。また、入力方式として
は、単語単位にカナ漢字変換キーを押下する方式、
文節単位にカナ漢字変換キーを押下する方式、漢字の
部分の前後をキーで指定する方式、べた書き入力を許
容し、文節単位の文法解析、およびカナ漢字変換をシス
テムが自動的に行う方式等がるが、入力の迅速性の点で
のべた書き入力方法が最も優れている。
In the Kana-Kanji conversion method, a word dictionary is provided in order to convert sentences input in Kana (Hiragana, Katakana, and Roman characters) into proper Kana-Kana mixed sentences. In addition, as the input method, a method of pressing the Kana-Kanji conversion key for each word,
Method of pressing Kana-Kanji conversion key for each bunsetsu, method of specifying the front and back of Kanji part with keys, system that automatically accepts solid writing, grammatical analysis for each bunsetsu, and system for Kana-Kanji conversion However, the solid input method is the best in terms of speed of input.

しかし、上記いずれの方式を採ったとしても、日本語の
特色、すなわち、多くの同音異義語の存在、文法的複雑
さ等のため、一回の変換処理で正しい漢字カナ混じり文
を得ることは困難である。
However, even if any of the above methods is adopted, it is not possible to obtain a correct kanji-kana mixed sentence in one conversion process due to the characteristics of Japanese, that is, the presence of many homonyms and grammatical complexity. Have difficulty.

例えば、「しろがそを(白画素を)」という例文をかな
漢字変換する場合を考えてみる。
For example, consider a case where the example sentence "Shirogaso (white pixel)" is converted into Kana-Kanji.

もし「白画素」という単語が変換辞書にあれば、どのよ
うな方式のカナ漢字変換においても正しく変換すること
ができる確率は非常に高い。しかし、「白画素」のよう
な複合語は、「画素」についてだけでも「黒画素」、
「赤画素」…など複数存在し、複合語全体では天文学的
数字になるので、一般に、複合語はそれ自体では単語辞
書に登録されず、個々の単語のみが登録される。このた
め、システムは文法解析等を行い、該当する単語を単語
辞書から引き出し、その中から最も評価値の高い単語を
選択し変換結果として出力する。
If the word "white pixel" is in the conversion dictionary, the probability of correct conversion is extremely high in any method of Kana-Kanji conversion. However, a compound word such as "white pixel" means that "black pixel"
Since there are a plurality of "red pixels" and the like and the entire compound word is an astronomical number, the compound word is generally not registered in the word dictionary by itself, but only individual words are registered. Therefore, the system performs grammar analysis and the like, extracts the corresponding word from the word dictionary, selects the word with the highest evaluation value from it, and outputs it as the conversion result.

しかし、例えば、文節指定方式のカナ漢字変換では、
「白がそを」などと誤った表示をする恐れがある。ま
た、複数文節の入力を許すようなシステムでは、「画
素」という単語が登録されていない場合など、「白が疎
を」等の不自然な変換結果を表示することも考えられ
る。「白がそを」と「白が疎を」を比べた場合、両方と
も誤りであることには違いはないが、オペレータから見
て、「白がそを」の方が違和感が少ないものと思われ
る。
However, for example, in Kana-Kanji conversion with the phrase specification method,
There is a risk that the display will be erroneous, such as "white glazed". Further, in a system that allows the input of a plurality of clauses, it is possible to display an unnatural conversion result such as “white is sparse” when the word “pixel” is not registered. There is no difference in the difference between "Shiro ga soo" and "Shiro ga sparse", but from the operator's point of view, "Shiro ga soo" is less uncomfortable. Seem.

このように、入力文字列に対する複数のカナ漢字変換結
果間には信頼性の高低があるにもかかわらず、従来は、
変換結果として表示する場合、信頼性の高い変換結果も
低い変換結果も皆同様に扱っていたため、「白が疎を」
のようにオペレータに違和感を与える変換結果も表示さ
れてしまっている。カナ漢字変換処理装置により、手書
き、もしくはそれ以上のスピードで文書を作成すること
が日常的となりつつある現在では、このような不自然な
変換結果の表示は、オペレータの心理的負担、疲労度を
増大させ、長時間の操作を不可能にする。
In this way, despite the high and low reliability between the multiple Kana-Kanji conversion results for the input character string,
When displaying as the conversion result, since the conversion result with high reliability and the conversion result with low reliability were all treated in the same way, "white is sparse"
The conversion result that gives the operator a feeling of strangeness is also displayed. Nowadays, it is becoming more and more common to create documents by handwriting or faster with a kana-kanji conversion processing device, and such an unnatural display of conversion results reduces the psychological burden and fatigue of the operator. Increase and make long-time operation impossible.

目的 本発明の目的は、上記のような従来技術の問題点を解決
するため、オペレータに違和感を与えるような不自然な
変換結果の表示を回避し得るカナ漢字変換処理装置を提
供することにある。
It is an object of the present invention to provide a kana-kanji conversion processing device capable of avoiding the display of an unnatural conversion result that gives the operator a feeling of discomfort, in order to solve the above-mentioned problems of the prior art. .

構成 本発明の上述の目的は、表音文字により入力された文字
列に対するカナ漢字変換候補を、単語辞書を検索するこ
とにより複数抽出し、その中から最尤候補単語を決定し
変換結果とするカナ漢字変換制御手段を有するカナ漢字
変換処理装置において、前記変換結果の信頼性を判定す
る手段を設けるとともに、前記カナ漢字変換制御手段
を、前記信頼性判定手段により信頼性が低いと判定され
た場合には当該変換結果をカナに変換して表示し、信頼
性が高いと判定された場合には当該変換結果をそのまま
の形で表示するよう構成したことを特徴とするカナ漢字
変換処理装置によって達成される。
Structure The above-mentioned object of the present invention is to extract a plurality of Kana-Kanji conversion candidates for a character string input by phonetic characters by searching a word dictionary, and determine the maximum likelihood candidate word from them to be the conversion result. A kana-kanji conversion processing device having kana-kanji conversion control means is provided with a means for judging the reliability of the conversion result, and the kana-kanji conversion control means is judged to have low reliability by the reliability judgment means. In this case, the conversion result is converted into kana and displayed, and when it is determined that the reliability is high, the conversion result is displayed as it is. To be achieved.

実施例 以下、本発明の実施例を図面に基づいて詳細に説明す
る。
Embodiment Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.

第1図は、本発明の一実施例によるカナ漢字変換処理装
置のブロック図である。
FIG. 1 is a block diagram of a kana-kanji conversion processing device according to an embodiment of the present invention.

第1図において、1は入力部、2は変換対象文字列作成
部、3は辞書検索部、4は単語辞書、5は接続可否判定
部、6は接続可否判定表(接続重み表)、7は評価部、
8は変換結果信頼性判定部、9は出力部である。
In FIG. 1, 1 is an input unit, 2 is a conversion target character string creating unit, 3 is a dictionary search unit, 4 is a word dictionary, 5 is a connection availability determination unit, 6 is a connection availability determination table (connection weight table), 7 Is the evaluation section,
Reference numeral 8 is a conversion result reliability determination unit, and 9 is an output unit.

入力部1により表音文字(平仮名、片仮名、ローマ字
等)で、文節単位、べた書き等の方法で入力された文章
は、変換対象文字列作成部2により変換対象文字列が抽
出される。抽出された変換対象文字列は、その先頭から
辞書検索部3により単語辞書4が検索され、その読みに
対応する複数の候補単語が抽出される。接続可否判定部
5は、辞書検索部3により抽出された候補単語につい
て、接続可否判定表6を参照して直前の単語との接続の
可否を判定する。次に、評価部7は、接続可能な候補単
語について、読み長さ、接続の重み、出現頻度等をパラ
メータとする評価式を用いて評価を行い、評価値の最も
高い語を変換結果とする。
A conversion target character string creation unit 2 extracts a conversion target character string from a sentence input by a phonetic character (Hiragana, Katakana, Roman character, etc.) by the input unit 1 by a method such as phrase unit or solid writing. From the beginning of the extracted conversion target character string, the dictionary search unit 3 searches the word dictionary 4 to extract a plurality of candidate words corresponding to the reading. The connection availability determination unit 5 refers to the connection availability determination table 6 for the candidate words extracted by the dictionary search unit 3, and determines whether the connection with the immediately preceding word is possible. Next, the evaluation unit 7 evaluates the connectable candidate words using an evaluation formula having parameters such as reading length, connection weight, and appearance frequency as parameters, and sets the word with the highest evaluation value as the conversion result. .

上記変換結果に対し、変換結果信頼性判定部8は、その
信頼性を判定する。例えば、前述の「しろがそを」とい
う文章を、べた書き入力する場合、「白/が」まで解析
が進んだあとで後続文字列の「そを」について「そ」の
読みを持つ単語だけが得られる。評価部7は、「そ」の
読みを持つ複数の単語を評価し、その中から最も評価値
の高いものを変換結果とするわけであるが、直前の単語
「が」、および「そ」は、読み長が短かく、接続の重み
も大きくなく、また、「そ」の出現頻度もそれほど大き
くないため、これらの評価値はいずれも小さくなる。
The conversion result reliability determination unit 8 determines the reliability of the conversion result. For example, when inputting the above-mentioned sentence "Shirogaso" in a solid form, only the words that have the reading "so" in the subsequent character string "so" after the analysis has proceeded to "white / ga" Is obtained. The evaluation unit 7 evaluates a plurality of words having the reading of “so” and takes the one having the highest evaluation value among them as the conversion result. However, the immediately preceding words “ga” and “so” are Since the reading length is short, the connection weight is not large, and the frequency of occurrence of "so" is not so large, all of these evaluation values are small.

変換結果が漢字の場合は、その評価値は変換結果信頼性
判定部8に設けられた閾値と比較され、閾値より小さい
場合は、正確な変換結果である可能性が少なく、かつオ
ペレータに違和感を与えるので、カナに変換され出力部
9から出力される。閾値は、評価式の形式に応じた最適
な値を実験的に求めることにより決定する。
If the conversion result is Kanji, the evaluation value is compared with the threshold value provided in the conversion result reliability determination unit 8. If the conversion value is smaller than the threshold value, the conversion result is unlikely to be accurate and the operator feels uncomfortable. Since it is given, it is converted into kana and output from the output unit 9. The threshold value is determined by experimentally obtaining an optimum value according to the format of the evaluation formula.

この場合のアルゴリズムを第2図に示す。変換結果信頼
性判定部8は、変換結果が漢字である場合は変換結果の
評価値が閾値以上か否かを判定する(201、20
2)。もし閾値以上であれば、たとえその変換結果が誤
っていたとしても、オペレータに対し、それほど違和感
を感じさせないので、変換結果をそののまま形で表記情
報として出力部9へ送る(202、204)。もし、閾
値以下であれば、その変換結果は誤っている確率が非常
に高く、かつ、オペレータに対し違和感を感じさせるの
で、変換結果をカナ(読み)に変換し、それを表記情報
として出力部9へ送出する(202、203)。なお、
変換結果がカナ、すなわち無変換の場合はもともとカナ
なので、カナに変換すべきか否かを変換結果信頼性判定
部8により判定することは無意味なので、変換結果をそ
のままの形で表記情報として出力部9へ送る(201、
204)。
The algorithm in this case is shown in FIG. When the conversion result is a Chinese character, the conversion result reliability determination unit 8 determines whether the evaluation value of the conversion result is equal to or more than a threshold value (201, 20).
2). If it is equal to or more than the threshold value, even if the conversion result is incorrect, the operator does not feel a sense of incongruity. Therefore, the conversion result is sent as it is as the notation information to the output unit 9 (202, 204). . If the conversion result is less than the threshold value, the conversion result has a very high probability of being erroneous, and it makes the operator feel uncomfortable. Therefore, the conversion result is converted into kana (reading) and is output as notation information in the output unit. 9 (202, 203). In addition,
When the conversion result is Kana, that is, when it is not converted, since it is originally Kana, it is meaningless to determine by the conversion result reliability determination unit 8 whether or not to convert to Kana, so the conversion result is output as the notation information as it is. Send to Part 9 (201,
204).

第3図は第2図の変換結果信頼性判定部8の具体的な動
作例を示すフローチャートである。
FIG. 3 is a flow chart showing a specific operation example of the conversion result reliability determination unit 8 in FIG.

本例は、読みの長さが短かい場合は、変換結果の信頼性
が低いという経験的な知見を基に、読み長により信頼性
を判定し、信頼性の低い語は、カナ表記で出力するよう
に構成したものである。すなわち、変換結果信頼性判定
部8は、変換結果が漢字である場合、その語の読みの長
さは1字か否かを判定し、もし2字以上であれば、その
ままの形で表記情報として出力部9へ送る(301、3
02、305)。もし1字であれば、さらに、直前の語
の読みの長さを調べ、もし2字より長ければ、そのまま
の形で表示し(301、302、303、305)、2
字以下の場合はカナ(読み)に変換し、それを表記情報
として出力部9へ送る(303、304)。例えば、上
記「しろがそを」の例で、「そ」に対する変換結果とし
て「疎」が変換結果信頼性判定部8に送られてきたとす
る。この場合、「疎」の読みの長さは1であるので直前
の語の読みの長さを判断する。直前の語「が」の読みの
長さは2以下であるので「疎」をカナに変換し、「そ」
を表記情報とする。
In this example, if the reading length is short, the reliability is judged based on the reading length based on the empirical knowledge that the reliability of the conversion result is low, and the unreliable words are output in Kana notation. It is configured to do. That is, the conversion result reliability determination unit 8 determines whether or not the reading length of the word is one character when the conversion result is a Chinese character, and if it is two or more characters, the notation information as it is. To the output unit 9 (301, 3
02, 305). If it is 1 character, further check the reading length of the immediately preceding word, and if it is longer than 2 characters, display it as it is (301, 302, 303, 305), 2
When the number of characters is less than or equal to the number of characters, it is converted to kana (reading) and sent as notation information to the output unit 9 (303, 304). For example, in the above example of “shiroga so”, it is assumed that “sparse” is sent to the conversion result reliability determination unit 8 as the conversion result for “so”. In this case, since the reading length of "sparse" is 1, the reading length of the immediately preceding word is determined. The reading length of the immediately preceding word "ga" is 2 or less, so "sparse" is converted to kana and "so" is converted.
Is the notation information.

なお、読み長は、単語辞書に記入しても良いし、単語辞
書に記入せず、読み長用のカウンタを設けても良い。
The reading length may be entered in the word dictionary, or a reading length counter may be provided without entering it in the word dictionary.

上記例は、単語の「読み」の長さだけをパラメータとし
て変換結果を評価する例であるが、複数のパラメータを
使用すれば、より正確に信頼性を判定することができ
る。その一例を次に説明する。
The above example is an example in which the conversion result is evaluated using only the length of the word "reading" as a parameter, but the reliability can be more accurately determined by using a plurality of parameters. An example will be described below.

すなわち、読み長、頻度ランク、単語の語類および出現
位置による接続の重みをパラメータとする。
That is, the reading weight, the frequency rank, the category of the word, and the connection weight based on the appearance position are used as parameters.

第4図は、上記頻度ランク情報を有する場合の単語辞書
4の内容を示す図である。この場合、単語辞書4は、
「読み」、「表記」、「頻度ランク」「語類」、「その
他の情報」の項目からなる。
FIG. 4 is a diagram showing the contents of the word dictionary 4 in the case of having the frequency rank information. In this case, the word dictionary 4 is
It consists of "reading", "notation", "frequency rank", "words", and "other information".

「頻度ランク」の項目は、単語の使用頻度をクラス分け
して得た数値で、使用頻度の高いもの程大きい値になっ
ている。
The item of “frequency rank” is a numerical value obtained by classifying the frequency of use of words, and the higher the frequency of use, the larger the value.

第5図は接続の重みを示す図であり、単語の語類および
出現位置による接続の重みを表示する。この表では、変
換対象単語の位置と、先行する単語の品詞の字種を組み
合わせた語類が行に、上記種類が列に配されている。
FIG. 5 is a diagram showing connection weights, and displays connection weights according to word categories and appearance positions. In this table, the categories in which the position of the conversion target word and the character type of the part of speech of the preceding word are combined are arranged in rows, and the types are arranged in columns.

例えば、「このしろがそを」という変換対象文字が変換
対象文字作成部2で作成されたとき、第4図、第5図を
用いて評価値を求める場合の動作は次のようになる。
For example, when the conversion target character "Kono Shiro ga soo" is created by the conversion target character creation unit 2, the operation for obtaining the evaluation value using FIGS. 4 and 5 is as follows.

辞書検索部4は変換対象文字列の先頭から辞書びきを行
い、「子」、「孤」、「この」等を抽出して接続検定部
5に送る。接続検定部5は抽出された単語に対し接続の
可否を検定し、接続可能な単語はすべて評価部7に送
る。
The dictionary search unit 4 performs a dictionary search from the beginning of the conversion target character string, extracts “child”, “arc”, “this”, etc. and sends them to the connection verification unit 5. The connection verification unit 5 verifies whether the extracted words can be connected, and sends all connectable words to the evaluation unit 7.

評価部7は、送られてきた単語の1つ1つに対し、次の
ように評価を行う。すなわち、評価値Fを F(l,f,e)=l+f+2e (1) と定義する。ここで、lは前記読み長、fは第5図に示
された頻度ランク、eは接続の重みである。第5図に示
したように、単語が文頭にある場合には、連体詞である
「この」にのみ接続の重み`1´が与えられており、他
の名詞「子」、「孤」の接続の重みは`0´となってい
る。また、「子」の読み長は1、頻度ランクは3であ
り、「孤」の読み長は1、頻度ランクは1である。した
がって、これらの評価値Fは、 「子」 …1+3+2×0=4 「孤」 …1+1+2×0=2 「この」 …2+5+2×1=9 となる。
The evaluation unit 7 evaluates each sent word as follows. That is, the evaluation value F is defined as F (l, f, e) = l + f + 2e (1). Here, 1 is the reading length, f is the frequency rank shown in FIG. 5, and e is the connection weight. As shown in FIG. 5, when the word is at the beginning of a sentence, the connection weight "1 '" is given only to the adnominal "kono", and the connection of other nouns "child" and "ko". Has a weight of 0 '. Further, the reading length of "child" is 1 and the frequency rank is 3, and the reading length of "Ko" is 1 and the frequency rank is 1. Therefore, these evaluation values F are “child” ... 1 + 3 + 2 × 0 = 4 “arc” ... 1 + 1 + 2 × 0 = 2 “this” ... 2 + 5 + 2 × 1 = 9.

これにより、最も評価値の高い「この」が選択され、変
換結果信頼性判定部8に送られる。変換結果信頼性判定
部8は、この評価方式に適した閾値、例えば閾値=4と
比較し、それより大きければそのままの形で出力部9へ
送る。
As a result, “this” having the highest evaluation value is selected and sent to the conversion result reliability determination unit 8. The conversion result reliability determination unit 8 compares with a threshold value suitable for this evaluation method, for example, threshold value = 4, and if larger than that, sends it to the output unit 9 as it is.

次に、「そ」に対する変換候補単語として「素」、
「組」、「訴」、「疎」が送られたきたとする。これら
に対する評価値Fは、第4図、第5図から次のようにな
る。
Next, as a conversion candidate word for "so",
It is assumed that "group", "suit", and "sparse" have been sent. The evaluation value F for these is as follows from FIGS. 4 and 5.

「素」 …1+2+2×0=3 「組」 …1+3+2×0=4 「疎」 …1+1+2×0=2 「訴」 …1+2+2×0=3 となり、変換結果として評価値の最も大きい「組」が選
択されるが、この「組」の評価値は、変換結果信頼性判
定部8の閾値4より大きくないので、カナに変換され
「そ」として出力される。
"Elementary" ... 1 + 2 + 2x0 = 3 "Group" ... 1 + 3 + 2x0 = 4 "Sparse" ... 1 + 1 + 2x0 = 2 "Action" ... 1 + 2 + 2x0 = 3 Although selected, the evaluation value of this “pair” is not larger than the threshold value 4 of the conversion result reliability determination unit 8, so it is converted to kana and output as “so”.

したがって、オペレータに違和感を与える「この白が組
を」という表示は回避され、「この白がそを」という比
較的自然な表示が得られる。
Therefore, the display "This white is a pair" which gives the operator a feeling of strangeness is avoided, and a relatively natural display "This white is a pair" is obtained.

なお、上に示した各評価方式は、本発明において使用さ
れる評価方式を例示したにすぎず、他の評価方式を使用
しても良いことは明らかである。ただし、各評価方式に
より変換結果信頼性判定部8に設ける閾値が異なること
は言うまでもない。
It should be noted that the above-described evaluation methods are merely examples of the evaluation method used in the present invention, and it is obvious that other evaluation methods may be used. However, it goes without saying that the threshold value provided in the conversion result reliability determination unit 8 differs depending on each evaluation method.

また、表示方法については、第6図に示すように、最も
適切なカナ漢字変換であるとして送られてきた変換結果
の信頼性が高い場合は、その変換結果である単語の表記
情報をそのまま出力部9へ送り(602、604)、変
換結果の信頼性が低い場合は、単語の表記情報をカタカ
ナに変換して出力部9へ送る(602、603)ことも
可能である。
Regarding the display method, as shown in FIG. 6, when the conversion result sent as the most appropriate Kana-Kanji conversion is highly reliable, the notation information of the word that is the conversion result is output as it is. If the reliability of the conversion result is low, the word notation information may be converted to katakana and sent to the output unit 9 (602, 603).

この場合は、漢字表記よりは違和感が少なくなるととも
に、オペレータは変換結果の信頼性が低いことを判断し
易くなり、それに対する対応が迅速化される。例えば、
その後の入力方法を変更したり、単語登録をすることな
どの対応が迅速化される。
In this case, the sense of incongruity is less than that of the Chinese character notation, and it becomes easier for the operator to determine that the reliability of the conversion result is low, and the response to it is speeded up. For example,
Responses such as changing the input method thereafter and registering a word will be speeded up.

このように、最も適切なカナ漢字変換であるとして評価
され送られてきた変換結果に対し、その信頼性を判定
し、信頼性が低い場合はカナに変換して表示することに
より、あまりにも不自然なカナ漢字混じり表示を回避す
ることができる。
In this way, the reliability of the conversion result that has been evaluated and sent as the most appropriate kana-kanji conversion is judged, and if the conversion result is low, it is converted to kana and displayed. It is possible to avoid the display of natural kana-kanji mixed.

また、出力表示をもとに再変換処理が可能であるような
編集機能と組み合わせれば、再入力が少なくて済むとい
う効果がある。さらに、表示をもとに、必要な単語を登
録すべきだとオペレータが判断することができるという
効果もある。
Further, when combined with an editing function capable of re-conversion processing based on the output display, there is an effect that re-inputting can be reduced. Further, there is an effect that the operator can determine that the necessary word should be registered based on the display.

効果 以上説明したように、本発明のカナ漢字変換処理装置に
よれば、変換結果の信頼性を判断し、信頼性の低い変換
結果はカナに変換して出力することにより、オペレータ
に違和感を与えるような不自然な変換結果の表示を回避
することができ、オペレータの疲労度を低減することが
できる。
Effect As described above, according to the kana-kanji conversion processing device of the present invention, the reliability of the conversion result is determined, and the conversion result having low reliability is converted to kana and output, thereby giving the operator a feeling of strangeness. It is possible to avoid such an unnatural display of the conversion result and reduce the operator's fatigue level.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例によるカナ漢字変換処理装置
のブロック図、第2図は第1図に示した変換結果信頼性
判定部の動作を示すフローチャート、第3図は第2図の
動作の具体例を示すフローチャート、第4図、第5図は
本発明の他の実施例による変換結果信頼性判定部のデー
タ、第6図は本発明の他の実施例による出力態様を示す
フローチャートである。 1:入力部、2:変換対象文字列作成部、3:辞書検索
部、4:単語辞書、5:接続可否判定部、6:接続可否
判定表、7:評価部、8:変換結果信頼性判定部、9:
出力部。
FIG. 1 is a block diagram of a kana-kanji conversion processing device according to an embodiment of the present invention, FIG. 2 is a flow chart showing the operation of the conversion result reliability judgment unit shown in FIG. 1, and FIG. Flowcharts showing specific examples of operations, FIGS. 4 and 5 are data of a conversion result reliability determination unit according to another embodiment of the present invention, and FIG. 6 is a flowchart showing an output mode according to another embodiment of the present invention. Is. 1: input unit, 2: conversion target character string creating unit, 3: dictionary search unit, 4: word dictionary, 5: connection availability determination unit, 6: connection availability determination table, 7: evaluation unit, 8: conversion result reliability Judgment part, 9:
Output section.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】表音文字により入力された文字列に対する
カナ漢字変換候補を、単語辞書を検索することにより複
数抽出し、その中から最尤候補単語を決定し変換結果と
するカナ漢字変換制御手段を有するカナ漢字変換処理装
置において、前記変換結果の信頼性を判定する手段を設
けるとともに、前記カナ漢字変換制御手段を、前記信頼
性判定手段により信頼性が低いと判定された場合には当
該変換結果をカナに変換して表示し、信頼性が高いと判
定された場合には当該変換結果をそのままの形で表示す
るよう構成したことを特徴とするカナ漢字変換処理装
置。
1. A kana-kanji conversion control in which a plurality of kana-kanji conversion candidates for a character string input by phonetic characters are extracted by searching a word dictionary, and the maximum likelihood candidate word is determined from these to be the conversion result. A kana-kanji conversion processing device having means is provided with means for judging the reliability of the conversion result, and the kana-kanji conversion control means is provided with the above-mentioned means when the reliability judgment means judges that the reliability is low. A kana-kanji conversion processing device, characterized in that the conversion result is converted into kana and displayed, and when it is determined that the reliability is high, the conversion result is displayed as it is.
JP59130567A 1984-06-25 1984-06-25 Kana-Kanji conversion processor Expired - Lifetime JPH0638253B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59130567A JPH0638253B2 (en) 1984-06-25 1984-06-25 Kana-Kanji conversion processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59130567A JPH0638253B2 (en) 1984-06-25 1984-06-25 Kana-Kanji conversion processor

Publications (2)

Publication Number Publication Date
JPS619757A JPS619757A (en) 1986-01-17
JPH0638253B2 true JPH0638253B2 (en) 1994-05-18

Family

ID=15037335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59130567A Expired - Lifetime JPH0638253B2 (en) 1984-06-25 1984-06-25 Kana-Kanji conversion processor

Country Status (1)

Country Link
JP (1) JPH0638253B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2953367B2 (en) * 1995-12-29 1999-09-27 日本電気株式会社 LSI cooling system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5816488B2 (en) * 1979-12-26 1983-03-31 富士通株式会社 Japanese text input method
JPS57127268A (en) * 1981-01-30 1982-08-07 Canon Inc Character processing device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2953367B2 (en) * 1995-12-29 1999-09-27 日本電気株式会社 LSI cooling system

Also Published As

Publication number Publication date
JPS619757A (en) 1986-01-17

Similar Documents

Publication Publication Date Title
RU2363983C2 (en) System and method for searching using queries, written in language and/or set of characters, distinct from that of target pages
JP3531468B2 (en) Document processing apparatus and method
CN104166462A (en) Input method and system for characters
US10452785B2 (en) Translation assistance system, translation assistance method and translation assistance program
CN107765888A (en) A kind of Chinese character input method and terminal
Sharma et al. Word prediction system for text entry in Hindi
CN103376910A (en) Coincident-code-free Shuangpin input method
JPH0638253B2 (en) Kana-Kanji conversion processor
JPH11238051A (en) Chinese input conversion processing device, Chinese input conversion processing method, recording medium recording Chinese input conversion processing program
KR101355284B1 (en) Method for Recommending Words and Completing Sentences in Touch Screen Devices
JP3656907B2 (en) Translation support device
JPH08292944A (en) Character input device
EP0553745A2 (en) Character recognition apparatus
JP2621999B2 (en) Document processing device
JPS61184680A (en) Kana/kanji conversion processor
TWI541664B (en) Computer - aided selection of word - free input
JP2783597B2 (en) Kana-Kanji conversion device
JP2821143B2 (en) Morphological decomposition device
JPH01229369A (en) character processing device
JP2002297592A (en) Natural sentence matching device, natural sentence matching method, and natural sentence matching program
JPH0724054B2 (en) Data processing device
JPS61156365A (en) Automatic new word registering system in word processor
JP3552750B2 (en) Document processing device
KR880000229B1 (en) How to Convert Japanese Kana Kanji
JPH0585055B2 (en)