JP4890551B2 - Character conversion device and method for controlling character conversion device - Google Patents
Character conversion device and method for controlling character conversion device Download PDFInfo
- Publication number
- JP4890551B2 JP4890551B2 JP2008528762A JP2008528762A JP4890551B2 JP 4890551 B2 JP4890551 B2 JP 4890551B2 JP 2008528762 A JP2008528762 A JP 2008528762A JP 2008528762 A JP2008528762 A JP 2008528762A JP 4890551 B2 JP4890551 B2 JP 4890551B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- conversion
- kanji
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
- G06F40/129—Handling non-Latin characters, e.g. kana-to-kanji conversion
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、ユーザが、キーボードやタッチパネル、タブレット、マウス等のポインティングデバイスを使って文字あるいは文字列を入力するための装置であり、変換指示を受け付けて、入力された文字あるいは文字列に応じて、変換された文字あるいは文字列を選択可能に表示し、この表示された文字あるいは文字列をユーザが選択することで所望の文字あるいは文字列の入力が行われる文字変換装置に関するものである。 The present invention is an apparatus for a user to input a character or a character string using a pointing device such as a keyboard, a touch panel, a tablet, or a mouse, receives a conversion instruction, and according to the input character or character string The present invention relates to a character conversion device that displays a converted character or character string so that the user can select the displayed character or character string, and allows the user to input a desired character or character string.
日本語や中国語などの漢字や単語を、ユーザがキーボードを用いて情報機器へ文字入力し表示させるには、漢字や単語に対する読み(表音文字)を入力し、変換指示操作を行うことで実現されている。読みを漢字に変換するには、読みと漢字や単語とを関連付けた辞書データが必要であり、辞書データの語彙数の量が情報機器(入力システム)の性能の一面となっている。 In order for the user to input and display kanji and words such as Japanese and Chinese on the information device using the keyboard, the user can input readings (phonetic characters) for kanji and words and perform conversion instruction operations. It has been realized. In order to convert readings into kanji, dictionary data that associates readings with kanji and words is necessary, and the amount of vocabulary in the dictionary data is one aspect of the performance of the information device (input system).
しかし、語彙数が多くなると、情報機器では、入力された読みに一致する漢字を辞書データから検索する時間が増加する。そのため、ユーザが読みを入力し変換を指示してから、変換結果を表示するまでのレスポンスが悪くなり、結果的に情報機器の使いにくさに繋がる。 However, as the number of vocabularies increases, the information device increases the time for searching the dictionary data for kanji that matches the input reading. For this reason, the response from when the user inputs a reading and gives a conversion instruction until the conversion result is displayed deteriorates, resulting in difficulty in using the information device.
そこで、漢字や単語の検索時間を削減するための工夫が行われている。例えば、辞書中の単語について、読みの先頭文字毎にその先頭文字の読みで始まる単語の読みの最大文字数を索引情報中に持たせることで、入力文字列に対する検索対象の制限を行い、検索に関する処理量の削減を行う変換装置がある(例えば、特許文献1参照)。
しかしながら、上記従来の装置では、入力された読みの文字数が、索引情報に記録されている入力読み文字列の先頭文字の読みで始まる単語の読みの最大文字数以内であれば、その読みの範囲の全辞書データと一致しているか否かをくまなくチェックする必要がある。そのため、変換できる語彙数を増やすために辞書データに収録する語彙数が増加すると、先頭読み文字毎の漢字、単語数が多くなり、前記条件の時の処理時間が増加する。結局、表示出力までのレスポンスが低下してしまい、情報機器は使いにくいものとなってしまう。 However, in the above-described conventional apparatus, if the number of input characters is within the maximum number of words that start reading the first character of the input character string recorded in the index information, It is necessary to check all the data to see if it matches all dictionary data. Therefore, when the number of vocabulary recorded in the dictionary data is increased in order to increase the number of vocabularies that can be converted, the number of kanji and words for each first reading character increases, and the processing time under the above conditions increases. Eventually, the response until display output is reduced, and the information device becomes difficult to use.
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、入力された表音文字に対する単語の検索時間を短縮できる文字変換装置、文字入力方法、文字入力プログラムおよびコンピュータ読取可能な記録媒体を実現することにある。 The present invention has been made in view of the above-described problems, and its object is to provide a character conversion device, a character input method, a character input program, and a computer readable program that can shorten a word search time for an input phonetic character. Is to realize a simple recording medium.
本発明に係る文字変換装置は、上記課題を解決するために、入力された1以上の表音文字よりなる入力文字列を変換文字に変換し、当該変換文字からなる単語を決定できる文字変換装置において、
(a−1)変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報および、(a−2)入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、
(b−1)単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報および、(b−2)単語の先頭となる先頭変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す先頭変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、
(c)入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得手段と、
(d)取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得手段と、を備えていることを特徴としている。In order to solve the above problems, a character conversion device according to the present invention converts an input character string made up of one or more input phonetic characters into a converted character, and can determine a word made up of the converted character. In
(A-1) conversion character identification information for identifying a conversion character and conversion character correspondence information in which conversion character phonetic information indicating the phonetic of the conversion character is associated, and (a-2) input And the converted character storage location information indicating the storage location in the converted character correspondence information of the converted character identification information having the phonetic character as the head of the converted character phonetic information. A converted character dictionary having a converted character index;
(B-1) word correspondence information in which word identification information for identifying a word and word phonetic information indicating the phonetic expression of the word are associated with each other, and (b-2) head conversion that becomes the head of the word First conversion character identification information for identifying a character is associated with word storage destination information indicating the storage destination of the word having the first conversion character indicated by the first conversion character identification information in the word correspondence information. A word dictionary having a word index,
(C) Conversion with reference to the converted character dictionary based on the first phonogram of the input character string that is input, and having the first phonogram of the input character string as the head of the converted character phonogram information First conversion character acquisition means for acquiring character identification information;
(D) word acquisition means for referring to the word dictionary based on the acquired head conversion character identification information and acquiring a word having the conversion character indicated by the head conversion character identification information at the head; It is characterized by that.
上記構成によると、初めに先頭変換文字取得手段が、変換文字辞書を参照に、入力文字列の先頭の表音文字から、変換文字を検索し、次に、単語取得手段が、単語辞書を参照に、先頭変換文字取得手段が取得した変換文字を先頭に持つ単語を取得することができる。よって、単語の検索処理に係る時間を短縮できる。つまり、入力文字列と表音(読み)情報との比較を行う回数が制限できるので、応答速度の速い文字変換装置を提供することができる。 According to the above configuration, the first conversion character acquisition unit first searches for the conversion character from the first phonogram of the input character string with reference to the conversion character dictionary, and then the word acquisition unit references the word dictionary. In addition, it is possible to acquire a word having the conversion character acquired by the head conversion character acquisition means at the head. Therefore, the time related to the word search process can be shortened. That is, since the number of comparisons between the input character string and the phonetic (reading) information can be limited, a character conversion device with a high response speed can be provided.
ここで、変換文字とは、変換された後の文字を示している。変換文字が漢字であるとすると、表音文字(読み)の先頭文字は次のようになる。例えば、中国語で、「 Here, the conversion character indicates a character after conversion. If the converted character is kanji, the first character of the phonetic character (reading) is as follows. For example, in Chinese,
(以下では「外字1」とする)」の読みを表記すると「meinian」であり、「m」が読みの先頭文字にあたる。また、日本語で、「毎年」の読みを表記すると、「まいとし」なので、先頭文字は「ま」である。(Hereinafter referred to as “
また、先頭変換文字は、例えば「外字1」では、「 For example, in the case of “
(以下では「外字2」とする)」に当たる。変換文字表音情報は、例えば「外字1」では、「meinian」である。(Hereinafter referred to as “
なお、変換文字識別情報は、変換後の文字である変換文字を識別できる情報であればどのようなものでもよく、変換文字そのものであってもよい。例えば、変換文字が漢字である場合、漢字そのものであってもよいし、漢字コードであってもよい。これは、単語識別情報と、先頭変換文字識別情報とについても同様である。 The converted character identification information may be any information as long as it is information that can identify the converted character that is the character after conversion, or may be the converted character itself. For example, when the conversion character is a kanji, it may be a kanji itself or a kanji code. The same applies to the word identification information and the head conversion character identification information.
本発明のさらに他の目的、特徴、および優れた点は、以下に示す記載によって十分わかるであろう。また、本発明の利益は、添付図面を参照した次の説明で明白になるであろう。 Other objects, features, and advantages of the present invention will be fully understood from the following description. The benefits of the present invention will become apparent from the following description with reference to the accompanying drawings.
本発明の一実施形態(実施形態1〜4)について図12〜38に基づいて説明すると以下の通りである。本実施形態では、一例として、入力装置と出力装置とが一体になっているタッチパネルを備えたマルチファンクションプリンタ(複写機)に、本発明の文字変換装置を適用した場合について説明する。しかし、本実施形態で説明する複写機は一例であって、本発明の文字変換装置を、携帯電話、携帯端末、パソコン、リモコンなどに適用することも可能である。 One embodiment (
〔背景技術と問題点〕
従来の文字変換装置において表意文字を得ようとすると、表音文字よりも操作が繁雑になってしまう。表意文字の文字種は膨大な量であり、それらに1つ1つキーを割り当てることなど現実的ではない。さらに、表意文字は同音異義語が多く存在することが一般的であり、複数の表音文字の組み合わせによっても、それに対応する表意文字の候補は膨大な量となる。その結果、膨大な量の候補から適切な表意文字を選び出す作業は、ユーザに多くの手間を強いることになる。[Background technology and problems]
If an attempt is made to obtain an ideogram in a conventional character conversion device, the operation becomes more complicated than a phonetic character. There are an enormous amount of ideographic character types, and it is not realistic to assign keys one by one. Furthermore, it is common for ideograms to have many homonyms, and even when a plurality of phonograms are combined, the number of ideogram candidates corresponding to them is enormous. As a result, the task of selecting an appropriate ideographic character from a huge amount of candidates requires a lot of time and effort for the user.
この問題点は、日本語の文字入力システムに限って生じるものではなく、同様の表意文字入力システムであれば、同様に生じるものである。例えば、中国語はピンインを利用(中国語の特徴である四声は省略)して入力する。漢字を入力するには、次のような手順で行う。入力したい漢字のピンイン表記(アルファベットの文字列)をキーボードから入力し、そのピンインに対応する漢字への変換操作を行って所望の漢字を得る。上記問題点を解決するために、所望の表意文字を得るための表意文字の入力操作を簡素化することが可能な文字変換装置について説明する。 This problem does not occur only in a Japanese character input system, but similarly occurs in a similar ideographic character input system. For example, Chinese characters are input using Pinyin (four voices that are characteristic of Chinese characters are omitted). To enter kanji, follow the steps below. A pinyin notation (alphabet character string) of a kanji to be input is input from the keyboard, and a conversion to a kanji corresponding to the pinyin is performed to obtain a desired kanji. In order to solve the above problem, a character conversion device capable of simplifying an ideographic character input operation for obtaining a desired ideographic character will be described.
また、本実施形態では、ピンイン表記(アルファベット列)から中国語(簡体字)を入力可能な文字変換装置について説明するが、本発明の文字変換装置は中国語に限定されず、種々の表音文字から所望の表意文字を得られるものである。なお、上記ピンイン表記について、中国語には本来、4種の異なる発音を表す四声が存在するが、説明の簡略化のために四声の概念を省略して説明する。 In this embodiment, a character conversion device capable of inputting Chinese (simplified characters) from Pinyin notation (alphabet string) will be described. However, the character conversion device of the present invention is not limited to Chinese, and various phonetic characters are used. From which the desired ideogram can be obtained. Note that although the Pinyin notation originally has four voices representing four different pronunciations in Chinese, the concept of the four voices will be omitted for the sake of simplicity.
〔実施形態1〕
(マルチファンクションプリンタの構成)
図13は、本発明の文字変換装置1を適用したマルチファンクションプリンタの概略構成を示すブロック図である。
(Configuration of multi-function printer)
FIG. 13 is a block diagram showing a schematic configuration of a multifunction printer to which the
マルチファンクションプリンタは、図13に示すとおり、制御部10、操作パネル(タブレット)2、一時記憶部3、記録部40、画像読取ユニット4、画像転写ユニット5、紙送りユニット6を備えている。なお、ここで説明するマルチファンクションプリンタの構成は、本発明を実施するための一例として示すものであって、本発明の範囲を限定するものではない。 As shown in FIG. 13, the multi-function printer includes a
制御部10は、マルチファンクションプリンタを統括制御するものである。制御部10は、記録部40に記録されている各種プログラムを読み出して、複写機としての機能を果たす、画像読取ユニット4、画像転写ユニット5、および、紙送りユニット6などを制御し、複写などの処理を行う。また、本発明に係る文字入力処理を行うための各部もこの制御部10に含まれている。 The
記録部40は、操作パネル2、複写機として動作するための上述の各種ユニットの制御プログラム、および、文字変換装置1の制御プログラムを記録するものであり、ROM(read only memory)などの不揮発性記憶素子で実現される。 The
一時記憶部3は、プログラムを処理するための作業領域、読取画像の一時記憶に利用されるほか、本実施形態では、文字入力処理時の学習文字(列)などの一時記憶に利用される。RAM(random access memory)などの揮発性メモリで実現される。 The
操作パネル2は、ユーザがマルチファンクションプリンタに対して各種処理の実行を指示するためのものである。例えば、表示装置と入力装置とが一体に形成されたタッチパネルや、表示一体型タブレットで実現される。さらに、表示一体型タブレットを用いて筆記された文字を認識する手書き文字認識機能を備えていてもよい。また、ユーザが表示一体型タブレットの指示した位置に基づいて、その指示された文字、文字列、その他機能キーなどの情報を検出する機能を備えている。 The
ユーザは、操作パネル2に表示された、アルファベット(表音文字)に対応する各キーにペンや指などで軽く触れることにより、所望のアルファベットをマルチファンクションプリンタに入力することが可能となる。 The user can input a desired alphabet into the multifunction printer by lightly touching each key displayed on the
あるいは、上記マルチファンクションプリンタは、操作パネル2に加えて、キーボード(第1入力部/第3入力部)7(例えば、PCで使用する汎用キーボード)を備えていてもよい。この場合、操作パネル2の表示されるキー、および、キーボード7のキーのいずれを用いてもアルファベットを入力することが可能となる。表音文字を入力するためのキーを備えた入力部(第1入力部)を、操作パネル2およびキーボード7の両方で同時に実現することもできるし、キーボード7のみで実現することもできる。あるいは、表音文字の入力を操作パネル2で行うか、キーボード7で行うかを切り替えられる構成としてもよい。 Alternatively, the multifunction printer may include a keyboard (first input unit / third input unit) 7 (for example, a general-purpose keyboard used in a PC) in addition to the
以下、上記文字入力処理を行う本発明の文字変換装置1について、さらに詳細に説明する。 Hereinafter, the
(文字変換装置の構成)
図12は、本実施形態に係る文字変換装置1の要部構成を示すブロック図である。文字変換装置1は、図12に示すとおり、操作パネル2、制御部10、記録部40、および、一時記憶部3を備えた構成となっている。(Configuration of character conversion device)
FIG. 12 is a block diagram illustrating a main configuration of the
操作パネル2は、上述したように、表示装置と入力装置とが一体に形成されたタッチパネルで実現されている。 As described above, the
表示部12は、ユーザに各種情報を提供するものである。図14は、操作パネル2に表示される文字入力処理時の操作画面の一例を示す図である。図14に示すとおり、表示部12には、ユーザが文字を入力するためのキーボードを表示する文字入力領域121、入力の候補として挙げられている文字(または、文字列)を表示する候補文字(列)表示領域122、および、すでに入力が完了し確定している入力確定文字を表示する確定文字(列)表示領域123が表示されている。入力部11は、ユーザが中国語発音表記のピンイン(表音文字列/表音情報)を入力するためのものであり、文字入力領域121に表示されたアルファベットのキーがユーザにより押下されると、パネル上のその押下位置に対応するアルファベットの信号が、文字変換装置1の入出力制御部20に入力される。また、入力部11は、ユーザが入力を確定させたい文字を選択するためのものでもある。候補文字表示領域122に表示されている漢字(表意文字/変換文字)が押下されると、その押下位置に表示されている漢字の信号が、入出力制御部20に入力され、該漢字の入力が確定する。 The
制御部10は、入出力制御部20および文字入力制御部30を制御するものである。入出力制御部20は、操作パネル2と制御部10との間でやりとりされる信号の入出力を制御するものであり、入力受付部21、表示制御部(表示制御手段)22、および、候補選択受付部23を含んでいる。文字入力制御部30は、文字入力処理を実行するものであり、候補抽出部(文字候補抽出手段/文字列候補抽出手段)31、候補順序決定部(候補順序決定手段)32、および、文字確定部(文字入力確定手段)33を含んでいる。なお、制御部10内の各部は、コンピュータの中央演算装置(CPU)およびCPUによって実行されるソフトウェアにより実現される。このソフトウェアも、上述の記録部40に格納され、一時記憶部3に読み出されてCPUにより実行される。 The
入出力制御部20の入力受付部21は、入力部11から入力された文字(アルファベットなど)の信号を受け付けて、候補抽出部31に供給するものである。表示制御部22は、表示部12の文字入力領域121、候補文字表示領域122、および、確定文字表示領域123の各々に表示すべき情報が表示されるよう表示部12を制御するものである。候補選択受付部23は、入力部11から入力された、候補文字表示領域122内の選択された候補漢字の信号、および、該選択された候補漢字の入力を確定する指示信号を受け付けて、文字確定部33に供給するものである。 The
文字入力制御部30の候補抽出部31は、入力された文字に基づいて、候補となる漢字(または)単語を記録部40に記憶されている各辞書部から取得するものである。本実施形態では、候補抽出部31は、入力されたアルファベット(列)に基づいて、候補となる漢字を記録部40の漢字辞書部(文字記録部)41から抽出する。 The
より詳細には、まず、入力されたアルファベット(列)に対応するピンインを特定して、特定した各ピンインに対応する漢字を、候補漢字として抽出する。候補抽出部31は、抽出した候補漢字を、内部バッファ(不図示)に記憶し、候補順序決定部32および表示制御部22に候補漢字の表示を指示する。 More specifically, first, pinyin corresponding to the input alphabet (column) is specified, and kanji corresponding to each specified pinyin is extracted as candidate kanji. The
候補抽出部31が参照する漢字辞書部41には、アルファベット(列)−ピンイン−漢字が対応付けて記録されている。漢字辞書部41の詳細は後述する。 In the Chinese
候補順序決定部32は、候補抽出部31が抽出した候補漢字の表示順序を、所定の条件に基づいて決定するものである。表示順序とは、図14に示すように、候補文字表示領域122に候補漢字を表示する順序のことである。抽出されたすべての候補漢字が候補文字表示領域122内に一度に表示できる場合、順序が上の候補漢字ほど、候補文字表示領域122の上部に表示されるようにし、ユーザが選択しやすいようにすればよい。また、候補漢字が一度に表示できる数を上回る場合は、下位に続く順序の候補漢字を表示するようページを切り換えるようにしてもよい。この場合でも、順序が上の候補漢字ほど初めのページに表示されるようにして、上位の候補漢字ほどユーザに選ばれやすいようにしておく。したがって、候補順序決定部32は、抽出された候補漢字を、所定の条件に基づいてユーザに選択されやすいものから順に表示されるよう順序を決定する。どのような条件に基づいて候補漢字の順序を決定するのかについては後に詳しく説明する。 The candidate
文字確定部33は、入力部11より入力されたユーザが選択した候補漢字の信号、および、該選択された候補漢字の入力を確定する指示信号を、候補選択受付部23より受け取り、ユーザにより選択された上記候補漢字の入力を確定させるものである。まず、選択された候補漢字は、確定前の選択されている状態を示す下線とともに、確定文字表示領域123に表示させる。さらに、入力確定の指示信号に応じて文字確定部33が確定した候補漢字は、入力確定文字として下線が付されない状態で、表示制御部22を介して確定文字表示領域123に表示される。 The
(漢字辞書)
次に、漢字辞書部41に記録される漢字辞書について説明する。図15は、候補抽出部31が候補漢字を抽出するときに参照する、漢字辞書部41に記録されている漢字辞書の例を示す図である。(Kanji dictionary)
Next, the kanji dictionary recorded in the
図15に示すとおり、本実施形態における漢字辞書140は、入力受付部21が受け付けたアルファベット(列)とピンインとの対応付けを記録した、アルファベット−ピンイン対応表(A/P対応表141)、および、ピンインと漢字との対応付けを記録した、ピンイン−漢字対応表(P/C対応表142)とを含んでいる。これにより、入力されたアルファベット(列)に対応する候補漢字を直接抽出することが可能となる。 As shown in FIG. 15, the
具体的には、例えば、ユーザが「外字2」(ピンインは「mei」)という漢字を入力したいために、入力部11を用いて、まず「m」のキーを押下したとする。入力受付部21より「m」の信号が供給されると、候補抽出部31は、まず、漢字辞書140のA/P対応表141から、「m」と前方一致するピンイン(図15の例では、「ma」と「mei」)を特定し、該ピンインに対応する漢字が記録されている、P/C対応表142のアドレスを検出する(「cp_ml」と「cp_mi」)。 Specifically, for example, it is assumed that the user first presses the “m” key using the
続いて、P/C対応表142の「cp_ml」と「cp_mi」とに基づいて、候補抽出部31は、「m」と前方一致のピンインに対応する漢字( Subsequently, based on “cp_ml” and “cp_mi” in the P / C correspondence table 142, the
、麻、没、・・・「外字2」、、 Hemp 、 December ... "
・・・)を抽出する。抽出された漢字は、上述したとおり、候補漢字として候補順序決定部32に供給される。ここで、ユーザによりさらに「mei」と入力された場合には、候補抽出部31は、「mei」と前方一致する漢字に絞り込んで、漢字辞書部41から候補漢字を抽出する。...) is extracted. The extracted Chinese characters are supplied to the candidate
上記構成によれば、候補抽出部31は、ユーザが入力したアルファベットを受け付けて、そのアルファベットを含む、ピンインを特定する。候補抽出部31は、特定したピンインに基づいて、ユーザが入力したいと所望する漢字の候補を漢字辞書部41から抽出することができる。 According to the above configuration, the
候補順序決定部32は、上記候補抽出部31が抽出した漢字の候補を所定の条件に基づいて並べ替え、候補の表示順序を決定する。表示制御部22は、漢字の候補が、上記候補順序決定部32が決定した表示順序で表示されるよう表示部12を制御する。 The candidate
最後に、ユーザが表示された入力したい候補漢字の中から、所望の漢字を指定すると、文字確定部33は、指定された漢字の入力を確定させる。 Finally, when a desired Chinese character is designated from the displayed candidate Chinese characters to be input, the
これにより、所望の漢字を得るための入力操作を簡素化することが可能となる。 Thereby, it becomes possible to simplify input operation for obtaining a desired kanji.
また、候補抽出部31が抽出する候補となる漢字は、ユーザのアルファベット入力操作により、外部記憶装置(図示せず)への記憶および外部記憶装置からの読込みが行えるようになっていてもよく、読み込まれた漢字を、候補を表示する際に利用するようにしてもよい。 In addition, the kanji characters that are candidates for extraction by the
(変形例1−候補単語の出力)
さらに、本発明の文字変換装置1は、某漢字が入力確定文字として選択されたのち、該漢字から始まる1つの意味を持つ1以上の漢字からなる漢字列(以下、単語(表意文字列)と称する)を候補単語として、候補文字表示領域122(図14)に表示することが好ましい。これにより、ユーザは、上記某漢字とともに単語を形成し得る漢字を候補文字表示領域122において得ることができるので、続く漢字のピンインを別途入力しなくても、所望の漢字を得ることが可能となる。したがって、所望の漢字を得るための入力操作を簡素化することが可能となる。(
Furthermore, the
図16は、候補単語を出力する文字変換装置1の要部構成を示すブロック図である。なお、図16の各構成要素に付された符号は、図12の各構成要素に付された符号に対応しており、同じ符号は、同じ構成要素を示している。したがって、上述の各実施形態ですでに説明した構成要素についての説明は繰り返さない。図16に示す文字変換装置1において、図12と異なる点は、文字確定部33から候補抽出部31に制御信号が伝達される点と、記録部40に単語辞書部(文字列記録部)42が含まれている点である。 FIG. 16 is a block diagram illustrating a main configuration of the
文字確定部33は、ユーザにより選択された漢字(または、入力確定文字)が候補選択受付部23を介して入力されると、続いて、候補抽出部31に対して、当該選択されたから始まる単語を抽出する指示を送る。 When the Chinese character (or input confirmed character) selected by the user is input via the candidate
候補抽出部31は、上記の指示に基づいて、上記選択された漢字から始まる単語を、候補単語として単語辞書部42から抽出する。図17は、操作パネル2の表示部12に表示される候補単語の例を示す図である。図17に示す例では、漢字「外字2」が選択されているときに、「外字2」から始まる単語が、候補単語として表示部12の候補文字表示領域122に表示されている。 The
候補抽出部31が参照する単語辞書部42には、漢字−単語が対応付けて記録されている。図18は、単語辞書部42が記録する単語辞書の例を示す図である。図18に示すとおり、本実施形態における単語辞書は、漢字辞書部41に記録されている漢字と、該漢字から始まる単語との対応付けを記録した、漢字−単語対応表(C/I対応表143)を含んでいる。これにより、選択された漢字に対応する候補単語をさらに抽出することが可能となる。 In the
具体的には、例えば、ユーザにより、漢字「外字2」が選択されると、候補抽出部31は、P/C対応表142(図15)の「外字2」のアドレスを検出する(「wp_mi+j」)。続いて、単語辞書部42を参照し、アドレス「wp_mi+j」に基づいて、「外字2」から始まる単語(「外字2」月、「外字2」天・・・)を抽出する。抽出された単語は、上述の構成と同様に、候補単語として候補順序決定部32に供給され、候補文字表示領域122に表示される(図17)。 Specifically, for example, when the user selects the Chinese character “
ある漢字が入力されると、その漢字の次に続く文字(ユーザが所望する漢字)は、何の脈絡もない漢字よりも、その漢字から始まる単語を構成する漢字である可能性が高い。したがって、入力が確定された漢字から始まる単語を候補として表示すれば、ユーザは、その単語の候補の中から所望の単語を選択するのみで、別途ピンインを入力することなく、中国語を入力することが可能となる。これにより、ユーザは、ピンインの入力に係る操作数について、さらに少ない操作数で、所望の漢字の入力を得ることが可能となる。 When a certain Chinese character is input, the character that follows the Chinese character (the Chinese character desired by the user) is more likely to be a Chinese character that constitutes a word starting from the Chinese character than an unrelated kanji. Therefore, if a word starting from a kanji that has been confirmed to be input is displayed as a candidate, the user can select the desired word from the word candidates and input Chinese without inputting pinyin separately. It becomes possible. Thus, the user can obtain a desired kanji input with a smaller number of operations related to the pinyin input.
(フローチャート)
次に、本発明の文字変換装置1(図16)の処理の流れを、図19に示すフローチャートと、図20に示す操作パネル2上の候補文字表示領域122および確定文字表示領域123の表示例に基づき説明する。以下では、ユーザが、「「外字2」天到郊外散歩」を入力しようとした場合について説明する。(flowchart)
Next, the flow of processing of the character conversion device 1 (FIG. 16) of the present invention is shown in the flowchart shown in FIG. 19 and display examples of the candidate
ユーザが操作パネル2の入力部11からアルファベット(漢字「外字2」(mei)のピンインの先頭アルファベット「m」)を入力すると(S201のYES)、入力受付部21は、入力されたアルファベット「m」の信号を、候補抽出部31に供給する。次に、候補抽出部31は、入力されたアルファベットに対応するピンインを特定し、特定したピンインに対応する漢字を、候補漢字として漢字辞書部41から抽出する(S202)。 When the user inputs an alphabet (the first alphabet “m” of Pinyin of the Chinese character “
候補順序決定部32は、所定の条件に基づいて上記抽出された候補漢字の表示順序を決定する(詳細は後述)(S203)。続いて、表示制御部22は、候補順序決定部32が決定した表示順序でn個の候補漢字を表示するよう表示位置を定め、上記候補漢字を表示部12に出力し、ユーザに提示する(S204)。図20の(a)に、n=5として、漢字候補を5個づつ表示する場合の表示例を示す。 The candidate
ここで、ユーザにより、1度目に候補文字表示領域122に表示された漢字以外の次候補漢字を表示する指示(図20の(a)に所望の漢字「外字2」がないので、例えば、「次候補表示」のボタンを押すなどする)が入力されると(S205のNO、S206のYES)、S204に戻り、表示制御部22は、次の候補漢字のリストを表示する(図20の(b))。さらに、次候補漢字の表示指示も、候補漢字の選択指示も入力されず(S205、S206においてNO)、新たにアルファベットが入力された場合には、S202に戻り、候補抽出部31は、これまでに入力されたアルファベット列に対応するピンインをさらに絞り込んで特定し、特定したピンインに対応する漢字を、候補漢字として抽出する。 Here, the user does not have an instruction to display the next candidate kanji other than the kanji displayed in the candidate
一方、ユーザが、入力部11を介して、候補文字表示領域122に表示された所望の漢字「外字2」(図20の(b)の“3011”)を選択すると(S205のYES)、候補選択受付部23は、選択された候補漢字「外字2」の信号を受け付けて、文字確定部33に供給する。 On the other hand, when the user selects a desired Chinese character “
文字確定部33は、選択された「外字2」を表示するよう表示制御部22に指示するとともに、候補抽出部31に対して、次に「外字2」から始まる単語を抽出するよう指示する。候補抽出部31は、続いて、「外字2」から始まる単語を候補単語として単語辞書部42から抽出する(S207)(図20の(c))。 The
候補順序決定部32は、所定の条件に基づいて上記抽出された候補単語の表示順序を決定する(詳細は後述)(S208)。続いて、表示制御部22は、候補順序決定部32が決定した表示順序にて上記候補単語を表示部12に出力し、ユーザに提示する(S209)。 The candidate
ここで、ユーザにより、次候補単語を表示する指示が入力されると(S210のNO、S211のYES)、S209に戻り、表示制御部22は、次の候補単語のリストを表示する。さらに、次候補単語の表示指示も、候補単語の選択指示も入力されず(S210、S211においてNO)、新たにアルファベットが入力された場合には、S202に戻り、候補抽出部31は、これまでに入力されたアルファベットに対応するピンインを特定し、特定したピンインに対応する漢字を、候補漢字として抽出する。 Here, when an instruction to display the next candidate word is input by the user (NO in S210, YES in S211), the process returns to S209, and the
一方、ユーザが、入力部11を介して、候補文字表示領域122に表示された所望の単語「「外字2」天」(図20の(c)の“020”)を選択すると(S210のYES)、候補選択受付部23は、選択された候補単語「「外字2」天」の信号を受け付けて、文字確定部33に供給する。 On the other hand, when the user selects the desired word ““
文字確定部33は、選択された候補単語を表示するよう表示制御部22に指示し、表示制御部22は、選択された候補単語を表示部12に表示する(S212)(図20の(d))。同時に、候補抽出部31に対して、次に該候補単語から始まる単語を抽出するよう指示する。文字の入力を終了する指示が入力されなければ(S213のNO)、候補抽出部31は、S207に戻り、上記選択された候補単語から始まる単語を候補単語として単語辞書部42から抽出する。 The
ユーザの次の所望の漢字「到」が候補漢字として表示されない場合、ユーザは、「到」(dao)の先頭ピンイン「d」を入力することができる(S211のNO、S201のYES)(図20の(e))。以降同様の処理を繰り返し、所望の漢字を入力することが可能となる。 When the user's next desired Chinese character “To” is not displayed as a candidate Chinese character, the user can input the first Pinyin “d” of “To” (dao) (NO in S211, YES in S201) (FIG. 20 (e)). Thereafter, it is possible to input a desired kanji by repeating the same processing.
選択された候補単語が選択されたのち(「散歩」まで入力が確定されたのち)、文字の入力を終了する指示が入力されれば(S213のYES)、処理を終了する。 After the selected candidate word is selected (after input is confirmed until “walk”), if an instruction to end character input is input (YES in S213), the process ends.
(変形例2−学習機能)
さらに、本発明の文字変換装置1は、ユーザの選択により入力が確定された漢字(単語)を記録する構成を備えていることが好ましい。これにより、文字変換装置1は、過去に入力した漢字、つまり、ユーザが使用したことのある漢字の記録に基づいて、候補漢字を表示することができる。過去に使用された漢字は、ユーザによって再度使用される可能性は大きい。したがって、そのような使用履歴が反映された候補漢字の一覧を用いることにより、ユーザは少ない操作数で所望の漢字を得ることが可能となる。(Modification 2-Learning function)
Furthermore, it is preferable that the
図21は、学習機能を備えた文字変換装置1の要部構成を示すブロック図である。なお、図21の各構成要素に付された符号は、図12の各構成要素に付された符号に対応しており、同じ符号は、同じ構成要素を示している。したがって、上述の各実施形態ですでに説明した構成要素についての説明は繰り返さない。図21に示す文字変換装置1において、図12と異なる点は、文字入力制御部30が、さらに、学習制御部(学習制御手段)34を有している点と、記録部40に学習辞書記録部(学習語記録部)43およびペア学習辞書記録部(学習語記録部)44が含まれている点である。 FIG. 21 is a block diagram showing a main configuration of the
学習制御部34は、ユーザの指示により、文字変換装置1に入力(使用)された漢字の記録(学習)を制御するものである。具体的には、ユーザにより使用された漢字を学習漢字として、学習辞書記録部43に格納したり(以下、単独学習(機能)と称す)、または、ユーザにより使用された漢字を、直前に入力されている漢字と関連付けてペア学習辞書記録部44に格納したり(以下、ペア学習(機能)と称す)する。ユーザにより過去に入力されたことのある漢字は、ユーザによって再度使用される可能性が大きいので、そのような学習漢字を候補漢字として利用することにより、ユーザがより少ない操作数で所望の漢字を得る確率が高まる。 The
学習辞書記録部43は、ユーザにより過去に使用された漢字(入力確定文字)を単独学習漢字として記録するものである。学習辞書記録部43に記録される学習辞書には、その単独学習漢字が記録された日時の情報や、使用頻度の情報(過去に何回使用されたか、所定期間内に何回使用されたかなど)が、漢字ごとに対応付けて記録されていてもよい。 The learning
学習制御部34は、文字確定部33から、ユーザにより選択された候補漢字の信号を受け取ると、一時記憶部3に該選択された候補漢字を書き込む。学習制御部34は、文字確定部33が確定指示信号に応じて入力を確定させたとき、文字確定部33より当該入力確定文字の単独学習処理の指示を受け付ける。学習制御部34は、一時記憶部3から、上記候補漢字を内部バッファに読み出し、一時記憶部3から読み出された候補漢字の削除および内容の更新を行う。そして、内部バッファに記憶した候補漢字を単独学習漢字として学習辞書記録部43に記憶する。 When the
ペア学習辞書記録部44は、ユーザにより過去に使用された漢字を、当該漢字がどの漢字に続いて確定されたのかを示す情報(直前漢字)と関連付けて、ペア学習漢字として記録するものである。直前漢字は、すでに学習辞書記録部43において単独学習漢字として記録されている。ペア学習辞書記録部44に記録される学習辞書には、そのペア学習漢字ごとに、上記直前漢字が関連付けて記録される。この漢字のペアごとに、記録された日時の情報や、使用頻度の情報を対応付けて記録してもよい。 The pair learning
学習制御部34は、文字確定部33より入力確定文字のペア学習処理の指示を受け付ける。学習制御部34は、一時記憶部3から、上記入力確定文字と、その直前漢字とを内部バッファに読み出し、一時記憶部3から読み出された文字列の削除および内容の更新を行う。そして、内部バッファに記憶した入力確定文字を直前漢字と関連付けて、ペア学習漢字としてペア学習辞書記録部44に記憶する。 The
なお、上記では、学習辞書記録部43およびペア学習辞書記録部44において、各学習辞書が漢字ごとに記録される構成について説明したが、これに限定されない。上記構成に加えて、単語を辞書に記録する構成としてもよい。すなわち、学習制御部34の単独学習機能により、使用された単語が、学習辞書記録部43に記録されるようにしてもよい。例えば、「給水」という単語が使用された場合、「給」という漢字に加え、「給水」という単語が、単独学習漢字(単語)として学習辞書記録部43に記録される。 In the above description, the learning
また、学習制御部34のペア学習機能によれば、「大学」「教授」という単語が続けて入力された場合、漢字「教」を、「学」および/または「大学」の直前漢字(単語)と関連付けて、ペア学習漢字として記録することもできる。さらに、単語「教授」を、「学」および/または「大学」の直前漢字(単語)と関連付けて、ペア学習単語として記録することもできる。 Further, according to the pair learning function of the
(候補順序決定要素)
次に、文字変換装置1の候補順序決定部32(図12、16、21)が候補(候補漢字/候補単語)の表示順序を決定するための所定の条件(以下、候補順序決定要素と称する)について説明する。(Candidate order determining element)
Next, a predetermined condition (hereinafter referred to as a candidate order determination element) for the candidate order determination unit 32 (FIGS. 12, 16, and 21) of the
上述したとおり、操作パネル2に設けられた表示部12において、一度により多くの候補を表示できる方が、ユーザがより早く所望の漢字を得る可能性が高くなるというメリットがある。しかも、操作パネル2をタッチパネルなどの表示/入力一体型の入出力デバイスで実現した場合、ユーザが所望の漢字を得るための操作数を格段に減らすことが可能である。しかし、一方で、多くの候補を大きな表示画面に一覧表示しても、その中から所望の候補を探す負担が逆に大きくなるという問題が生じる。そこで、限られた表示領域に限られた数の候補を表示する際、ユーザが所望する(選択する)可能性の大きい漢字(単語)から順に表示されることが望まれる。 As described above, in the
本発明では、ユーザの嗜好に合致した、より精度の高い表示順序で候補が表示されるよう、表示する候補の順序を決定する。これにより、所望の漢字を得るための入力操作を簡素化することが可能な文字変換装置を実現することができる。 In the present invention, the order of candidates to be displayed is determined so that the candidates are displayed in a more accurate display order that matches the user's preference. Thereby, the character conversion apparatus which can simplify input operation for obtaining a desired Chinese character is realizable.
以下では、候補単語の表示順序を決定する方法について説明するが、候補漢字/候補単語のいずれの表示順序も同じ方法にて決定される。 In the following, a method of determining the display order of candidate words will be described. However, the display order of any candidate kanji / candidate word is determined by the same method.
本実施形態では、候補順序決定部32は、以下の7つの候補順序決定要素に基づいて、候補の表示順序を決定する。 In this embodiment, the candidate
(要素A)出現頻度
出現頻度とは、ある言語の文字(列)において、どの程度出現するのかの指標となる情報である。出現頻度が高ければ高いほど、その言語使用環境下においてよく使用されているということになるので、出現頻度の高い候補ほど表示順序を上位にする。出現頻度は、既知の統計データを用いた固定的な情報を用いればよい。(Element A) Appearance Frequency Appearance frequency is information that serves as an index of how often a character (string) in a language appears. The higher the appearance frequency, the more frequently it is used in the language usage environment. Therefore, the higher the appearance frequency, the higher the display order. The appearance frequency may be fixed information using known statistical data.
(要素B)ピンイン長の一致/不一致
入力されたアルファベット(列)の文字数と、対応する候補のピンインの文字数が一致するか否かに基づいて表示順序を決定する。ピンイン長が、入力されたピンイン文字数と一致する候補の表示順序を上位にする。(Element B) Pinyin length match / mismatch The display order is determined based on whether the number of characters in the input alphabet (column) matches the number of characters in the corresponding candidate Pinyin. The display order of candidates whose pinyin length matches the number of input pinyin characters is made higher.
(要素C)直前文字列との連続性
その時点までにすでに入力が確定している入力確定文字および/または現時点で選択中の文字(列)の直後に続く可能性(直前文字列との連続性)の大きい候補ほど表示順序を上位にする。あるいは、過去の入力履歴より、上記直前文字列に連続して入力されたことの有無を判定して、連続して入力された履歴が残っている候補の表示順序を上位にする。(Element C) Continuity with the immediately preceding character string Possibility of continuing immediately after the input confirmed character and / or the currently selected character (string) at the current time (continuation with the immediately preceding character string) The higher the candidate), the higher the display order. Alternatively, from the past input history, the presence / absence of continuous input to the immediately preceding character string is determined, and the display order of candidates in which the history input continuously remains remains higher.
(要素D)前方文字列との関連性
その時点までにすでに入力が確定している入力確定文字(列)に関連し、当該文字(列)の後方に入力される可能性(前方文字列との関連性)の大きい候補ほど表示順序を上位にする。(Element D) Relevance to the forward character string There is a possibility that an input is confirmed after the character (string) in relation to the input confirmed character (string) that has already been confirmed by that time (the forward character string and The display order is set higher in the candidate with the greater relevance).
(要素E)単独学習漢字/単語
学習辞書記録部43に記録されている単独学習漢字(単語)であるか否かによって、表示順序を決定する。過去に入力(使用)されたことのある漢字(単語)であれば、再び、使用される可能性は大きい。したがって、単独学習漢字(単語)として記録されている候補の表示順序を上位にする。(Element E) Single learning kanji / word The display order is determined depending on whether or not it is a single learning kanji (word) recorded in the learning
(要素F)ペア学習漢字/単語
ペア学習辞書記録部44に記録されているペア学習漢字(単語)であるか否かによって、表示順序を決定する。過去に入力(使用)されたことのある漢字(単語)の組み合わせであれば、再び、その組み合わせで使用される可能性は大きい。したがって、ペア学習漢字(単語)として記録されている候補の表示順序を上位にする。(Element F) Pair learning kanji / word The display order is determined depending on whether or not the pair learning kanji (word) is recorded in the pair learning
(要素G)学習時期
候補漢字(単語)に一致する学習漢字(単語)が、学習辞書記録部43および/またはペア学習辞書記録部44に記録された時期に基づいて表示順序を決定する。記録された時期が新しいものほど、ユーザにより選択される可能性が大きいので、最近記録された漢字(単語)の候補ほど表示順序を上位にする。(Element G) Learning Time The display order is determined based on the time when the learning kanji (word) matching the candidate kanji (word) is recorded in the learning
以上の各要素を条件にすることにより、ユーザに選択される可能性の大きい候補ほど、優先して候補文字表示領域122(図14)に表示させることができるので、ユーザは、少ないキー操作数で、所望の漢字を得ることが可能となる。 By setting each of the above elements as a condition, a candidate that is more likely to be selected by the user can be preferentially displayed in the candidate character display area 122 (FIG. 14). Thus, it becomes possible to obtain a desired kanji.
上述したとおり、候補順序決定要素とは、候補順序決定部32が、候補漢字/候補単語の表示順序を決定するために必要な情報である。より具体的には、候補順序決定部32が、候補漢字/候補単語がユーザに選択される可能性の大きさを示す評価値を算出するために使用する情報である。候補(候補漢字/候補単語)ごとに候補順序決定要素の情報が対応づけられて記録部40の各(記録)部に記憶されており、候補順序決定部32は、記録部40の各部を参照して、候補ごとに候補順序決定要素を特定することが可能となる。さらに、記録部40には、候補順序決定部32が特定した候補順序決定要素からどのようにして上記評価値を算出するのかを規定した評価値算出ルールが記憶されていてもよい。これにより、候補順序決定部32は、特定した候補順序決定要素と評価値算出ルールとにしたがって、候補ごとに評価値を求め、候補の表示順序を決定することが可能となる。候補順序決定部32の評価値算出方法は、後述する。 As described above, the candidate order determination element is information necessary for the candidate
(候補順序決定部の構成)
図22は、候補順序決定部32のさらに詳細な構成を示すブロック図である。候補順序決定部32は、学習漢字判定部131、ピンイン長判定部132、連結度判定部133、出現頻度判定部134、および、学習時期判定部135を備えている。記録部40(図12、16、21)は、上述の各記憶部に加えて、出現頻度記録部45および連結度記録部(関連度記録部)46を含んでいる。一時記憶部3は、内部に、抽出候補一時記憶部51、評価値一時記憶部52、および、表示順序一時記憶部53を含んでいる。(Configuration of candidate order determination unit)
FIG. 22 is a block diagram showing a more detailed configuration of the candidate
一時記憶部3内の抽出候補一時記憶部51は、候補抽出部31が抽出した候補(以下、抽出候補と称する)としての漢字および/または単語を一時的に保持するものである。候補順序決定部32は、抽出候補一時記憶部51から抽出候補を読み出して、各抽出候補の表示順序を決定する処理を行う。 The extraction candidate
評価値一時記憶部52は、候補順序決定要素と評価値算出ルールとに基づいて算出された、上記各抽出候補に付与される評価値を一時的に保持するものである。表示順序は、最終的に算出された評価値を基に決定されてもよい。 The evaluation value
表示順序一時記憶部53は、上記各抽出候補に対して決定された表示順序の情報を一時的に保持するものである。候補順序決定部32は、決定した表示順序を表示順序一時記憶部53に格納する。表示順序一時記憶部53の表示順序の情報は、抽出候補を表示部12に表示する際に表示制御部22によって参照される。 The display order
候補順序決定部32の学習漢字判定部131は、抽出候補が、学習漢字(単語)であるか否か、および、それが単独学習であるかペア学習であるかを判定するものである。具体的には、抽出された候補と一致する漢字(単語)が学習辞書記録部43内に記録されている場合は、単独学習漢字(単語)であると判定し、ペア学習辞書記録部44内に記録されている場合は、ペア漢字(単語)であると判定する。学習漢字判定部131は、判定結果を評価値一時記憶部52の評価値または表示順序一時記憶部53の表示順序に反映させる。これにより、要素Eおよび/または要素Fに基づく表示順序を決定することができる。 The learning
ピンイン長判定部132は、入力受付部21(図12、16、21)に入力されたアルファベット(列)の文字数と、対応する候補のピンインの文字数が一致するか否かを判定するものである。例えば、漢字「「外字2」(ピンイン:mei)」を得るために、「me」まで入力していたとする。この時点では、入力文字数は2で、対応する候補漢字「「外字2」(mei)」のピンイン長は3であるため、ピンイン長判定部132は、ピンイン長不一致と判定する。一方、ユーザによって「mei」まで入力された時点では、ピンイン長が一致すると判定し、候補漢字「「外字2」」の表示順序を上がるよう、評価値一時記憶部52の評価値または表示順序一時記憶部53の表示順序を変更する。これにより、要素Bに基づく表示順序を決定することができる。 The pinyin
連結度判定部133は、その時点までにすでに入力が確定している入力確定文字および/または現時点で選択中の文字(漢字/単語)とのつながり具合、つまり、連結度に応じて次にユーザが所望する文字を予測して候補に挙げる判定を行うものである。連結度判定部133は、連結度記録部46に記録されている連結度テーブル150を参照して、確定あるいは選択された前方文字列および/または直前文字列との連結度を判定する。前方文字列および/または直前文字列との連結度が高いものほど、ユーザが所望する文字である確率が高いとして、その表示順序を上位にする。これにより、要素Cおよび/または要素Dに基づく表示順序を決定することができる。連結度記録部46の連結度テーブル150および連結度判定部133の詳細については後述する。 The connection
出現頻度判定部134は、出現頻度記録部45に記録される、既知の統計データに基づいて、候補漢字(単語)が出現する(使用される)頻度を判定するものである。出現頻度が高いものほど、その文字がよく使用されていることになるので、ユーザにより選択される可能性も大きい。したがって、出現頻度の高い候補ほど表示順序を上位にする。これにより、要素Aに基づく表示順序を決定することができる。 The appearance
学習時期判定部135は、候補漢字(単語)に一致する学習漢字(単語)が、学習辞書記録部43および/またはペア学習辞書記録部44に記録された時期を判定するものである。学習漢字(単語)が記録された時期が新しいものほど、ユーザにより選択される可能性も大きい。したがって、学習時期が最近の漢字(単語)ほど上位になるよう候補の表示順序を決定する。これにより、要素Gに基づく表示順序を決定することができる。 The learning
上記構成によれば、候補順序決定部32は、上述のさまざまな条件に基づいて、候補の表示順序を決定することができる。 According to the above configuration, the candidate
これにより、ユーザの希望をより正確に反映した表示順序で候補を表示することが可能となり、結果として、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。 This makes it possible to display candidates in a display order that more accurately reflects the user's wishes. As a result, the number of operations related to the input of phonograms can be input with a smaller number of operations. Can be obtained.
(連結度の判定)
次に、連結度判定部133の動作について、さらに詳細に説明する。(Determining connectivity)
Next, the operation of the
図23は、連結度記録部46に記録される、漢字(単語)ごとの直前(前方)文字列との連結度を示した連結度テーブル150の例を示す図である。図23に示すとおり、連結度テーブル150は、漢字(単語)ごとに格納されている直前文字列との連続性情報のアドレスおよび前方文字列との関連性情報のアドレスを検出するための連結度対応表151と、漢字(単語)ごとに直前文字列との連続性を格納する連続性テーブル152と、漢字(単語)ごとに前方文字列との関連性を格納する前方関連性テーブル153とを含んでいる。 FIG. 23 is a diagram showing an example of the connectivity table 150 showing the connectivity with the immediately preceding (front) character string for each Chinese character (word) recorded in the
例えば、「交通」という単語がユーザにより選択されると、連結度判定部133は、直前文字列としての「交通」のあとに連続する確率が高い漢字(単語)を連結度テーブル150から検索する。連結度判定部133は、連結度対応表151を参照し、直前文字列「交通」との連続性情報が、連続性テーブル152のアドレス「npi+l」に格納されていることを検知する。 For example, when the word “traffic” is selected by the user, the
次に、連結度判定部133は、連続性テーブル152のアドレス「npi+l」を参照し、「規則(連続性21)」、「大学(16)」、「工具(15)」・・・の順に、連続性が高いことを検出する。最後に、上述の各候補単語の表示順序を、「規則」「大学」「工具」・・・の順にすることを決定する。 Next, the
また、単語「上海」の入力が確定されたのちに、「交通」が選択されると、連結度判定部133は、前方文字列としての「上海」の後ろに関連して入力される確率が高い漢字(単語)を連結度テーブル150から検索する。連結度判定部133は、連結度対応表151を参照し、前方文字列「上海」との関連性情報が、前方関連性テーブル153のアドレス「ppi+s」に格納されていることを検知する。 Further, when “traffic” is selected after the input of the word “Shanghai” is confirmed, the
次に、連結度判定部133は、前方関連性テーブル153のアドレス「ppi+s」を参照し、「大学(関連性10)」、「規則(5)」、「警察(3)」・・・の順に、関連性が高いことを検出する。最後に、上述の各候補単語の表示順序を、「大学」「規則」「警察」・・・の順にすることを決定する。 Next, the
これにより、ユーザがよく入力する単語の並びにしたがって、候補漢字(単語)の表示順序を決定することができるので、ユーザの嗜好を反映した表示順序でもって候補漢字・単語を表示させることができる。結果として、ユーザのキー操作回数を減らし、所望の漢字を得るためのユーザの入力操作を簡素化することが可能となる。 As a result, the display order of candidate kanji (words) can be determined as a sequence of words frequently input by the user, so that the candidate kanji / words can be displayed in a display order that reflects user preferences. As a result, the number of key operations by the user can be reduced, and the user's input operation for obtaining a desired kanji can be simplified.
(連結度の判定−変形例)
表示順序の決定を、要素C(直前文字列との連続性)および要素D(前方文字列との関連性)の両方を用いて実行する場合、要素Dに基づく判定結果を優先させてもよい。この場合、上述の例で言えば、「交通」が選択された場合に、候補単語「規則」を常に優先して表示するのではなく、前方に「上海」が入力されている場合には、候補単語「大学」を優先して表示することができる。(Determining connectivity-modification)
When the display order is determined using both the element C (continuity with the immediately preceding character string) and the element D (relevance with the preceding character string), the determination result based on the element D may be prioritized. . In this case, in the above example, when “Transport” is selected, the candidate word “Rule” is not always displayed with priority, but “Shanghai” is input ahead. The candidate word “university” can be displayed with priority.
ユーザが「上海交通大学」を頻繁に入力している文字変換装置1において、「上海交通大学」を入力するときの文字変換装置1の動作について説明する。ユーザが、「上」(shang)の入力のために、ピンインの先頭文字「s」を入力すると、上述の手順で、「上」を候補漢字として表示する。ユーザによって「上」が選択されると、「上」で始まる単語を候補単語として表示する。 The operation of the
ユーザによって、「上海」が選択されると、確定文字表示領域123(図14)上に単語「上海」が表示する。同時に、文字変換装置1の候補抽出部31は、入力確定文字「上海」に続いて入力される候補単語を抽出する。候補順序決定部32は、「上海」に続く確率の高い単語を上位に表示するために、図22の連結度記録部46を参照し、候補単語の表示順序を決定する。 When “Shanghai” is selected by the user, the word “Shanghai” is displayed on the fixed character display area 123 (FIG. 14). At the same time, the
まず、連結度判定部133は、連結度対応表151(図23)に基づいて、連続性テーブル152のアドレス「npi+s」を参照し、単語候補を、単語「上海」に直接連続する確率(連続度)の高い順に並べる。すなわち、図23に示す例では、「大学(15)」「交通(13)」「警察(12)」「規則(8)」...の順に候補が求まる。続いて、連結度判定部133は、入力確定文字「上海」の前方に位置する単語との関連性に基づいて、「上海」のあとに続く候補単語の表示順序を並べ替える。しかし、ここでは、「上海」の前方に位置する漢字・単語がないため、前方文字列との関連性による表示順序の変更は実行されない。 First, the
上記手順で表示された候補単語の中から、ユーザによって「交通」が選択されると、文字変換装置1は、続いて、入力確定文字「交通」に直接連続する候補単語を上位に表示するための表示順序を決定する。 When “traffic” is selected by the user from the candidate words displayed in the above procedure, the
連結度判定部133は、連続性テーブル152のアドレス「npi+l」を参照し、連続度に基づいて「規則(21)」、「大学(16)」、「工具(15)」、「警察(14)」...の順に候補を求める。次に、前方関連性テーブル153のアドレス「ppi+s」を参照して、「交通」の前方に位置する漢字・単語(ここでは、「上海」)との関連性(関連度)に基づいて、「交通」のあとに続く候補単語の表示順序を並べ替える。より具体的には、図23に示す例では、前方関連性テーブル153によれば、候補単語の「上海」との関連度は、順に、「大学(10)」、「規則(5)」、「警察(3)」、「工具(2)」...となっている。 The
そこで、連結度判定部133は、上記候補単語の関連度を優先し、関連度の順に表示順序を変更する。この場合、「上海交通」に続く、候補単語の表示順序は、「規則」、「大学」、「工具」、「警察」...の順から、「大学」、「規則」、「警察」、「工具」...の順に変更される。あるいは、連結度および関連度の合計に基づいて、表示順序を変更してもよい。また、連結度および関連度の平均値、最大値に基づいて表示順序を変更してもよい。例えば、連結度と関連度との合計を評価値として算出することを規定した評価値算出ルールが、記録部40に記憶されており、候補順序決定部32は、上記評価値算出ルールにしたがって、連結度および関連度の合計を評価値として算出し、その評価値に基づいて表示順序を決定することができる。 Therefore, the
以上のことから、ユーザの嗜好に沿った、より精度の高い表示順序でもって候補漢字・単語を表示させることができるので、ユーザのキー操作回数を減らすことができる。結果として、所望の漢字を得るためのユーザの入力操作を簡素化することが可能となる。 From the above, candidate kanji / words can be displayed in a display order with higher accuracy according to the user's preference, so that the number of key operations by the user can be reduced. As a result, the user's input operation for obtaining a desired kanji can be simplified.
(表示順序決定手順)
本実施形態では、上述の各候補順序決定要素を組み合わせて、抽出された候補の表示順序を決定する。以下にその一例について説明するが、本発明は、以下で説明する組み合わせに限定されず、上述の各要素を適宜組み合わせることより表示順序を決定することが可能である。(Display order determination procedure)
In this embodiment, the display order of the extracted candidates is determined by combining the above-described candidate order determination elements. One example will be described below, but the present invention is not limited to the combination described below, and the display order can be determined by appropriately combining the above-described elements.
図24は、候補順序決定部32が表示順序を決定するときの、候補の分類手順を示す図である。候補順序決定部32は、まず、所定の条件(上記要素A〜Gおよびその組み合わせ)によって、表示順序ごとにいくつかのグループに候補を分類し、そのグループに内において、最終的な表示順序を決定する。 FIG. 24 is a diagram illustrating a candidate classification procedure when the candidate
候補抽出部31によって抽出された候補単語Gは、まず、一時記憶部3の抽出候補一時記憶部51(図22)に格納される。格納された候補単語Gに対し、学習漢字判定部131(図22)は、学習単語であるか否かの判定を行う(S301)。また、ピンイン長判定部132は、候補単語Gが抽出された時点で入力されているピンイン長(アルファベットの文字数)と、候補単語Gの各ピンイン長との比較を行う(S302)。 The candidate word G extracted by the
ここで、候補単語Gのうち、学習単語であり、かつ、ピンイン長も一致すると判定された候補単語は、表示順序が最上位のグループAに分類される。学習単語であるが、ピンイン長は一致しないと判定された候補単語は、グループAに次いで上位のグループBに分類される。学習単語ではないが、ピンイン長は一致すると判定された候補単語は、グループB下位のグループCに分類される。学習単語でもなく、ピンイン長も一致しないと判定された候補単語は、最下位のグループDに分類される。 Here, among the candidate words G, candidate words that are determined to be learning words and have the same pinyin length are classified into the group A having the highest display order. Candidate words that are learning words but are determined not to have the same Pinyin length are classified into group B, which is higher than group A. Candidate words that are not learning words but are determined to have the same Pinyin length are classified into group C, which is lower than group B. Candidate words that are not learning words and are determined not to have the same Pinyin length are classified into the lowest group D.
グループA、Bに分類された、学習単語である候補単語に対し、学習漢字判定部131は、さらに、単独学習単語であるかペア学習単語であるかの判定を行う(S303)。また、連結度判定部133は、直前文字列との連続性の有無についての判定を行う(S304)。 For the candidate words that are learning words classified into groups A and B, the learning
ここで、グループAの候補単語のうち、ペア学習単語であって、直前文字列との連続性ありと判定された候補単語は、最上位のグループA1に分類される。ペア学習単語であるが、直前文字列との連続性なしと判定された候補単語は、上位のグループA2に分類される。ペア学習単語でないが、直前文字列との連続性ありと判定された候補単語は、下位のグループA3に分類される。ペア学習単語でなく、直前文字列との連続性もないと判定された候補単語は、最下位のグループA4に分類される。グループBの候補単語についても同様に分類される。 Here, among the candidate words of group A, the candidate words that are pair learning words and are determined to have continuity with the immediately preceding character string are classified into the highest group A1. Although it is a pair learning word, the candidate word determined to have no continuity with the immediately preceding character string is classified into the upper group A2. Although it is not a pair learning word, the candidate word determined to have continuity with the immediately preceding character string is classified into the lower group A3. Candidate words that are not pair-learned words and are determined not to have continuity with the immediately preceding character string are classified into the lowest group A4. The group B candidate words are also classified in the same manner.
一方、グループC、Dに分類された候補単語に対しては、連結度判定部133が直前文字列との連続性の有無を判定して(S305)、上位のグループC(D)1と下位のグループC(D)2とに分類する。 On the other hand, for candidate words classified into groups C and D, the
最終的に、全候補単語(G)は、上位のグループから順に、グループA1、グループA2、グループA3、グループA4、グループB1、グループB2、グループB3、グループB4、グループC1、グループC2、グループD1、グループD2、の小グループに分類される。グループA、Bの各小グループは、さらに学習時期(要素G)によって順序が決定され(最近学習された漢字ほど上位)、グループC、Dの各小グループは、さらに出現頻度(要素A)によって順序が決定される(一般によく使われる単語ほど上位)。 Finally, all the candidate words (G) are group A1, group A2, group A3, group A4, group B1, group B2, group B3, group B4, group C1, group C2, and group D1 in order from the upper group. , Group D2, and a small group. The order of each small group of groups A and B is further determined by the learning time (element G) (the more recently learned kanji is higher), and each small group of groups C and D is further determined by the appearance frequency (element A) The order is determined (the more commonly used words are higher).
なお、上述の実施形態では、学習された候補漢字・単語を、所定の条件で(すなわち、新しく学習された順に)並べ替えると説明したが、候補として抽出された候補漢字の後に、過去に学習された候補単語として並べてもよい。あるいは、過去に学習された単語が候補漢字より優先して表示されるように並べてもよい。また、候補漢字を含む過去に使用された単語が複数ある場合は、文字数が少ない順に並べてもよい。あるいは、時間的な経過として、学習された順もしくはその逆順に並べてもよい。 In the above-described embodiment, it has been described that learned candidate kanji / words are rearranged under a predetermined condition (that is, in the newly learned order). However, learning is performed in the past after candidate kanji extracted as candidates. You may arrange as a candidate word made. Or you may arrange so that the word learned in the past may be displayed with priority over a candidate Chinese character. Moreover, when there are a plurality of words used in the past including candidate Chinese characters, they may be arranged in ascending order of the number of characters. Alternatively, as time course, they may be arranged in the learned order or vice versa.
(変形例3−四声の入力)
本実施形態では、四声の区別を無視してアルファベット(列)とピンインとを対応させる構成について説明したが、本発明の文字変換装置1は上記構成に限定されない。四声の区別を行って、アルファベット(列)とピンインとを対応させる構成も可能である。例えば、四声コード(例えば、PCでの入力では一声から四声を1から4、軽声を5で表現している)を含めて、図15に示すA/P対応表141を作成すればよい。より具体的には、図15に示すA/P対応表141およびP/C対応表142において、ピンイン「shang」は、漢字「上」と関連付けられていることがわかる。ここで、「上」の四声ありのピンインは「三声のshang」であるため、A/P対応表141の「cp_si」に対応する「shang」を「shang3」と記述することで、四声ありのピンイン「shang3」と「上」とを関連付けることができる。(Modification 3-Input of four voices)
In the present embodiment, the configuration in which the alphabet (column) and Pinyin are associated with each other while ignoring the distinction between the four voices has been described, but the
〔実施形態2〕
本発明の文字変換装置1は、さらに、上述の候補順序決定要素に優先度の情報を付与し、候補漢字(単語)の表示順序を決定するときの条件(評価値算出ルール)を、ユーザが任意に設定できるように構成してもよい。表示順序を決定するときの条件をユーザが任意に設定できるので、文字変換装置1を備えたマルチファンクションプリンタにおいて、ユーザの嗜好に合致した表示順序で候補を表示することが可能となる。結果として、所望の漢字を得るための入力操作を簡素化することができる。[Embodiment 2]
The
(文字変換装置の構成)
本実施形態における文字変換装置1は、上述の実施形態1の構成に加えて、文字入力制御部30の内部に、候補順序決定要素設定部(候補順序決定要素設定手段)35を備えており、記録部40の内部に、さらに候補順序決定要素記録部47を含んでいる(図12)。(Configuration of character conversion device)
The
本実施形態では、図22に示す評価値一時記憶部52に、候補ごとに算出した評価値を一時的に記憶し、その評価値に基づいて表示順序を決定する。すなわち、候補順序決定要素設定部35によって設定された、優先度の高い候補順序決定要素ほど、上記評価値の算出により大きな影響を与える。候補順序決定要素設定部35が設定した候補順序決定要素およびその優先度は、候補順序決定要素記録部47に記録される。 In this embodiment, the evaluation value calculated for each candidate is temporarily stored in the evaluation value
まず、評価値一時記憶部52に記憶される候補ごとの評価値のデータ構造について説明する。 First, the data structure of the evaluation value for each candidate stored in the evaluation value
図25は、候補ごとに算出した表示順序の評価値を記憶するデータ構造の一例を示す図である。本実施形態では、候補ごとの評価値を16ビットで表現する。すなわち、図25に示す16の領域に、ある候補漢字(単語)の特性(要素A〜G)を示す「0」または「1」の値を記憶する。本実施形態では、ビット位置は、評価値の高低に関連があり、上位ビットになるにつれて、評価値の上位桁を表すようになっている。よって、優先度の高い候補順序決定要素に関する判定結果は、上位ビットに反映させる。すなわち、評価値算出ルールは、候補漢字(単語)の候補順序決定要素要素から「0」または「1」の値をどのように求めるかを規定するとともに、そのように求まった値を、評価値のどのビット位置に反映させるかを規定している。 FIG. 25 is a diagram illustrating an example of a data structure that stores display order evaluation values calculated for each candidate. In this embodiment, the evaluation value for each candidate is expressed by 16 bits. That is, the value of “0” or “1” indicating the characteristics (elements A to G) of a certain candidate Chinese character (word) is stored in the 16 areas shown in FIG. In the present embodiment, the bit position is related to the level of the evaluation value, and represents the upper digit of the evaluation value as it becomes higher bits. Therefore, the determination result regarding the candidate order determination element having a high priority is reflected in the upper bits. That is, the evaluation value calculation rule defines how to obtain the value of “0” or “1” from the candidate order determination element element of the candidate kanji (word), and the value thus obtained is used as the evaluation value. This specifies the bit position to be reflected.
このようなデータ構造によれば、文字変換装置1が候補ごとの評価値を算出するときの、評価値に与える要素の重要度をビット位置によって調節することが可能となる。つまり、重要な要素ほど上位位置に割り当てているので、ビットのON「1」/OFF「0」操作を行うことのみで、候補の表示順序の評価値を容易に適切に数値化することができる。また、各要素に対して個別に変数を割り当てると、表示順序を決定するために確保すべき評価値のデータサイズが大きくなる。よって、各要素による判定結果を1ビットに割り当てていることにより、データサイズの削減を実現することができる。 According to such a data structure, when the
候補順序決定要素記録部47は、候補の表示順序を決定するための候補順序決定要素の優先度情報を記録するためのものである。図26の(a)および図26の(b)は、候補順序決定要素記録部47に記録される優先度情報の一例を示す図である。 The candidate order determination
優先度情報は、候補順序決定要素ごとに、その候補順序決定要素に関する判定結果を、評価値のデータ構造のどのビット位置に反映させるかを示すビット位置情報を含んでいる。図26の(a)に示す例では、要素Bの判定結果を図25に示すビット位置12の領域に格納するよう設定されている。すなわち、ピンイン長が一致した場合は、ビット位置12の領域に「1」が、一致しなければ「0」が評価値として記憶される。高いビット位置を割り当てられている候補順序決定要素ほど、優先度が高く、候補の評価値を定めるのに与える影響が大きい。 The priority information includes, for each candidate order determination element, bit position information indicating in which bit position of the evaluation value data structure the determination result related to the candidate order determination element is reflected. In the example shown in FIG. 26A, the determination result of the element B is set to be stored in the area of the
なお、本実施形態では、評価値を16ビットで表現し、ビット位置0〜12の領域を用いて評価値を算出しているが、本発明はこの例に限定されない。候補順序決定要素数を減らしたり、新たな要素の追加または各要素の評価値としてのレンジ幅の変更をしたりする場合は、それらが十分に納まるビット長にすることも可能である。例えば、図26の(a)および図26の(b)に示す例において、出現頻度を8ビットで表現しているが、出現頻度の差を明確にするために16ビット確保する、あるいは、出現頻度の差を重視しないために4ビットに縮小することなどが可能である。また、空きのビット位置13〜15を用いてもよい。 In this embodiment, the evaluation value is expressed by 16 bits, and the evaluation value is calculated using the region of
候補順序決定要素設定部35は、入力部11(図12)を介してユーザが指定する候補順序決定要素の優先度を設定し、優先度情報を候補順序決定要素記録部47に格納するものである。 The candidate order determination
より具体的には、例えば、ユーザが候補順序決定要素の優先度設定メニューを、操作パネル2を用いて文字変換装置1に指示すると、操作パネル2の表示部12は、候補順序決定要素の優先順位の指定を促す操作画面を表示する。例えば、「(各要素(A〜G)を)優先したい順に指示してください。」などのメッセージとともに、優先度を設定できる候補順序決定要素一覧を表示すればよい。ユーザが、優先したい順に表示されている各要素を指示すると、決定するか否かを問うメッセージの表示を行う。例えば、「変更を決定する場合は、決定キーを押してください。」などのメッセージを表示すればよい。 More specifically, for example, when the user instructs the priority conversion menu of the candidate order determination element to the
ユーザが操作パネル2の決定キーを押すと、候補順序決定要素設定部35は、入力された指示信号に応じて、低いビット位置から、ユーザが指定した優先度が低い候補順序決定要素の領域として順に割り当て、各候補順序決定要素の判定結果を格納するビット位置の情報を変更する。 When the user presses the determination key on the
例えば、ユーザが、図26の(a)に示した例の状態から、要素Fのペア学習漢字/単語を最も優先度の高い候補順序決定要素として、順に、要素E、要素F、要素B、要素C、要素D、要素A/Gを指定したとすると、優先度情報は、図26の(b)に示すとおりに変更される。図26の(b)に示す例では、要素Fの判定結果が、ビット位置12の領域に格納されることになる。 For example, from the state of the example shown in FIG. 26A, the user sets the element learning pair Kanji / word of element F as the candidate order determination element with the highest priority in order of element E, element F, element B, If element C, element D, and element A / G are designated, the priority information is changed as shown in FIG. In the example shown in (b) of FIG. 26, the determination result of the element F is stored in the area of the
上記構成によれば、候補順序決定部32の各部(図22)は、候補順序決定要素記録部47が指定する候補順序決定要素の優先度情報に基づいて、判定結果に係る評価値を指定された評価値一時記憶部52のビット位置に格納する。 According to the above configuration, each part (FIG. 22) of the candidate
これにより、表示順序を決定するための評価値を、ユーザが優先させたい候補順序決定要素をもとに算出することが可能となるので、よりユーザの嗜好に合致した表示順序で候補を表示させることが可能となる。 As a result, the evaluation value for determining the display order can be calculated based on the candidate order determining element that the user wants to prioritize, so that the candidates are displayed in a display order that more matches the user's preference. It becomes possible.
なお、この候補順序決定要素の優先度情報は、候補漢字と候補単語とで別に設定できる構成としてもよいし、候補漢字・候補単語の両方の表示順序に同様に適用する1つの優先度情報を設定できる構成としてもよい。候補漢字と候補単語とで別に設定できる構成とした場合、優先度の変更操作を、1回の優先度設定メニュー呼び出し操作によって、候補漢字、候補単語の順に候補順序決定要素の優先度変更操作を行えるようにしてもよいし、候補漢字用、候補単語用それぞれの優先度設定メニュー呼び出し操作および優先度変更操作を行えるようにしてもよい。 The priority information of the candidate order determination element may be configured to be set separately for candidate kanji and candidate words, or one priority information that is similarly applied to the display order of both candidate kanji and candidate words. It is good also as composition which can be set up. In a configuration in which candidate kanji and candidate words can be set separately, the priority change operation can be performed by changing the priority of the candidate order determination element in the order of candidate kanji and candidate words by one priority setting menu call operation. It may be possible to perform a priority setting menu call operation and a priority change operation for candidate Chinese characters and candidate words.
また、設定終了キーを設け、設定終了キーを押した時点までの内容に関して、所望の優先度情報の変更を行うようにしてもよい。例えば、候補順序決定要素の優先度の変更途中で設定終了キーを押した場合には、優先度の変更内容を反映しないようにし、候補順序決定要素の変更だけを反映さえるなどすることが可能である。 Further, a setting end key may be provided, and desired priority information may be changed with respect to contents up to the point when the setting end key is pressed. For example, when the setting end key is pressed in the middle of changing the priority of the candidate order determination element, it is possible not to reflect the change contents of the priority and reflect only the change of the candidate order determination element. is there.
次に、図22に示す候補順序決定部32の各部の判定結果に基づいて、図25に示す評価値を算出する方法についてより詳細に説明する。なお、以下で説明する例では、優先度は、図26の(a)に示すとおりに設定されているものとする。 Next, a method for calculating the evaluation value shown in FIG. 25 based on the determination result of each part of the candidate
まず、候補抽出部31が抽出した候補は、一旦抽出候補一時記憶部51に格納される。評価値一時記憶部52において、格納された候補ごとに、その評価値を表す16ビットの領域(図25)が確保される。 First, the candidates extracted by the
次に、候補が学習漢字(単語)である場合には、学習時期判定部135が、そうでない場合には、出現頻度判定部134が、学習時期または出現頻度をそれぞれ算出し、評価値算出ルールに基づいて、算出結果をビット位置0〜7(図25)に格納する。 Next, when the candidate is a learning kanji (word), the learning
出現頻度は、あらかじめ大量の新聞や雑誌などの様々な文書文字データについて統計的に文字および単語ごとに求めた使用頻度であり、頻度が大きいほど一般的によく使われる文字・単語であるとする。本実施形態では、出現頻度の領域を8ビット確保しているので、出現頻度に基づいて、評価値算出ルールにしたがい、候補の評価値を0〜255の間で定めることができる。 Appearance frequency is the usage frequency obtained statistically for each character and word for various document character data such as a large number of newspapers and magazines in advance, and the higher the frequency, the more commonly used characters and words. . In this embodiment, since the appearance frequency area is 8 bits, the candidate evaluation value can be set between 0 and 255 according to the evaluation value calculation rule based on the appearance frequency.
学習時期についても同様に、最近学習されたものほど評価値が高くなるよう0〜255の間で定めることができる。学習時期とは、候補漢字(単語)がいつ学習されたかを表す。評価値算出ルールについて具体的に説明すれば以下のとおりである。例えば、学習時期をX、学習できる最大個数をNとし、学習できる漢字・単語の学習した時点をn、現時点の学習できる時点をmとすると任意の漢字・単語の学習時期Xは、以下の式で求まる。
m−n≧0のとき
X=N+m−n−1・・・(式1−1)
m−n<0のとき
X=n−m−1・・・(式1−2)
ここで、学習時期Xにおいて、Xの値が小さいほど過去に学習されたものとする。Similarly, the learning time can be set between 0 and 255 so that the more recently learned, the higher the evaluation value. The learning time represents when the candidate kanji (word) is learned. The evaluation value calculation rule will be specifically described as follows. For example, if the learning time is X, the maximum number that can be learned is N, the learning time of a kanji / word that can be learned is n, and the current learning time is m, the learning time X of any kanji / word can be expressed by the following equation: It is obtained by.
When m−n ≧ 0, X = N + mn−1 (Formula 1-1)
When m−n <0, X = n−m−1 (Formula 1-2)
Here, in the learning period X, it is assumed that learning is performed in the past as the value of X is small.
なお、上記式のXの値域が、学習時期の評価値として確保されているビット長の範囲(本実施形態では8ビット)を越える場合は、Xの値をビット長の範囲への数値変換や、ビット長の変更を行えばよい。 When the value range of X in the above formula exceeds the bit length range (8 bits in this embodiment) reserved as the evaluation value for the learning time, the value of X is converted into a numerical value range of bit length, The bit length may be changed.
ビット位置8〜12には、それぞれ、要素D、C、F、E、Bについての判定結果が格納される。学習漢字判定部131、ピンイン長判定部132、および、連結度判定部133は、候補の特性が条件を満足していると判定した場合には「1」、そうでない場合には「0」を指定されたビット位置にセットする。例えば、連結度判定部133は、候補がすでに入力されている前方文字列と関連性ありと判定した場合には、ビット位置8に「1」をセットする。
すべての候補について表示順序の評価値を算出すると、候補順序決定部32は、候補を評価値一時記憶部52に記憶される評価値の大きい順に並べ替え、最終的な表示順序を表示順序一時記憶部53に格納する。最後に、表示制御部22(図12)は、表示順序一時記憶部53に記憶されている上記表示順序に基づいて、候補を表示部12に表示する。 When the display order evaluation values are calculated for all candidates, the candidate
〔実施形態3〕
上述の各実施形態では、ピンインを構成するアルファベットキーの入力による中国語入力の説明を行った。しかし、本発明の文字変換装置1はこれに限定されない。操作パネル2の入力部11(図12)が、手書き文字の入力機能を備え、入出力制御部20が手書き文字を認識することにより、中国語を入力する文字変換装置1を構成することも可能である。[Embodiment 3]
In each of the above-described embodiments, Chinese input by inputting alphabet keys constituting Pinyin has been described. However, the
また、手書き文字を入力するための入力部(筆記文字入力部)11は、例えば、表示一体型タブレットとしての操作パネル2の表示領域に手書き文字入力のための枠を表示することにより実現することができる。 Moreover, the input part (written character input part) 11 for inputting a handwritten character is implement | achieved by displaying the frame for a handwritten character input in the display area of the
文字変換装置1は、入出力制御部20内部に、上記文字入力枠にユーザが筆記した文字の筆記情報(座標データ)を認識するための文字認識部(文字認識手段)(図示せず)を備える。また、記録部40に、上記文字認識部で認識された入力文字パターンとマッチングするために用いる認識辞書(図示せず)をさらに含む。そして、表示制御部22が、入力文字の認識結果を出力するように構成されている。 The
ユーザは、操作パネル2の文字入力枠に所望の文字を筆記すると、操作パネル2は筆記された文字の座標情報60(図27)を検出し、入出力制御部20の内部バッファに記憶する。文字認識部は、内部バッファに記憶している座標情報と認識辞書の辞書パターンとマッチング(例えば、DPマッチング)を行い、入力パターンと辞書パターンの類似度(例えば距離)を求め、辞書パターンに対応する文字コードと類似度を関連付けて内部バッファに記憶する。文字認識部は、入力パターンと認識辞書の各パターンとのマッチングを行うと、内部バッファの認識結果を類似度の高い順に並べ換える。そして、認識結果を候補漢字(単語)として候補抽出部31に供給する。 When the user writes a desired character in the character input frame of the
以下、手書き文字認識機能を備えた文字変換装置1の動作を具体的に説明する。 Hereinafter, the operation of the
ユーザが、表示一体型タブレットの文字入力枠に「外字2」を筆記すると(図28の(a))、操作パネル2は「外字2」の座標データを検出し、内部バッファに記憶する(図27)。文字認識部は、内部バッファの「外字2」の座標データと認識辞書の各辞書パターンとDPマッチングを行い、距離を計算し、距離の小さい順に並べ替える(図29)。入出力制御部20は、認識結果を表示制御部22に転送する。 When the user writes “
表示制御部22は、認識結果に基づいて、認識文字候補となるn個の文字(ここでは、漢字)の表示位置を求め、表示位置の情報および認識文字候補n個を操作パネル2の表示部12に表示する(図28の(b))。操作パネル2は、表示された認識文字候補と表示位置を関連付けて内部バッファに記憶する。 The
ユーザは、「外字2」が表示されていることを確認すると、操作パネル2上の「外字2」を指定する。操作パネル2は指示された位置を検出し、入出力制御部20の候補選択受付部23に位置情報を転送する。そして、候補選択受付部23で「外字2」が指示されたことを検出し、「外字2」から始まる単語(「「外字2」天」・・・)が表示される(図28の(c))。このときの動作は、すでに説明しているので、ここでは繰り返さない。 When the user confirms that “
これにより、ユーザが所望の漢字に対応するピンインを把握していない場合でも、所望の漢字を入力することが可能となり、所望の漢字を得るための入力操作を簡素化することができる。 Thereby, even when the user does not grasp the pinyin corresponding to the desired kanji, it becomes possible to input the desired kanji, and the input operation for obtaining the desired kanji can be simplified.
なお、手書き文字を認識するための、文字変換装置1の上記文字認識部の機能について、マルチファンクションプリンタを例に挙げて説明したが、これに限定されない。表示一体型のタッチパネルを備えた機器であればいずれも、上記文字認識部を適用することが可能である。したがって、筆記文字を入力することにより所望の漢字・単語を入力することが可能な本発明の文字変換装置を、上記マルチファンクションプリンタ以外の機器においても実現することが可能である。 In addition, although the function of the said character recognition part of the
〔実施形態4〕
(繁体字の入力)
上述の実施形態では、ピンイン表記から中国語(簡体字)を入力可能な文字変換装置について説明した。しかしながら、本発明の文字変換装置1は上記構成に限定されない。[Embodiment 4]
(Traditional input)
In the above-described embodiment, the character conversion device capable of inputting Chinese (simplified characters) from Pinyin notation has been described. However, the
例えば、本発明の文字変換装置1を、主に台湾で使用される繁体字を入力するための文字変換装置として実現することも可能である。 For example, the
本実施形態では、以下、表音文字としての注音文字(注音の字母)の入力を受け付けて、表意文字としての繁体字を、候補漢字(単語)としてユーザに提示する文字変換装置1について説明する。 In the present embodiment, hereinafter, a
図30は、本実施形態に係る文字変換装置1の要部構成を示すブロック図である。なお、図30の各構成要素に付された符号は、図12・図22の各構成要素に付された符号に対応しており、同じ符号は、同じ構成要素を示している。したがって、上述の各実施形態ですでに説明した構成要素についての説明は繰り返さない。 FIG. 30 is a block diagram showing the main configuration of the
図30に示す文字変換装置1において、図12・図22と異なる点は、入力部11が、注音文字を入力するための、各注音文字に対応付けられたキーを備えている点と、入力受付部21が、上記入力された注音文字を受け付けて候補抽出部31に供給するための注音文字入力受付部24を備えている点と、漢字辞書部41において、注音文字−注音、および、注音−繁体字の対応関係を記録した対応表が含まれている点である。 In the
図31は、本実施形態における、繁体字入力のための注音文字入力処理時の操作画面の一例を示す図である。本実施形態における表示一体型の操作パネル2では、アルファベットを表示するほかに、注音文字を表示してもよい(文字入力領域121)。繁体字の入力では、アルファベットではなく注音文字を入力することが一般的である。図31に示すとおり、キーボードのキーに注音文字が割り当てられており、これにより、繁体字に対応した注音を入力することができる。 FIG. 31 is a diagram illustrating an example of an operation screen at the time of a sung character input process for inputting traditional characters according to the present embodiment. In the display-integrated
図32は、本実施形態における、漢字辞書部41(図30)に記録される、漢字辞書(繁体字)の例を示す図である。 FIG. 32 is a diagram showing an example of a Chinese character dictionary (traditional character) recorded in the Chinese character dictionary unit 41 (FIG. 30) in the present embodiment.
図33は、本実施形態における、単語辞書部42に記録される、単語辞書の例を示す図である。 FIG. 33 is a diagram showing an example of a word dictionary recorded in the
図34は、本実施形態における、連結度記録部46に記録される、連結度テーブル150aの例を示す図である。 FIG. 34 is a diagram illustrating an example of the connectivity table 150a recorded in the
上記構成によれば、中国語(簡体字)を入力する場合と同様に、所望の表意文字(台湾で主に用いられる繁体字)を得るための、表音文字(注音の字母)を入力する操作を簡素化することが可能な文字変換装置を実現することが可能となる。 According to the above configuration, as in the case of inputting Chinese (simplified characters), an operation for inputting a phonetic character (a syllabary character) to obtain a desired ideogram (a traditional character used mainly in Taiwan). It is possible to realize a character conversion device that can simplify the above.
〔学習機能について〕
(学習漢字・単語における表示順序決定方法)
学習漢字・単語の表示順序は、例えば以下のような計算によって、学習された順序(学習順位Yと称する)を算出することにより、決定することもできる。学習順位Yの算出は、図22に示す学習時期判定部135が実行すればよい。
Y=学習番号−学習カウンタ−1・・・(式2)
学習番号は、新たに学習される漢字に割り当てるべきユニークな番号を表しており、この番号が、学習カウンタとして学習漢字とともに記録されることにより、その漢字がいつ学習されたかを知ることができるものである。図21の学習辞書記録部43(または、ペア学習辞書記録部44)には、500個の学習漢字(単語)を記録することが可能であるとすると、学習番号は、0〜499までを用意すればよい。[About the learning function]
(Method for determining the display order of learning kanji and words)
The learning kanji / word display order can also be determined by calculating the learned order (referred to as learning order Y), for example, by the following calculation. The learning order Y may be calculated by the learning
Y = learning number−learning counter−1 (Expression 2)
The learning number represents a unique number that should be assigned to a newly learned kanji, and this number is recorded with the learning kanji as a learning counter so that it can be known when the kanji has been learned. It is. If it is possible to record 500 learning kanji (words) in the learning dictionary recording unit 43 (or pair learning dictionary recording unit 44) in FIG. 21, learning
上記式2の計算により、Yがマイナスになる場合は、学習番号の上限値(ここでは、500程度)を加算する。 If Y is negative by the calculation of
さらに、学習時期判定部135は、候補の並び替えの手間を省くために、候補ごとに求まった学習順位Yをまるめる処理を行ってもよい。例えば、以下の手順にしたがって、学習順位をまるめることができる。
(イ)0≦Y≦9のとき、Y←Y(そのまま)
(ロ)10≦Y≦29のとき、Y←(Y−10)/2+10
(ハ)30≦Y≦109のとき、Y←(Y−30)/8+20
(ニ)Y≧110のとき、Y←(Y−110)/32+30、さらに、Y>39のとき、Y←39
以上のように、上記式2を用いれば、学習漢字(単語)を学習された順、あるいは、学習された時期が新しい順に効率よく並べ替えることができるので、学習時期に応じて候補としての表示順序を決定することが可能となる。Furthermore, the learning
(B) When 0 ≦ Y ≦ 9, Y ← Y (as it is)
(B) When 10 ≦ Y ≦ 29, Y ← (Y−10) / 2 + 10
(C) When 30 ≦ Y ≦ 109, Y ← (Y−30) / 8 + 20
(D) When Y ≧ 110, Y ← (Y−110) / 32 + 30, and when Y> 39, Y ← 39
As described above, by using the
(学習カウンタ付与方法)
次に、図21に示す学習制御部34が制御する学習番号(初期値=0)および学習カウンタ(初期値=0)について、より具体的に説明する。学習辞書記録部43に500個の学習漢字を記録できるものとし、学習辞書記録部43における学習漢字の記録位置(アドレス)の初期値をID=0とする。(Learning counter assignment method)
Next, the learning number (initial value = 0) and the learning counter (initial value = 0) controlled by the
学習番号=0のときに漢字「学」を学習すると、学習制御部34は、学習辞書記録部43に学習されている学習漢字のうち、現在の学習番号に等しい学習カウンタを持つ学習漢字を検索する。検索された学習漢字のアドレスIDの漢字を削除し、新規の学習漢字をセットする。現在の学習番号に等しい学習カウンタを持つ学習漢字が無い場合は、IDの位置に学習漢字と学習カウンタを共に記録する。そして、学習番号に1を加算する。ここでは、最初の学習であるため、アドレス「ID=0」の位置に、学習漢字「学」を学習カウンタ=0とともに記録し、学習番号に1加算して、学習番号=1とする。 When learning the kanji “gaku” when the learning number = 0, the
この動作を繰り返して、学習番号=499のときに「文」を学習すると、学習制御部34は、学習辞書記録部43のアドレス「k」の位置に、学習漢字「文」を、学習カウンタ499とともに記録し、学習番号=0に更新する(学習番号499に1を加算した結果、学習番号が500以上になる場合は、500を減算して学習番号を0に戻す)。 When this operation is repeated and “sentence” is learned when the learning number = 499, the
さらに、新しく漢字(例えば「大」)が学習されると、学習制御部34は、新たな学習漢字「大」を、学習カウンタ0とともに記録されている「学」に上書きする形で記録する。このとき「大」には、学習カウンタ0が関連付けて記録される。続いて、上記と同様学習番号=2に更新する。 Further, when a new kanji character (for example, “Large”) is learned, the
(学習辞書のデータ構造)
次に、学習辞書記録部43(および、ペア学習辞書記録部44)に記録される学習単語のデータ構造について説明する。(Data structure of learning dictionary)
Next, the data structure of learning words recorded in the learning dictionary recording unit 43 (and the pair learning dictionary recording unit 44) will be described.
学習辞書記録部43に記録される学習単語には、その単語を構成する漢字の文字コードから生成されるグループ識別子(GId値)が割り当てられており、学習単語はGId値と関連付けて記録される。このGId値を用いることにより、学習辞書記録部43から目的の学習単語を検索するための処理効率が向上する。 The learning word recorded in the learning
GId値の生成方法について、具体例を挙げて説明する。なお、以下の説明では、漢字を一意に特定するための漢字コードおよびGId値をともに16ビットで表すものとする。本実施形態では、一例として、GId値は、当該単語の文字数を示す上位4ビットと、単語を構成する各漢字の漢字コードの演算により求まった数値を示す下位12ビットとで構成されるものとするが、本発明の文字変換装置1で利用されるGId値のデータ構造はこれに限定されない。 A method for generating the GId value will be described with a specific example. In the following description, both the kanji code for uniquely identifying the kanji and the GId value are represented by 16 bits. In this embodiment, as an example, the GId value is composed of the upper 4 bits indicating the number of characters of the word and the lower 12 bits indicating the numerical value obtained by the operation of the kanji code of each kanji constituting the word. However, the data structure of the GId value used in the
例えば、「上海」という単語の入力が確定されたとする。このとき、学習制御部34(図21)は、まず「上海」という単語のGId値を生成する。GId値を生成するために、単語「上海」を構成する各漢字の漢字コードの下位8ビットを、各漢字を表す数値(「上」=「009F(16進数)」、「海」=「00A3(16進数)」)として用いるものとする。例えば、GId値の下位12ビットを、上記漢字コード16ビットの下位8ビット同士の加算により求めるとすると、学習制御部34は、下位12ビットとして、9F+A3=「141(16進数)」を算出する。 For example, assume that the input of the word “Shanghai” is confirmed. At this time, the learning control unit 34 (FIG. 21) first generates a GId value of the word “Shanghai”. In order to generate the GId value, the lower 8 bits of the kanji code of each kanji constituting the word “Shanghai” are expressed by numerical values (“upper” = “009F (hexadecimal number)”, “sea” = “00A3”. (Hexadecimal number) "). For example, if the lower 12 bits of the GId value are obtained by adding the lower 8 bits of the 16 Kanji code, the
次に、「上海」は2文字であるので、この単語が2文字で構成されていることを示す「2(16進数)」を上位4ビットとして算出する。以上のようにして、単語「上海」のGId値を「2141(16進数)」として算出する。 Next, since “Shanghai” has two characters, “2 (hexadecimal number)” indicating that this word is composed of two characters is calculated as the upper 4 bits. As described above, the GId value of the word “Shanghai” is calculated as “2141 (hexadecimal number)”.
上述のようにして生成されたGId値は、どのような文字数からなる単語であっても(ただし、上述の例のように文字数を4ビットで表す場合、最大8文字までを単語として学習するものとする)、固定長(例えば、16ビット)に要約されることになる。したがって、固定長で構成されるGId値によって、目的の単語を絞り込んでから、検索処理を実行することができるので、学習単語の検索効率を向上させることが可能となる。 The GId value generated as described above is a word consisting of any number of characters (however, when the number of characters is expressed by 4 bits as in the above example, up to 8 characters are learned as words) And a fixed length (for example, 16 bits). Therefore, the search processing can be executed after narrowing down the target word by the GId value configured with a fixed length, so that the search efficiency of the learning word can be improved.
〔操作パネルについて〕
操作パネル2に表示される文字入力処理時の操作画面は、図14や図17で示す例に限定されない。操作パネル2に表示される操作画面の他の例について説明する。[About the operation panel]
The operation screen displayed during the character input process displayed on the
操作パネル2に表示される、ピンインを入力するためのアルファベットキーは、図35に示すように、PCのキーボードを模したキー配列としてもよいし、図36に示すように、入力文字をアルファベット順にm×nのキー配列に当てはめるようにしてもよい。 The alphabet keys for inputting pinyin displayed on the
また、候補漢字を表示するための候補文字表示領域122を確定文字表示領域123に重畳させて表示してもよい(図37の(a)〜(c))。 Also, a candidate
さらに、候補漢字を選択後、選択した漢字から始まる候補単語を表示するための第2の候補文字表示領域122’を、候補文字表示領域122および確定文字表示領域123に重畳させて表示してもよいし(図38の(a))、候補文字表示領域122と並べて表示してもよい(図38の(b))。 Further, after selecting a candidate kanji, a second candidate
〔実施形態5〕
本発明の一実施形態について図1〜図11に基づいて説明すると以下の通りである。ここでは、漢字(変換文字、変換された後の文字)の読み(表音文字)を入力して漢字を含む単語を決定する装置とするが、これに限定されない。つまり、以下で説明する実施の形態は本発明を実施するための一例であって、本発明を実現する上で制限されるものではない。[Embodiment 5]
An embodiment of the present invention will be described below with reference to FIGS. Here, although it is set as the apparatus which inputs the reading (phonetic character) of a Chinese character (converted character, the character after conversion), and determines the word containing a Chinese character, it is not limited to this. That is, the embodiment described below is an example for carrying out the present invention, and is not limited in realizing the present invention.
図1は、本実施の形態に係る文字変換装置1の構成を示すブロック図である。文字変換装置1は、入力部11、辞書検索部310、表示制御部22、漢字辞書部(変換文字辞書)41、単語辞書部(単語辞書)42、一時記憶部3、制御部10、表示部12を備えている。なお、図1の各構成要素に付された符号は、図12・図16・図21・図22・図30の各構成要素に付された符号に対応しており、同じ符号は、同じ構成要素を示している。なお、図1には示されていない図12・図16・図21・図22・図30の各部を、図1の文字変換装置1が備えていてもよい。 FIG. 1 is a block diagram showing a configuration of a
入力部11は、キーボード等からなり、ユーザが所望の入力文字列の読み(表音文字)、後段で説明する選択した漢字、選択した単語等を、入力することができるように構成されている。また、入力部11は、ユーザが文字変換装置1への各種指示を入力できるように構成されている。なお、入力部11と表示部12とを兼用して、操作パネル2(タッチパネル)として設けられていてもよい。 The
表示制御部22は、入力部11から入力された読み及び読みを基に、辞書検索部310が検索した漢字、単語及びそれらの候補をユーザが選択可能に表示部12に表示する。表示部12は、表示制御部22の制御の下、各種データの表示を行う。 Based on the readings and readings input from the
本実施形態では、候補抽出部31は、辞書検索部310を備えている。辞書検索部310は、記録部40に記憶されている各辞書部(漢字辞書部41および単語辞書部42)を検索し、候補となる漢字(または単語)を検出する。本実施形態では、辞書検索部310は、さらに、漢字取得部(先頭変換文字取得手段)311と単語取得部(単語取得手段)312とを備えている。 In this embodiment, the
漢字取得部311は、入力受付部(受付手段)21が受け付けた読みの文字列を入力とし、漢字辞書部41を検索して所望の条件に一致した漢字(あるいは、以下で説明する漢字情報)を検索結果として一時記憶部3に記憶する。さらに単語取得部312は、漢字取得部311の検索結果及び入力受付部21が受け付けた読みの文字列を入力とし、単語辞書部42を検索して所望の条件に一致した単語(あるいは、以下で説明する単語情報)を検索結果として一時記憶部3に記憶する。漢字取得および単語取得の詳細は後述する。 The kanji acquisition unit 311 receives the character string of the reading received by the input receiving unit (accepting means) 21 and searches the
漢字辞書部41は、読みと漢字とを対応付けた漢字対応情報144を保持している。さらに、読みの先頭文字と該先頭文字を先頭とする漢字の、漢字対応情報144での格納先のアドレス情報を対応付けた漢字インデックス(漢字インデックステーブル)145を保持している。ここでは、漢字インデックス145は、漢字の読みの順に並べられているものとする。 The
単語辞書部42は、単語と該単語の読みとが対応付けられた単語対応情報162を保持している。さらに、単語の先頭となりうる先頭文字と、該先頭文字を先頭に持つ単語の、単語対応情報162での格納先のアドレス情報とが対応付けられた単語インデックス(単語インデックステーブル)161を保持している。単語対応情報162と単語インデックス161とは、単語の先頭文字毎にグループ化されている。 The
また、漢字対応情報144は、漢字に対応付けて補助情報を格納している。また、単語対応情報162は、単語に対応付けて補助情報を格納している。これら、補助情報は、例えば、読みの文字数(例えば、上述の各実施形態におけるピンイン長(要素B))(検索補助情報)や出現頻度(上述の要素A)(表示補助情報)等が挙げられる。上記補助情報は、読みの文字数及び出現頻度を所定の値域、例えば、1から100の範囲に変換した数値とする。以下では、漢字情報とは、漢字とその漢字に対応付けられた情報(読み、補助情報)とを指すものとする。また、単語情報とは、単語とその単語に対応付けられた情報(読み、補助情報)とを指すものとする。しかし、補助情報は、もちろん、上記に限定されず、これ以外の情報であってもよい。例えば、上述の各実施形態で述べた候補順序決定要素(要素C〜要素G)を補助情報として、候補(漢字/単語)に対応付けて記憶しておいてもよい。 The
制御部10は、文字変換装置1における各種構成の動作を統括的に制御する。例えば、入力部11から入力された文字列の文字数をカウントする。また、辞書検索部310、表示制御部22の制御を行う。また、入力受付部21を備えおり、ユーザが入力部11から入力した文字列を受け付けるようになっている。 The
次に、文字変換装置1の処理動作について、図2に示すフローチャートを用いて説明する。 Next, the processing operation of the
ユーザが入力部11から入力したい文字列の先頭文字の読みとして、その読みの先頭文字を含む1以上の読み文字列を入力部11から入力すると、入力受付部21は入力された読み文字列を制御部10に転送する。 When the user inputs one or more reading character strings including the first character of the reading as the reading of the first character of the character string that the user wants to input from the
制御部10は入力部11から転送された読み文字列の文字数をカウントし、読み文字列とその文字数を一時記憶部3に記憶する。そして、制御部10は辞書検索部310に漢字検索を指示する(S101)。 The
次に、辞書検索部310の漢字取得部311は、一時記憶部3から読み文字列と読み文字列の文字数を辞書検索部310の内部バッファ(図示せず)に読み込む。漢字取得部311は、漢字インデックス145を参照し、読み文字列の先頭文字を基に、漢字対応情報144内での検索すべき検索対象範囲の終了位置のアドレス(iNum)を求めて内部バッファに保持する(S102)。さらに、漢字対応情報144内での検索すべき検索対象範囲の開始位置のアドレス(iStart)を求めて内部バッファに保持する(S103)。 Next, the kanji acquisition unit 311 of the
そして、漢字取得部311は、辞書検索部310の内部バッファに保持したアドレスを基に、漢字対応情報144を参照して漢字情報を読み込み、漢字対応情報144の読み情報と入力文字列の読みとを比較する(S104)。入力文字列の読みと、漢字対応情報144での読みが一致している場合は(S104でYES)、漢字取得部311は、読みが一致の条件を満足した漢字情報を一時記憶部3に記憶する(S105)。 The kanji acquisition unit 311 reads kanji information by referring to the
そして、iStartを更新する(S106)。その後、漢字取得部311は内部バッファに保持しているiNumとS106で更新されたiStartとを比較する(S107)。比較した結果、検索する漢字について、iStartがiNum以上になっていると(S107においてNO)、制御部10に漢字検索が終了したことを知らせる。 Then, iStart is updated (S106). Thereafter, the kanji acquisition unit 311 compares the iNum held in the internal buffer with the iStart updated in S106 (S107). As a result of the comparison, if iStart is equal to or greater than iNum for the kanji to be searched (NO in S107), the
なお、漢字検索の具体的な説明は、実施例を用いて後述する。 A specific description of Kanji search will be described later using an embodiment.
制御部10は、辞書検索部310から漢字検索が終了したことの通知を受けると、一時記憶部3に記憶されている漢字検索結果を所定の順に並べ替え(S108)、表示位置の情報を付加して一時記憶部3に記憶する。加えて、表示制御部22は、表示部12に漢字検索結果の表示を行う(S109)。なお、上記所定の順に並べ替える際、補助情報の出現頻度の順に並べ替えてもよいし、上述の各実施形態で説明したとおり、候補順序決定要素(および評価値算出ルール)に基づいて、候補順序決定部32が評価値を算出し、それに基づいて並べ替えてもよい。 Upon receiving a notification from the
次に、ユーザの指示入力があるかを確認する(S110)。ユーザは、表示部12に表示された漢字検索結果を目視して、所望の漢字を選択し、入力部11を用いてその漢字が表示されている位置を指示入力する。このようなユーザの指示入力があると(S110にてYES)、入力部11は指示位置の位置情報を制御部10の入力受付部21に送信する。 Next, it is confirmed whether there is a user instruction input (S110). The user visually checks the kanji search result displayed on the
制御部10は、入力受付部21で受け付けた位置情報と、一時記憶部3に記憶している漢字検索結果の表示位置の情報とを比較し、入力された漢字を検出する(S111)。さらに、制御部10は、ユーザにより指定された漢字を辞書検索部310に転送し、単語検索を行うことを指示する。なお、このとき、候補選択受付部23が、ユーザにより選択された漢字を検出し、学習制御手段が、それを学習漢字として、学習辞書記録部43またはペア学習辞書記録部44に記憶してもよい。 The
辞書検索部310の単語取得部312は、単語検索の指示を受けると、単語インデックス161を参照し、取得した漢字の識別情報(文字コード)を基に、単語対応情報162内での検索すべき検索対象範囲の終了位置のアドレス(iNum)を求めて内部バッファに保持する(S112)。さらに、単語対応情報162内で検索すべき検索対象範囲の開始位置のアドレス(iStart)を求めて内部バッファに保持する(S113)。 Upon receiving a word search instruction, the
そして、単語取得部312は、辞書検索部310の内部バッファに保持したアドレスを基に、単語対応情報162を参照して単語情報を読み込み、所定の条件に一致する単語情報を一時記憶部3に記憶する(S114)。 Then, the
その後、単語取得部312は、検索対象の単語についてのiStartを更新し(S114a)、内部バッファに保持しているiNumとS114aで更新したiStartとを比較する(S115)。比較した結果、検索対象の単語について、iStartがiNum以上になっていると(S115においてNO)、制御部10に単語検索が終了したことを知らせる。 Thereafter, the
なお、単語検索の具体的な説明は実施例を用いて後述する。 A specific description of word search will be described later using an embodiment.
そして、制御部10は、辞書検索部310から単語検索が終了したことの通知を受けると、一時記憶部3に記憶されている単語検索結果を所定の順に並べ換え(S116)、表示位置の情報を付加して一時記憶部3に記憶する。加えて、表示制御部22は、表示部12にて表示部12に単語検索結果の表示を行う(S117)。なお、上記所定の順に並べ替える際、補助情報の出現頻度の順に並べ替えてもよいし、上述の各実施形態で説明したとおり、候補順序決定要素(および評価値算出ルール)に基づいて、候補順序決定部32が評価値を算出し、それに基づいて並べ替えてもよい。 Then, upon receiving notification from the
さらに、ユーザが表示部12に表示された単語検索結果から所望の単語を目視して、所望の単語を選択し、その単語が表示されている位置を指示入力する。指示入力があると、入力部11は入力された位置の位置情報を制御部10の入力受付部21に送信する。なお、このとき、候補選択受付部23が、ユーザにより選択された漢字を検出し、学習制御手段が、それを学習漢字として、学習辞書記録部43またはペア学習辞書記録部44に記憶してもよい。 Further, the user visually looks at a desired word from the word search result displayed on the
制御部10は、入力受付部21で受け付けた位置情報と、一時記憶部3に記憶している単語検索結果の表示位置の情報と比較し、ユーザにより指定された単語を検索する。そして表示制御部22は表示部12にて検索された単語を表示する。 The
つまり、本発明に係る文字変換装置では、漢字辞書部41及び単語辞書部42に、インデックスと漢字対応情報144及び単語対応情報162を持たせ、同一先頭漢字の単語をグループ化し、漢字対応情報及び単語対応情報に補助情報を持たせ、補助情報を基に検索対象の漢字及び単語を制限することで、検索時間の短縮を行えるようにしている。さらに、検索された候補となる漢字(単語)の表示順序は、その候補の補助情報(候補順序決定要素)に基づいて、候補順序決定部32によって、ユーザによって選択される可能性が高いものほど優先して表示されるように決定される。したがって、ユーザが所望する順序に並べ替えられた候補の漢字(単語)を、より短い時間で表示することができる。結果として、ユーザの利便性を向上させることが可能となる。 That is, in the character conversion device according to the present invention, the
なお、以下の実施例5−1、5−2では、上記説明した文字変換装置1を、ピンイン(表音文字)を入力して漢字(変換文字)に変換する中国語変換装置として説明する。この場合、以下で詳細に説明するが、漢字インデックス145、漢字対応情報144、単語インデックス161、単語対応情報162は、次のようになっているものとする。 In Examples 5-1 and 5-2 below, the
漢字インデックス145は、図3に示すようになっており、ピンインの先頭文字(先頭の表音文字)と、このピンインの先頭文字を漢字のピンイン(表音情報)の先頭として持つ漢字の、漢字対応情報144での漢字アドレス(格納先情報)とが対応付けられている。図3で、漢字インデックス145の左の記載(cidx_m1、cidx_m2等)は、漢字インデックス145内でのアドレスである。具体的には、cidx_m1とは、「読みの先頭がmであり、1声」の漢字インデックス145内でのアドレスである。 The
また、漢字対応情報144は、図4に示すように、漢字とそのピンインと、補助情報(図4では、検索条件および頻度情報)とが対応付けられている。図4の漢字対応情報144の左の記載(cp_m1、cp_m2等)は、漢字対応情報144内でのアドレスである。 In the
また、単語インデックス161は、図5に示す1次インデックス(単語1次インデックステーブル)161aおよび図6に示す2次インデックス(単語2次インデックステーブル)161bを有している。図5に示すように、1次インデックス161aは、漢字とそのコードと、その漢字を先頭として持つ単語の2次インデックス161bでのアドレスが対応付けられている。2次インデックス161bは、漢字と第2文字目の漢字の先頭ピンインと、その単語対応情報162でのアドレスが対応付けられている。図6の2次インデックス161bの左の記載(widx_di、widx_gi等)は、2次インデックス161b内でのアドレスである。 Further, the
さらに、単語対応情報162は、図7に示すように、単語とその読みのピンインが対応付けられている。図7の単語対応情報162の左の記載(wp_di、wp_gi等)は、単語対応情報162内でのアドレスである。なお、漢字対応情報144にて、漢字コードとピンインとが対応している場合には、1次インデックス161aは必ずしも必要ではない。 Furthermore, as shown in FIG. 7, the
(実施例5−1)
本実施例では、上記説明した文字変換装置1を、ピンインを入力して漢字に変換する中国語変換装置として説明するが、これに限定されず、例えばひらがな(あるいはカタカナ)を入力して漢字を含む単語を決定する装置であってもよい。(Example 5-1)
In the present embodiment, the above-described
具体的に、ユーザが「外字1」を入力するために、「外字2」の中国読みであるピンインの「mei」を入力した場合について説明する。 Specifically, a case where the user inputs “Mei” of Pinyin, which is a Chinese reading of “
初めに、漢字検索の処理について説明する。なお、入力読みと漢字情報の読みとが一致する条件は、入力読みが漢字情報の読みに前方一致であることとする。 First, the kanji search process will be described. Note that the condition that the input reading matches the reading of the kanji information is that the input reading matches the reading of the kanji information forward.
(漢字検索)
辞書検索部310の漢字取得部311は、一時記憶部3から読み文字列「mei」を辞書検索部310の内部バッファに読み込む。そして、辞書検索部310は読み文字の先頭文字「m」を基に以下の式で漢字インデックス145の「m」の範囲のアドレスを求め、それらのアドレスに記述している漢字アドレスを内部バッファに記憶する。(Kanji search)
The kanji acquisition unit 311 of the
アドレスは、
(1)入力読みに四声コードがある場合
先頭アドレス=(入力読みの文字コード−ベースの読みの文字コード)
×漢字インデックスの単位サイズ×5
+(入力読みの四声コード−1)×漢字インデックスの単位サイズ
終了アドレス=(入力読みの文字コード−ベースの読みの文字コード)
×漢字インデックスの単位サイズ×5
+入力読みの四声コード×漢字インデックスの単位サイズ
(2)入力読みに四声コードが無い場合
先頭アドレス=(入力読みの文字コード−ベースの読みの文字コード)
×漢字インデックスの単位サイズ×5
終了アドレス=(入力読みの文字コード−ベースの読みの文字コード+1)
×漢字インデックスの単位サイズ×5
として決定される。The address is
(1) When there is a four-voice code in the input reading Start address = (Character code of input reading-Character code of base reading)
× Kanji index unit size × 5
+ (Input reading four-voice code-1) x Kanji index unit size end address = (input reading character code-base reading character code)
× Kanji index unit size × 5
+ Input reading four-voice code x Kanji index unit size (2) When there is no four-voice code in the input reading Start address = (Character code of input reading-Character code of base reading)
× Kanji index unit size × 5
End address = (Character code of input reading-Character code of base reading + 1)
× Kanji index unit size × 5
As determined.
上記アドレスを決定する、「5」を掛けているのは、次の理由からである。中国語の発音は、ピンインや注音のように読みを表す部分と発声の上げ下げ(調子)を表す声調(四声)の組み合せである。声調が5種類(1〜4声と軽声)あるので、5としている。 The reason why the address is determined by “5” is as follows. Chinese pronunciation is a combination of a part that represents reading, such as Pinyin and phoning, and a tone (four voices) that represents the ups and downs (tone) of the utterance. Since there are five types of tone (1 to 4 voices and light voices), it is set to 5.
ピンインによる中国語入力では、ピンインはアルファベットで表現されるので、ベースの読みの文字コードは「a(=0x61(アスキーコード))」とし、注音による中国語入力では、ベースの読みの文字コードは「 In Chinese input by Pinyin, Pinyin is expressed in alphabet, so the character code of the base reading is “a” (= 0x61 (ASCII code)). "
(=0xa373)」とすればよい。(= 0xa373) ".
漢字インデックス(漢字インデックテーブル)41の単位サイズは、単語インデックス(単語インデックテーブル)51をピンインの先頭文字のアルファベット順とし、同じピンインの先頭文字は四声の1から5の順に並ぶように構成していれば、漢字アドレスのバイト長となる。例えば、本実施として動作している装置では4バイトとなっている。 The unit size of the kanji index (kanji index table) 41 is configured so that the word index (word index table) 51 is in alphabetical order of the first characters of Pinyin, and the first characters of the same Pinyin are arranged in the order of 1 to 5 of the four voices. If so, it is the byte length of the Kanji address. For example, a device operating as the present embodiment has 4 bytes.
ここでは、四声コードはないので、「m(=0x6d)」の範囲のアドレスは(2)式により、先頭アドレスが「(0x6d−0x61)×漢字インデックスの単位サイズ×5」(つまり、図3のcidx_m1)、終了アドレスが「(0x6d−0x61+1)×漢字インデックスの単位サイズ×5」(つまり、図3のcidx_n1)によって計算され、各アドレスが指し示す漢字インデックスに記述している漢字アドレス(cp_m1、及びcp_n1)を内部バッファに記憶する。図3のcidx_m1は、読みの先頭がmで1声のもの、の漢字インデックス145内でのアドレスを表している。それに対応するcp_m1は、読みの先頭がmで1声の読みの漢字対応情報144のアドレスを表している。cidx_m5、cp_m5は読みの先頭がmで軽声に対応している。 Here, since there is no four-voice code, the address in the range of “m (= 0x6d)” is represented by the formula (2), and the head address is “(0x6d-0x61) × unit size of kanji index × 5” (that is, FIG. 3), and the end address is calculated by “(0x6d-0x61 + 1) × unit size of kanji index × 5” (that is, cidx_n1 in FIG. 3), and the kanji address (cp_m1) described in the kanji index indicated by each address , And cp_n1) are stored in the internal buffer. CIDX_M1 in FIG. 3 represents an address in the
なお、(0x6d−0x61)=12であり、(0x6d−0x61+1)=13となる。 Note that (0x6d-0x61) = 12, and (0x6d-0x61 + 1) = 13.
辞書検索部310は、検索対象のアドレスcpiをcp_m1とする。次に辞書検索部310は、漢字対応情報144からアドレスcpiの漢字情報を読み込み、入力ピンイン数を基に検索条件を判定する。その結果、検索条件を満足していれば、入力読みと漢字情報の読みとの比較を行い、入力読みが漢字情報の読みに前方一致であれば一致したものとして一時記憶部3に該漢字情報を記憶し、cpiのみ更新する。 The
図4に示す漢字対応情報144の例では、検索条件を以下のようにしている。
検索条件は、
0:無条件に検索対象とする
1:入力ピンイン数が1文字であれば、検索対象としない
2:入力ピンイン数が2文字以下であれば、検索対象としない
3:入力ピンイン数が3文字以下であれば、検索対象としない
とする。In the example of the
The search condition is
0: Unconditionally search target 1: If the number of input pinyins is 1 character, it is not searched 2: If the number of input pinyins is 2 characters or less, it is not searched 3: The number of input pinyins is 3 characters In the following cases, it is not considered as a search target.
入力ピンインが「mei」の場合、入力ピンイン数が3であるため、検索条件が0、1、2に対応している漢字が、検索処理の対象となる。 When the input pinyin is “mei”, since the number of input pinyins is 3, the Chinese characters corresponding to the
上記処理は、cpiがcp_n1に等しくなるまで処理を継続し、cpiがcp_n1と等しくなれば、一時記憶部3に記憶している漢字情報を補助情報のひとつである出現頻度で並べ換えを行い、漢字検索処理を終了する。 The above process continues until cpi is equal to cp_n1, and if cpi is equal to cp_n1, the kanji information stored in
なお、上記説明では、四声コードの入力が行われない場合で説明したが、四声コード付きで「mei3」が入力された場合は、「m」の第3声のアドレスが上記(1)式により計算され、先頭アドレスが「(0x6d−0x61)×漢字インデックスの単位サイズ×5+(3−1)×漢字インデックスの単位サイズ」(つまり、図3のcidx_m3)、終了アドレスが「(0x6d−0x61)×漢字インデックスの単位サイズ×5+3×漢字インデックの単位サイズ」(つまり、図3のcidx_m4)となり、各アドレスが指し示す漢字インデックスに記述している漢字アドレス(cp_m3、及びcp_m4)を内部バッファに記憶する。 In the above description, the case where a four-voice code is not input has been described. However, when “mei3” is input with a four-voice code, the address of the third voice of “m” is the above (1). The start address is “(0x6d-0x61) × unit size of kanji index × 5 + (3-1) × unit size of kanji index” (that is, cidx_m3 in FIG. 3), and the end address is “(0x6d− 0x61) × unit size of kanji index × 5 + 3 × unit size of kanji index ”(that is, cidx_m4 in FIG. 3), and kanji addresses (cp_m3 and cp_m4) described in the kanji index indicated by each address are stored in the internal buffer. Remember.
なお、漢字アドレスを求めた後の処理は上記検索処理と同様であるため説明を省略する。 Note that the processing after obtaining the kanji address is the same as the search processing described above, and therefore the description thereof is omitted.
(単語検索)
以下に単語検索の説明を行う。具体的に、ユーザが「外字1」の中国読みであるピンインの「mei」を入力し、漢字検索結果が一時記憶部3に保持され、表示制御部22表示装置に表示した後に漢字検索結果から「外字2」を指示入力したもとのして説明を行う。(Word search)
The word search is explained below. Specifically, the user inputs Pinyin's “mei”, which is a Chinese reading of “
単語辞書部42の1次インデックス161aは、図5に示すように、漢字コードの昇順に記憶されているものとする。 As shown in FIG. 5, the
制御部10は、ユーザの指示位置(X1、Y1)と一時記憶部3に記憶している漢字検索結果の表示位置(xi_min、yi_min、xi_max、yi_max)(i=1〜n、nは候補数)を比較し、xi_min≦X1≦xi_maxかつyi_min≦Y1≦yi_maxが成立するときに,i番目の候補が選択されたものと判断し、対応する漢字を辞書検索部310に転送し、単語検索を行うことを指示する。 The
辞書検索部310は、単語検索の指示を受けると、転送された漢字のコードに一致する単語インデックス161を検索し、単語対応情報162での検索対象の範囲を求める。具体的には、辞書検索部310は、転送された「外字2」について、1次インデックス161aを2分探索し、「外字2」と一致する漢字コードC3BFを取得する。そして、漢字コードC3BFに対応する2次インデックス161b内のアドレス「widx_mi」を用いて、2次インデックス161bを参照し、「外字2」が先頭の単語の単語対応情報162におけるアドレス(単語アドレス)「wp_mi」を、「外字2」が先頭の単語対応情報162での開始アドレスとして内部バッファに記憶する。さらに、辞書検索部310は、1次インデックス161aにおいてC3BFの次の漢字コードC3C0(図5中の Upon receiving a word search instruction, the
(以下では「外字6」とする))の2次インデックスのアドレス「widx_mi+l」を用いて、2次インデックス161bを参照し、「外字6」が先頭の単語の単語対応情報162におけるアドレス(単語アドレス)「wp_mi+l」を、「外字2」が先頭の単語対応情報162での終了アドレスとして内部バッファに記憶する。The
その後、辞書検索部310の単語取得部312は、「wp_mi」から「wp_mi+l」までの単語情報を読み出し、単語情報の漢字列を検索結果として、一時記憶部3に記憶する。そして、候補順序決定部32が、一時記憶部3の単語情報(候補単語)の補助情報(図示せず)である出現頻度の高い順に並べ替えを行い、単語検索処理を終了する。なお、この並べ替えは単なる例示であり、他の方法で並べ替えてもよい。例えば、候補順序決定要素(要素A〜要素G)に基づいて、表示順序を決定してもよい。最後に、上記したように、検索され並べ替えられた単語を、表示部12に表示する。 Thereafter, the
(実施例5−2)
本実施例5−2では、ユーザが単語を入力するために、単語の読みを入力した場合の動作を説明する。ここで、実施例5−1では、入力したい文字列の先頭文字の読みを入力するのに対して、本実施例5−2では、入力したい単語の読みを入力するとの違いがある。しかし、入力部11から入力された読み文字列を制御部10の入力受付部21が受け付ける処理は実施例5−1と同様となる。そのため、本実施例ではユーザが「外字1」を入力するために「外字1」の中国読みであるピンインの「meinian」を入力した後の処理を説明する。(Example 5-2)
In Example 5-2, an operation when the user inputs a word reading to input a word will be described. Here, in Example 5-1, a reading of the first character of a character string to be input is input, whereas in Example 5-2, a reading of a word to be input is input. However, the process in which the
なお、制御部10は、入力読みの文字列のピンインを分割する機能を備えているものとする。入力読み文字列のピンインの分割処理は後述する。 It is assumed that the
制御部10は、入力部11から読み文字列を「meinian」を受けると、読み文字列をピンインに分割し、分割結果として、「mei」と「nian」とでピンインに分割されたものが2つあることを示す分割数(あるいは、分割位置が2つあることを示す分割位置数)2を一時記憶部3に記憶する。 When the
辞書検索部310の漢字取得部311は、一時記憶部3から読み文字列「mei」を読み込み、辞書検索部310の内部バッファに記憶する。漢字取得部311は、「mei」の先頭文字「m」を基に前記(2)式を用いて、漢字インデックス145を参照して、「m」の範囲のアドレスを求め、それらのアドレスに記述している漢字アドレスを内部バッファに記憶する。 The kanji acquisition unit 311 of the
ここでも四声コードがないので、先頭アドレスが「(0x6d−0x61)×漢字インデックスの単位サイズ×5」(つまり、図3のcidx_m1)、終了アドレスが「(0x6d−0x61+1)×漢字インデックスの単位サイズ×5」(つまり、図3のcidx_n1)によって計算され、漢字辞書部41の漢字インデックス145を参照し、各アドレスが指し示す漢字アドレス(cp_m1、及びcp_n1)を内部バッファに記憶する。 Here, since there is no four-voice code, the start address is “(0x6d-0x61) × unit size of kanji index × 5” (that is, cidx_m1 in FIG. 3), and the end address is “(0x6d-0x61 + 1) × unit of kanji index. The kanji address (cp_m1 and cp_n1) indicated by each address is stored in the internal buffer by referring to the
辞書検索部310の漢字取得部311は、検索対象のアドレスcpiをcp_m1とする。次に漢字取得部311は、アドレスcpiの漢字情報を読み込み、漢字対応情報144を参照し、入力ピンイン数を元に検索条件を判定する。その結果、検索条件を満足していれば、入力読みと漢字情報の読みとを比較する。 The kanji acquisition unit 311 of the
入力読みが漢字情報の読みと完全一致であれば、一時記憶部3に該漢字情報と完全一致であること(例えば、1)を対応付けて記憶して、cpiを更新する。 If the input reading is completely coincident with the reading of the kanji information, the
入力読みが漢字情報の読みに前方一致であれば一致したものとして一時記憶部3に該漢字情報と前方一致であること(例えば、0)を対応付けて記憶して、cpiを更新する。 If the input reading matches the reading of the kanji information, the
完全一致あるいは前方一致でなければ、cpiのみ更新する。 If it is not an exact match or a forward match, only cpi is updated.
そして、cpiがcp_n1と等しくなれば、候補順序決定部32が、一時記憶部3に記憶している漢字情報のうち、完全一致の漢字情報を出現頻度で並べ換えを行い、さらに、前方一致の漢字情報を完全一致の漢字情報より候補順位が下位となるように出現頻度で並べ替えを行い、漢字検索処理を終了する。候補順序決定部32は、さらに、他の補助情報(例えば、候補順序決定要素(要素A〜要素G))に基づいて、表示順序を決定してもよい。 If cpi is equal to cp_n1, the candidate
上記処理にて、読み文字列「mei」に対して、「mei」に完全一致の漢字情報として「外字2」の漢字情報が検索結果として一時記憶部3に記憶されている。 In the above processing, for the reading character string “mei”, the kanji information of “
次に単語検索処理の説明を行う。 Next, the word search process will be described.
上記の漢字検索後に表示された漢字検索候補からユーザが「外字2」を指示したものとして説明する。なお、ユーザが「外字2」の指示に対する候補選択の処理は、実施例5−1に記載の処理と同様であるため説明を省略する。 A description will be made assuming that the user has designated “
また、1次インデックス161a、2次インデックス161b、及び単語対応情報162は、漢字コードの昇順に並んでいるものとする。 In addition, the
辞書検索部310の単語取得部312は、単語検索の指示を受けると、単語インデックス161の1次インデックスを参照して、転送された漢字のコードに一致する第1のインデックス情報を取得する。例えば、1次インデックスでは、単語の先頭漢字の漢字コード順に並んでおり、単語取得部312は、2分探索により転送された漢字のコードと一致する第1のインデックス情報を検索して、転送された漢字コードに一致する第1のインデックス情報と、1次インデックス内で並べられている次の漢字コードの第1のインデックス情報と、を内部バッファに記憶する。 When receiving a word search instruction, the
ここでは、ユーザは「外字2」を指示しているので、1次インデックス161aにおいて、漢字コードに一致する2次インデックスアドレスはwidx_mi、次の漢字コードの2次インデックスアドレスはwidx_mi+lであり、これらが内部バッファに記憶される。 Here, since the user designates “
辞書検索部310の単語取得部312は、一時記憶部3から分割した読み文字列の2番目以降の文字列を内部バッファに読み込む。辞書検索部310は、1番目の分割した読みで検索された漢字(先頭漢字、1文字目漢字)と、2番目の分割された読みの先頭ピンイン文字とで単語対応情報162の検索範囲を絞るために、1次インデックス161aに付加されている2次インデックス161bのアドレスを基に、2番目の分割された読みの先頭文字「n」と一致するものを、2次インデックス161bにて検索し、内部バッファに検索された2次インデックス161bと、2次インデックス161b内で並べられている次の第2のインデックス情報を記憶する。ここでは、1文字目の漢字「外字2」と2番目の分割読みの先頭文字「n」とに一致する2次インデックス情報wp_mi、および、2次インデックス内で並べられている次の2次インデックス情報wp_mi+k、が内部バッファに記憶される。 The
辞書検索部310の単語取得部312は、検索対象のアドレスwpiを第2インデックス情報に付加されている単語情報のアドレスwp_miとする。「wp_mi」から「wp_mi+k」までの単語情報を読み出しここで、単語対応情報162での単語情報の読みは、単語の各漢字とを対応付けるため、例えば、「外字1」の読みを「MeiNian」のように単語の各漢字に対応する読みの先頭部分を大文字表記されているものとする。 The
次に辞書検索部310の単語取得部312は、アドレスwpiの単語情報を読み込み、単語対応情報162を参照して、単語対応情報162の漢字の個数と入力読みの分割数を比較する。単語情報の漢字の個数が入力読みの分割数以下であれば、単語情報の各漢字に対応する読みと分割読みを先頭から比較し、読みが完全一致の漢字数と読みが前方一致の漢字数をカウントする。 Next, the
「単語情報の漢字の個数」と「読みが完全一致の漢字数+読みが前方一致の漢字数」が一致すれば、一時記憶部3に単語情報と読みが完全一致の漢字数と読みが前方一致の漢字数を記憶し、wpiを更新する。「単語情報の漢字の個数」と「読みが完全一致の漢字数+読みが前方一致の漢字数」が一致しなければ、wpiを更新する。 If the “number of kanji characters in word information” and “number of kanji characters whose readings are completely matched + the number of kanji characters whose readings are forward matching” match, the number of kanji characters whose readings are completely matched with the word information in the
そして、wpi<wp_mi+kであれば処理を継続し、wpi=wp_mi+kとなれば、処理を終了する。 If wpi <wp_mi + k, the process is continued. If wpi = wp_mi + k, the process ends.
辞書検索部310は、一時記憶部3に記憶している単語情報において、以下の条件で順位付けを行う。
(i)読みの分割数と「読みが完全一致の漢字数+読みが前方一致の漢字数」とが等しい単語情報
・「読みが完全一致の漢字数」が多いほど上位候補とする
・「読みが完全一致の漢字数」が同じものは、出現頻度で順位付ける
(ii)読みの分割数と「読みが完全一致の漢字数+読みが前方一致の漢字数」とが等しくない単語情報
・「読みが完全一致の漢字数」が多いほど上位候補とする
・「読みが完全一致の漢字数」が同じものは、出現頻度で順位付ける
最終的にユーザが表示された検索結果から所望の文字列を選択することで、入力が行われるが、上記(i)の条件に対応する検索結果を選択すると、新たに読み文字列の入力を行うことになるが、(ii)の条件に対応する検索結果を選択した場合は、入力した読み文字列の一部に対応するため、選択した文字列に対応する読み文字列を除く読み文字列を制御部10の入力読みとして上記処理を繰り返すことができる。The
(I) Word information in which the number of reading divisions is equal to “the number of Kanji characters whose readings are completely matched + the number of Kanji characters whose readings are the same as the preceding characters” (Ii) Word information where the number of reading divisions is not equal to the number of Kanji characters whose readings are exact matches + the number of Kanji characters whose readings are front-matched. The higher the number of “Kanji with perfect matching”, the higher the candidate. ・ If the “Number of Kanji with perfect reading” is the same, rank them by frequency of appearance. However, if a search result corresponding to the above condition (i) is selected, a new reading character string is input, but a search corresponding to the condition (ii) is performed. If you select a result, it will be part of the entered reading string. To respond, it is possible to repeat the above processing read character string except the read character string corresponding to the selected character string as input to read in the
上記説明では、単語検索で単語情報の漢字の個数と「読みが完全一致の漢字数+読みが前方一致の漢字数」が一致したときのみ単語検索結果としている。しかし、単語情報の漢字の個数が「読みが完全一致の漢字数+読みが前方一致の漢字数」より多い場合も単語検索結果としてもよい。このような構成にすることで、所望の単語の先頭から数文字分の読みだけで入力することが可能となる。 In the above description, the word search result is obtained only when the number of kanji in the word information matches “the number of kanji whose reading is completely matched + the number of kanji whose reading matches the front” in the word search. However, the word search result may also be used when the number of kanji in the word information is larger than “the number of kanji whose readings are completely matched + the number of kanji whose readings are forward matching”. With such a configuration, it is possible to input by reading only a few characters from the beginning of a desired word.
また、上記説明では、表示された漢字検索結果から所望の漢字をユーザが選択することで単語検索を開始している。しかし、漢字検索が終了した後で、漢字検索結果を表示せずに候補順位1位の漢字について単語検索を開始し、単語検索が完了したときに検索結果を表示してもよい。あるいは、漢字検索が終了した後で、漢字検索結果を表示せずに候補の一部もしくは全部について単語検索を開始し、単語検索が完了したときに検索結果を表示してもよい。 In the above description, the word search is started by the user selecting a desired kanji from the displayed kanji search result. However, after completing the kanji search, the word search may be started for the kanji ranked first in the candidate ranking without displaying the kanji search result, and the search result may be displayed when the word search is completed. Alternatively, after completing the kanji search, the word search may be started for some or all of the candidates without displaying the kanji search result, and the search result may be displayed when the word search is completed.
次に、入力読みのピンイン(n文字)の分割処理について説明する。ここで分割の単位を音節と呼ぶ。 Next, an input reading pinyin (n character) dividing process will be described. Here, the unit of division is called a syllable.
分割処理は、以下のように行う。
(a)分割位置iを1にする
(b)先頭文字からi文字目を第1音節とし、i+1文字目から韻母、声母、声母+韻母として成立する最長のピンインを求め、第2音節とする
(c)i文字目の分割位置の評価値(以下、位置評価値と称する)として、第1音節長+第2音節長を保持する
(d)分割位置iに1を加算し(i=i+1)、i>nであれば(e)、そうでなければ(b)へ処理を移す
(e)最大位置評価値を有するものとして処理された分割位置の個数により、最終的な分割位置を確定する
(e−1)最大位置評価値を有するものとして処理された分割位置の個数が1の場合
最大位置評価値を有するものとして処理された分割位置を最終的な分割位置とする
(e−2)最大位置評価値を有するものとして処理された分割位置が複数個ある場合
(1)1音節だけで構成されている
(2)第1音節、第2音節とも2文字以上
(3)第1音節の文字数が第2音節よりも多い
の順に、上位の条件を有する分割位置を最終的な分割位置とする
具体例として、「meinian」の分割処理について説明する。入力ピンインの一部或いは全部がピンインとして成立するか否かは、ピンイン辞書に登録されているピンインと比較し、一致するピンインがあればピンインとして成立する可能性があるとする。ピンイン辞書は、図9に示すように、ピンインとして成立する可能性のある長さ1から7のピンインが登録されている。The division process is performed as follows.
(A) The division position i is set to 1. (b) The i-th character from the first character is set as the first syllable, and the longest pinyin that is established as the final, final, and initial + final from the i + 1th character is obtained, and the second syllable is obtained. (C) The first syllable length + the second syllable length is held as the evaluation value (hereinafter referred to as the position evaluation value) of the i-th character division position. (D) 1 is added to the division position i (i = i + 1). ), If i> n (e), otherwise move to (b) (e) determine the final division position based on the number of division positions processed as having the maximum position evaluation value (E-1) When the number of division positions processed as having the maximum position evaluation value is 1 The division position processed as having the maximum position evaluation value is set as the final division position (e-2 ) Multiple split positions processed as having the maximum position evaluation value (1) It consists of only one syllable (2) Two or more characters in both the first and second syllables (3) The first syllable has more characters than the second syllable As a specific example, the division process of “mainian” is described as the final division position. Whether or not part or all of the input pinyin is established as a pinyin is compared with the pinyin registered in the pinyin dictionary, and if there is a matching pinyin, there is a possibility that it is established as a pinyin. In the pinyin dictionary, as shown in FIG. 9, pinyins having a length of 1 to 7 that may be established as pinyin are registered.
ここで、入力ピンインとは、ピンインとして入力された文字列であり、
(1)ピンインとして登録されている文字あるいは文字列そのもの
(2)ピンインとして登録されている文字あるいは文字列が組み合わされた文字列
(3)(1)(2)以外の文字列(間違い入力の場合)
の3種類がある。 Here, the input pinyin is a character string input as pinyin,
(1) Character or character string registered as Pinyin itself (2) Character string or character string registered as Pinyin (3) Character string other than (1) (2) If)
There are three types.
なお、本実施形態5において、分割処理時に算出される位置評価値は、入力ピンインを2音節に区切るための区切り位置を決定する場合に、その位置で音節が区切られる尤もらしさを数値化したものである。この位置評価値は、音節区切り位置ごとに算出される。したがって、上述の実施形態1〜4で用いられた、候補漢字/候補単語ごとに算出される評価値(候補漢字/候補単語がユーザに選択される可能性の大きさを示す評価値)とは区別される。 In the fifth embodiment, the position evaluation value calculated at the time of the division process is obtained by quantifying the likelihood that the syllable is divided at that position when the separation position for dividing the input Pinyin into two syllables is determined. It is. This position evaluation value is calculated for each syllable break position. Therefore, the evaluation value (evaluation value indicating the possibility that the candidate kanji / candidate word is selected by the user) calculated for each candidate kanji / candidate word used in the first to fourth embodiments described above. Differentiated.
入力ピンイン「meinian」の分割位置iを1とする。先頭文字「m」を用いて、図8で示すピンイン辞書インデックス(ピンイン辞書インデックステーブル)を参照し、先頭文字が「m」で1文字のピンイン辞書アドレスpr_m1及び2文字のピンイン辞書アドレスpr_m2を読み込む。そして、ピンイン辞書のpr_m1からpr_m2までに記憶されているピンインと比較する。この場合、「m」は存在するので、ピンインとして成立する。 The division position i of the input pinyin “mainian” is set to 1. With reference to the Pinyin dictionary index (pinyin dictionary index table) shown in FIG. 8 using the first character “m”, the first character “m” and the one character Pinyin dictionary address pr_m1 and the two character Pinyin dictionary address pr_m2 are read. . And it compares with the pinyin memorize | stored from pr_m1 to pr_m2 of a pinyin dictionary. In this case, since “m” exists, it is established as pinyin.
次に、「m」を除く「einian」を第2音節とし、先頭文字が「e」で6文字のピンイン辞書アドレスpr_e6及び7文字のピンイン辞書アドレスpr_e7を読み込み、pr_e6からpr_e7までに記憶されているピンインと比較する。一致するピンインがあれば、1文字目の位置評価値が7となるが、一致するピンインが無い場合は、第2音節の最終文字から1文字減らして新しい第2音節とし、同様にピンイン辞書と比較し、一致するピンインがあれば、そのときの第2音節の長さ+第1音節の長さ(ここでは1)を分割位置1の位置評価値とする。一致するピンインが無い場合には、さらに、第2音節の最終文字から1文字減らして、ピンイン辞書と比較するという処理を行い、これを、位置評価値が出るまで繰り返す。 Next, “einian” excluding “m” is set as the second syllable, the first character is “e”, the six-character Pinyin dictionary address pr_e6 and the seven-character Pinyin dictionary address pr_e7 are read and stored from pr_e6 to pr_e7. Compare with Pinyin. If there is a matching pinyin, the position evaluation value of the first character is 7. However, if there is no matching pinyin, one character is reduced from the last character of the second syllable to form a new second syllable, and similarly the Pinyin dictionary and If there is a matching Pinyin, the length of the second syllable + the length of the first syllable (here, 1) is set as the position evaluation value of the
上記処理が終わると、入力ピンイン「meinian」の分割位置iをi=i+1(=2)とする。そこで、先頭文字から2文字「me」を元にピンイン辞書インデックステーブルから「m」が先頭の2文字のピンイン辞書アドレスpr_m2からpr_m3までに記憶されているピンインと比較する。「me」が存在すれば、第1音節を「me」とする。次に「me」を除く「inian」を第2音節とし、同様にピンイン辞書に一致するピンインがあるかを検索する。先頭から切り出し位置7までの処理を行い、最大位置評価値の分割位置の評価を行う。図10では、最大位置評価値が7であり、最大位置評価値が7となる分割位置の個数が1なので、最終分割位置を3と確定する。なお、図10では、分割位置が3のものについての、「分割位置数2」とは、「mainian」は、第3文字iと第4文字nの間に1つの目の分割位置があり、第7文字nとその後(文字はなし)の間に2つ目の分割位置があるとここでは判断されているので、よって、分割位置が2つあるいうことを示している。 When the above process is completed, the division position i of the input pinyin “mainian” is set to i = i + 1 (= 2). Therefore, based on the two characters “me” from the first character, “m” from the Pinyin dictionary index table is compared with the Pinyin stored from the Pinyin dictionary addresses pr_m2 to pr_m3 of the first two characters. If “me” exists, the first syllable is set to “me”. Next, “inian” excluding “me” is set as the second syllable, and similarly, it is searched whether there is a pinyin that matches the pinyin dictionary. Processing from the beginning to the
次に、分割位置までのピンインを除く「nian」について、上記と同様の処理を繰り返し、入力ピンインの分割位置を求める。「nian」では、図11に示すように、分割位置が求まり、位置評価値4の分割位置は2個あるので、1音節で構成されている「nian」が選択され、分割位置4が求まる。 Next, the same processing as described above is repeated for “nian” excluding pinyin up to the dividing position, and the dividing position of the input pinyin is obtained. In “nian”, as shown in FIG. 11, the division position is obtained, and there are two division positions of the
分割位置までのピンインを除くと、残りのピンインが無いので、入力ピンインの先頭位置からの位置に補正(分割位置3、7)し、処理を終了する。 If the pinyin up to the division position is excluded, there is no remaining pinyin, so the input pinyin is corrected to the position from the head position (division positions 3 and 7), and the process ends.
なお、以上では、ピンインに対する分割処理について説明したが、注音についても同様に注音テーブルを構成することで、上記処理にて分割を行うことができる。ピンイン辞書のインデックステーブルは、ピンインの最大長が7であるため、各ピンインの先頭文字について、長さ1から7までの7個単位で構成している。他方で、注音の最大長は、4であるため、各注音の先頭文字について、長さ1から4までの4個単位で構成すればよい。 In addition, although the division | segmentation process with respect to Pinyin was demonstrated above, it can divide | segment by the said process by comprising a sound-injection table similarly about sound-injection. The index table of the Pinyin dictionary has a maximum Pinyin length of 7, so the first character of each Pinyin is composed of 7 units of length 1-7. On the other hand, since the maximum length of the sound injection is 4, the first character of each sound injection may be configured in units of 4 from
以上で説明したように本願発明では、同一先頭漢字の単語をグループ化し、漢字辞書及び単語辞書に入力ピンインに応じて検索対象を制限するための情報を持っている。具体的には、漢字辞書は、ピンインの長さに応じた検索対象か否かの情報を持っている。単語辞書は、インデックス情報に2文字目漢字の読みの先頭文字を持っており、ピンイン列(漢字n文字分)を分割し、漢字検索された1文字目漢字と2文字目の先頭読みから単語検索対象を制限できる。このような構成であるため、検索条件に一致するものを検索するので、語彙数を増加しても、入力文字列と読みの情報の比較を行う回数が制限され、応答速度の速い文字列入力装置を提供することができる。読みの入力が入力したい漢字の2文字目以降の読みを入力すると、さらに単語の検索対象を絞ることができるので、検索処理の速い文字変換装置を提供することができる。 As described above, in the present invention, words having the same leading kanji are grouped, and the kanji dictionary and the word dictionary have information for limiting the search target according to the input pinyin. Specifically, the Chinese character dictionary has information on whether or not it is a search target corresponding to the length of Pinyin. The word dictionary has the first character of the reading of the second character in the index information, divides the Pinyin sequence (n characters of kanji), and the word from the first character and the second character of the first character searched Search target can be limited. Because of this structure, search for items that match the search conditions, so even if the number of vocabulary is increased, the number of comparisons between the input character string and reading information is limited, and character string input with a fast response speed An apparatus can be provided. When the reading of the second and subsequent characters of the kanji to be input is input, the word search target can be further narrowed down, so that a character conversion device with a fast search process can be provided.
さらに、上述の検索処理によって求まった漢字(単語)の候補は、候補ごとに対応付けられている補助情報(あるいは、候補順序決定要素)に基づいて、ユーザによって選択される可能性が高いものほど優先して表示されるような順序に並べ替えて表示するので、候補を表示するまでの応答時間を短縮できる上に、ユーザが所望する順序で候補を表示することができるので、ユーザの利便性をさらに向上させることが可能となる。 Furthermore, candidates for kanji (words) obtained by the above-described search process are more likely to be selected by the user based on auxiliary information (or candidate order determination elements) associated with each candidate. Since the images are rearranged in the order in which they are displayed with priority, the response time until the candidates are displayed can be reduced, and the candidates can be displayed in the order desired by the user. Can be further improved.
最後に、文字変換装置1の各ブロック、特に候補順序決定部32、辞書検索部310、表示制御部22、および制御部10は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。具体的には、記録部40、漢字辞書部41、単語辞書部42、一時記憶部3はメモリ、ハードディスクなどの記憶装置によって実現され、候補順序決定部32、辞書検索部310、表示制御部22、制御部10はコンピュータの中央演算装置(CPU)及びCPUに実行されるソフトウェアにより実現される。このソフトウェアも記憶装置に格納され、メモリに読み出されてCPUにより実行される。 Finally, each block of the
つまり、文字変換装置1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである文字変換装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記文字変換装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。 That is, the
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。 Examples of the recording medium include a tape system such as a magnetic tape and a cassette tape, a magnetic disk such as a floppy (registered trademark) disk / hard disk, and an optical disk such as a CD-ROM / MO / MD / DVD / CD-R. Card system such as IC card, IC card (including memory card) / optical card, or semiconductor memory system such as mask ROM / EPROM / EEPROM / flash ROM.
また、文字変換装置1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。 Further, the
以上のように、本発明に係る文字変換装置は、入力された1以上の表音文字よりなる入力文字列を変換文字に変換し、当該変換文字からなる単語を決定できる文字変換装置において、
(a−1)変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報および、(a−2)入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、
(b−1)単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報および、(b−2)単語の先頭となる先頭変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す先頭変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、
(c)入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得手段と、
(d)取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得手段と、
を備えている。As described above, the character conversion device according to the present invention is a character conversion device that converts an input character string composed of one or more input phonograms into a converted character and can determine a word composed of the converted character.
(A-1) conversion character identification information for identifying a conversion character and conversion character correspondence information in which conversion character phonetic information indicating the phonetic of the conversion character is associated, and (a-2) input And the converted character storage location information indicating the storage location in the converted character correspondence information of the converted character identification information having the phonetic character as the head of the converted character phonetic information. A converted character dictionary having a converted character index;
(B-1) word correspondence information in which word identification information for identifying a word and word phonetic information indicating the phonetic expression of the word are associated with each other, and (b-2) head conversion that becomes the head of the word First conversion character identification information for identifying a character is associated with word storage destination information indicating the storage destination of the word having the first conversion character indicated by the first conversion character identification information in the word correspondence information. A word dictionary having a word index,
(C) Conversion with reference to the converted character dictionary based on the first phonogram of the input character string that is input, and having the first phonogram of the input character string as the head of the converted character phonogram information First conversion character acquisition means for acquiring character identification information;
(D) a word acquisition unit that refers to the word dictionary based on the acquired head conversion character identification information and acquires a word having a conversion character at the head indicated by the head conversion character identification information;
It has.
また、本発明に係る文字変換装置は、上記構成に加え、上記先頭変換文字取得手段が取得した先頭変換文字識別情報が示す先頭変換文字を、ユーザが選択可能に表示部に表示する表示制御手段と、上記ユーザにより選択された先頭変換文字を受け付ける受付手段と、を備え、上記単語取得手段は、上記選択された先頭変換文字の先頭変換文字識別情報に基づいて、単語を取得する処理を行ってもよい。 In addition to the above configuration, the character conversion device according to the present invention includes a display control unit that displays the first conversion character indicated by the first conversion character identification information acquired by the first conversion character acquisition unit on the display unit in a selectable manner by the user. And receiving means for receiving the first conversion character selected by the user, wherein the word acquisition means performs processing for acquiring a word based on the first conversion character identification information of the selected first conversion character. May be.
上記構成によると、ユーザが選択した先頭変換文字に基づいて、つまり、先頭変換文字を絞って、単語を取得することができる。 According to the above configuration, a word can be acquired based on the first conversion character selected by the user, that is, by narrowing down the first conversion character.
また、本発明に係る文字変換装置は、上記構成に加え、上記変換文字対応情報では、さらに、上記変換文字識別情報に、該変換文字識別情報が示す変換文字についての表示補助情報が対応付けられており、上記表示制御手段は、上記表示補助情報に基づき、先頭変換文字を並べ替えて、ユーザが選択可能に表示部に表示してもよい。 In addition to the above configuration, the character conversion device according to the present invention further includes display auxiliary information associated with the converted character indicated by the converted character identification information in the converted character correspondence information. The display control means may rearrange the head conversion characters on the basis of the display auxiliary information and display them on the display unit so that the user can select them.
上記構成によると、表示補助情報に基づき、先頭変換文字を並べ替えて、ユーザが選択可能に表示部に表示することができる。表示補助情報とは、例えば、その漢字の出現頻度の情報であってもよい。表示補助情報はこれ以外の情報であってもよく、表示制御手段が、先頭変換文字を並べ替えることができる情報であればよい。 According to the said structure, based on display auxiliary information, a head conversion character can be rearranged and it can display on a display part so that a user can select. The display auxiliary information may be information on the appearance frequency of the Chinese character, for example. The display auxiliary information may be other information, and may be any information as long as the display control means can rearrange the head conversion characters.
また、本発明に係る文字変換装置は、上記構成に加え、上記単語辞書の単語インデックスは、単語の先頭となる先頭変換文字毎に、上記先頭変換文字識別情報と、単語の2文字目の先頭の表音文字である2文字目先頭表音文字との組み合わせに対して、上記単語対応情報における格納先が割り振られていてもよい。 Further, in addition to the above configuration, the character conversion device according to the present invention includes a word index of the word dictionary in which the first conversion character identification information and the first character of the second character The storage location in the word correspondence information may be allocated to the combination with the second first phonogram that is the phonogram.
上記構成によると、単語取得手段は、先頭変換文字識別情報と、単語の2文字目の先頭の表音文字である2文字目先頭表音文字との組み合わせから、単語を検索することができる。よって、検索範囲をより絞ることができ、より素早い応答が可能となる。 According to the above configuration, the word acquisition unit can search for a word from the combination of the first converted character identification information and the second first phonogram which is the first phonogram of the second character of the word. Therefore, the search range can be narrowed down more quickly.
また、本発明に係る文字変換装置は、上記構成に加え、上記変換文字対応情報では、さらに、上記変換文字識別情報に、該変換文字識別情報が示す変換文字についての取得補助情報が対応付けられており、上記先頭変換文字取得手段は、上記取得補助情報を基に上記変換文字識別情報を取得してもよい。 Further, in the character conversion device according to the present invention, in addition to the above configuration, in the conversion character correspondence information, acquisition auxiliary information about the conversion character indicated by the conversion character identification information is further associated with the conversion character identification information. The head conversion character acquisition means may acquire the conversion character identification information based on the acquisition auxiliary information.
上記構成によると、先頭変換文字取得手段は、変換文字識別情報が示す変換文字についての取得補助情報を基に、変換文字識別情報を取得することができる。取得補助情報とは、先頭変換文字取得手段の変換文字辞書を用いた検索を補助する情報であればよく、例えば先頭変換文字の表音文字の長さ等である。 According to the above configuration, the head conversion character acquisition unit can acquire the conversion character identification information based on the acquisition auxiliary information about the conversion character indicated by the conversion character identification information. The acquisition auxiliary information may be information that assists the search using the conversion character dictionary of the head conversion character acquisition means, and is, for example, the length of the phonetic character of the head conversion character.
また、本発明に係る文字変換装置は、上記構成に加え、上記取得補助情報は、以下の4つの情報に分類されていてもよい。
(1)変換文字識別情報が示す変換文字が、上記入力文字列に対して、無条件に取得対象となるという情報。
(2)変換文字識別情報が示す変換文字が、上記入力文字列が1文字では、取得対象外になるという情報。
(3)変換文字識別情報が示す変換文字が、上記入力文字列が2文字以下では、取得対象外になるという情報。
(4)変換文字識別情報が示す変換文字が、上記入力文字列が3文字以下では、取得対象外になるとういう情報。In the character conversion device according to the present invention, in addition to the above configuration, the acquisition auxiliary information may be classified into the following four pieces of information.
(1) Information that the converted character indicated by the converted character identification information is unconditionally acquired with respect to the input character string.
(2) Information that the conversion character indicated by the conversion character identification information is excluded from acquisition if the input character string is one character.
(3) Information that the conversion character indicated by the conversion character identification information is excluded from acquisition if the input character string is two characters or less.
(4) Information that the conversion character indicated by the conversion character identification information is not subject to acquisition if the input character string is three characters or less.
上記構成によると、先頭変換文字取得手段が、すばやく、効果的に先頭変換文字を取得することができる。 According to the above configuration, the leading conversion character acquisition means can acquire the leading conversion character quickly and effectively.
また、本発明に係る文字変換装置は、上記構成に加え、上記単語対応情報では、単語の先頭の変換文字が同一のものが1グループとしてまとめられていてもよい。 In addition to the above configuration, the character conversion device according to the present invention may be arranged as a group of words having the same conversion character at the beginning of the word in the word correspondence information.
上記構成によると、単語取得手段は、グループとしてまとめられた単語について検索できるので、すばやく、効果的に単語を取得することができる。 According to the above configuration, the word acquisition unit can search for words grouped as a group, and thus can acquire words quickly and effectively.
さらに、各上記グループ内で、単語は、単語の先頭の表音文字の所定の配列順に並べられていてもよい。 Further, in each of the above groups, the words may be arranged in a predetermined arrangement order of the first phonetic characters of the words.
上記構成によると、単語取得手段は、単語の先頭の表音文字の所定の配列順に並べられてグループ内で単語を検索できるので、よりすばやく、単語を取得することができる。ここで、単語の先頭の表音文字の所定の配列順とは、例えば、単語の読みがピンインであればアルファベット順、ひらがなであれば50音順、等である。 According to the above configuration, the word acquisition unit can search for a word in the group arranged in the predetermined arrangement order of the phonograms at the beginning of the word, so that the word can be acquired more quickly. Here, the predetermined arrangement order of the phonograms at the beginning of the word is, for example, alphabetical order when the word reading is Pinyin, or alphabetical order when hiragana is used.
また、本発明に係る文字変換装置は、上記構成に加え、上記変換文字は漢字であり、上記変換文字対応情報では、漢字の先頭の表音文字が同一、かつ、声調コードが同一の、上記変換文字識別情報である漢字識別情報がグループとしてまとめられていてもよい。 In addition to the above configuration, the character conversion device according to the present invention is such that the conversion character is a kanji character, and the conversion character correspondence information includes the same phonetic code and the same phonetic code in the kanji character. Kanji identification information that is converted character identification information may be grouped together.
上記構成によると、先頭変換文字取得手段は、グループ内で求めたい先頭変換文字について検索すればよいので、応答速度が速くなる。 According to the above configuration, the head conversion character acquisition unit only needs to search for the head conversion character to be obtained in the group, so that the response speed is increased.
また、中国語変換装置として用いられる上記文字変換装置の、上記変換文字対応情報では、各上記グループで、上記漢字識別情報が、漢字の先頭の表音文字の所定の配列順に並べてられていてもよい。 Further, in the converted character correspondence information of the character conversion device used as a Chinese conversion device, the kanji identification information may be arranged in a predetermined arrangement order of the first phonetic characters of the kanji in each group. Good.
漢字の先頭の表音文字の所定の配列順に並べてあるので、先頭変換文字取得手段は、より素早く先頭変換文字を取得することができる。 Since the first phonetic characters of the Chinese characters are arranged in a predetermined arrangement order, the first converted character acquisition means can acquire the first converted character more quickly.
また、中国語変換装置として用いられる上記いずれかの文字変換装置の、前記変換文字インデックスでは、上記漢字の先頭の表音文字が所定の配列順となっており、各上記グループの上記変換文字対応情報での格納先を示す情報を上記変換文字格納情報として、上記漢字の先頭の表音文字に対応付けられていてもよい。 Further, in the conversion character index of any one of the character conversion devices used as a Chinese conversion device, the first phonetic characters of the Chinese characters are in a predetermined arrangement order, and the conversion character corresponding to each group is supported. Information indicating the storage location in the information may be associated with the first phonetic character of the Chinese character as the converted character storage information.
上記構成によると、変換文字インデックスでは、漢字の先頭の表音文字が所定の配列順となっており、各上記グループの変換文字対応情報での格納先を示す情報を上記変換文字格納情報として、漢字の先頭の表音文字に対応付けられている。よって、先頭変換文字取得手段は、グループの変換文字対応情報での格納先から、グループを絞って、より応答速度を速めて、検索することができる。 According to the above configuration, in the conversion character index, the first phonetic characters of the kanji are in a predetermined arrangement order, and information indicating the storage destination in the conversion character correspondence information of each group is used as the conversion character storage information. It is associated with the first phonetic character of the kanji. Therefore, the head conversion character acquisition means can search by narrowing down the group from the storage destination in the conversion character correspondence information of the group and increasing the response speed.
ここで、中国語変換装置として用いられる上記何れかの文字変換装置では、上記漢字は簡体字であり、かつ、上記表音はピンインで表現されていてもよい。 Here, in any one of the character conversion devices used as the Chinese conversion device, the kanji may be simplified and the phonetic may be expressed in pinyin.
上記構成によると、ユーザが1文字以上のピンイン列を入力すると、ピンイン列の先頭文字から先頭漢字の候補を絞り込み、先頭漢字の候補を基に検索対象の単語を制限できるので、辞書検索処理にかかる時間を短縮できる。それゆえ、応答速度の速い中国語入力装置を提供できる。また、入力したい文字列の先頭文字のピンインだけを入力しても連続して2文字目以降のピンインを入力しても所望の文字列を入力することができる文字変換装置を提供できる。また一方では、入力したい文字列の先頭文字のピンインが不完全であり、2文字目以降のピンインを入力しても所望の文字列を入力することができる中国語入力装置を提供できる
あるいは、中国語変換装置として用いられる上記何れかの文字変換装置では、上記漢字は繁体字であり、かつ、上記表音は注音で表現されていてもよい。According to the above configuration, when a user inputs a pinyin string of one or more characters, the first kanji candidates are narrowed down from the first character in the pinyin string, and the search target words can be limited based on the first kanji candidates. This time can be shortened. Therefore, a Chinese input device with a high response speed can be provided. In addition, it is possible to provide a character conversion device that can input a desired character string even if only the first character Pinyin of the character string to be input is input or if the second and subsequent characters are input continuously. On the other hand, the pinyin of the first character of the character string to be input is incomplete, and a Chinese input device can be provided that can input a desired character string even if the pinyin after the second character is input. In any one of the character conversion devices used as the word conversion device, the kanji may be a traditional character, and the phonetic may be expressed by a note.
上記構成によると、ユーザが1文字以上の注音文字列を入力すると、注音文字列の先頭文字から先頭漢字の候補を絞り込み、先頭漢字の候補を基に検索対象の単語を制限できるので、辞書検索処理にかかる時間を短縮できる。それゆえ、応答速度の速い中国語入力装置を提供できる。また、入力したい文字列の先頭文字の注音文字だけを入力しても、連続して2文字目以降の注音文字を入力しても、所望の文字列を入力することができる中国語入力装置を提供することができる。他方で、入力したい文字列の先頭文字の注音が不完全であり、2文字目以降の注音を入力しても所望の文字列を入力することができる中国語入力装置を提供できる。 According to the above configuration, when the user inputs one or more sung character strings, the first kanji candidates are narrowed down from the first character of the sung character string, and the search target words can be limited based on the first kanji candidates. Processing time can be shortened. Therefore, a Chinese input device with a high response speed can be provided. Also, a Chinese input device that can input a desired character string even when only the first sung character of the character string to be input is input or when the second and subsequent sung characters are continuously input. Can be provided. On the other hand, it is possible to provide a Chinese input device capable of inputting a desired character string even when a second or subsequent character is input because the first character of the character string to be input is incomplete.
また、本発明に係る文字変換装置の制御方法は、入力された1以上の表音文字よりなる入力文字列を変換文字に変換し、当該変換文字からなる単語を決定することができる文字変換装置の制御方法において、(a−1)変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報および、(a−2)入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、(b−1)単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報および、(b−2)単語の先頭となる変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、を用いて、
入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得ステップと、
取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得ステップと、
を含む処理を行う。Moreover, the control method of the character conversion apparatus according to the present invention converts the input character string composed of one or more input phonograms into a converted character, and can determine a word composed of the converted character. (A-1) conversion character correspondence information in which conversion character identification information for identifying conversion characters and conversion character phonetic information indicating the phonetics of the conversion characters are associated with each other, and (a -2) Conversion character storage location information indicating a storage location in the conversion character correspondence information of the input phonetic character and the conversion character identification information having the phonetic character as the head of the conversion character phonetic information; A conversion character dictionary having a conversion character index associated with the word, (b-1) word identification information for identifying the word, and word correspondence information indicating the phonetic expression of the word Correspondence information and (b-2) First conversion character identification information for identifying a conversion character at the beginning of a word, and word storage destination information indicating a storage destination in the word correspondence information of a word having the conversion character indicated by the first conversion character identification information at the head And a word dictionary having a word index associated with
Conversion character identification information that refers to the conversion character dictionary based on the input phonetic character of the input character string and has the head phonetic character of the input character string as the head of the conversion character phonetic information A first conversion character acquisition step for acquiring
Based on the acquired head conversion character identification information, referring to the word dictionary, a word acquisition step of acquiring a word having a conversion character at the head indicated by the head conversion character identification information;
Processing including
上記方法によると、上記文字変換装置と同様に、単語の検索処理に係る時間を短縮することができる。 According to the above method, as in the character conversion device, it is possible to reduce the time required for word search processing.
また、本発明に係る文字変換装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記何れかの文字変換装置における上記各手段として動作させることにより上記文字変換装置をコンピュータにて実現させる文字変換プログラム、及びその文字変換プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。 The character conversion device according to the present invention may be realized by a computer. In this case, the character conversion device is operated by the computer by causing the computer to operate as each of the above-described means in any of the character conversion devices. A character conversion program to be realized and a computer-readable recording medium on which the character conversion program is recorded also fall within the scope of the present invention.
これらの構成によれば、文字変換プログラムを、コンピュータに読み取り実行させることによって、上記文字変換装置と同一の作用効果を実現することができる。 According to these structures, the same effect as the said character conversion apparatus is realizable by making a computer read and execute a character conversion program.
〔補足事項〕
本発明に係る文字変換装置は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字または表意文字列を入力する文字変換装置において、上記表音文字と、該表音文字を含む表音文字列に対応する表意文字とを関連付けて記録する文字記録部と、ユーザにより入力された表音文字を受け付けて、該表音文字に関連付けられた表意文字を、表意文字の候補として上記文字記録部から抽出する文字候補抽出手段と、上記候補抽出手段が抽出した候補の表示順序を、所定の条件に基づき決定する候補順序決定手段と、上記候補順序決定手段が決定した表示順序に基づいて候補を表示するようデータを出力する表示制御手段とを備えていることを特徴としている。[Additional notes]
The character conversion device according to the present invention is a character conversion device that converts an input phonetic character or phonetic character string into a corresponding ideogram and inputs the ideogram or ideogram string selected by the user. A character recording unit that records a phonetic character and an ideogram corresponding to the phonetic character string including the phonetic character in association with each other, and accepts a phonetic character input by the user and associates the phonetic character with the phonetic character. Character candidate extraction means for extracting ideographic characters from the character recording unit as ideographic character candidates, candidate order determination means for determining the display order of candidates extracted by the candidate extraction means based on predetermined conditions, and the candidates Display control means for outputting data so as to display candidates based on the display order determined by the order determination means is provided.
上記構成によれば、文字候補抽出手段は、ユーザが入力した表音文字を受け付けて、その表音文字を含む、表音文字列を特定する。表音文字列は、表意文字と対応している。表音文字と表音文字列との対応関係、および、表音文字列と表意文字との対応関係は、文字記録部に記録されている。したがって、文字候補抽出手段は、ユーザから入力を受け付けた表音文字に基づいて、ユーザが入力したいと所望する表意文字の候補を上記文字記録部から抽出することができる。 According to the said structure, a character candidate extraction means receives the phonetic character which the user input, and specifies the phonetic character string containing the phonetic character. The phonetic character string corresponds to the ideogram. The correspondence relationship between the phonetic character and the phonetic character string and the correspondence relationship between the phonetic character string and the ideographic character are recorded in the character recording unit. Therefore, the character candidate extraction unit can extract from the character recording unit candidates of ideographic characters that the user desires to input based on the phonetic characters received from the user.
続いて、候補順序決定手段は、上記文字候補抽出手段が抽出した表意文字の候補を所定の条件に基づいて並べ替え、候補の表示順序を決定する。表示制御手段は、表意文字の候補が、上記候補順序決定手段が決定した表示順序で表示されるよう候補のデータを出力する。 Subsequently, the candidate order determination means rearranges the ideographic character candidates extracted by the character candidate extraction means based on a predetermined condition, and determines the candidate display order. The display control means outputs candidate data so that the ideographic character candidates are displayed in the display order determined by the candidate order determination means.
これにより、ユーザは、表示された候補の中から所望の表意文字を指定するのみで、該表意文字を入力することができる。 Thus, the user can input the ideogram only by designating the desired ideogram from the displayed candidates.
以上のことから、ユーザは、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。 From the above, the user can obtain the input of a desired ideogram with a smaller number of operations related to the input of phonogram characters.
より具体的には、例えば、表音文字がアルファベットであり、表意文字が中国語の漢字であるとする。すなわち、アルファベット文字列は、ピンインであり、1つのピンインには1または複数の漢字が対応している。上記文字記録部には、アルファベット−ピンイン、ピンイン−漢字の対応関係が記録されている。 More specifically, for example, it is assumed that the phonogram is an alphabet and the ideogram is a Chinese kanji. That is, the alphabet character string is Pinyin, and one Pinyin corresponds to one or a plurality of Chinese characters. In the character recording portion, alphabet-pinyin and pinyin-kanji correspondences are recorded.
したがって、アルファベットが1文字入力されると、文字候補抽出手段は、文字記録部を参照して、当該アルファベットから始まるピンインを特定し、特定したピンインに対応する1または複数の漢字を候補として抽出する。 Therefore, when one alphabetic character is input, the character candidate extraction unit refers to the character recording unit, identifies pinyin starting from the alphabet, and extracts one or more kanji characters corresponding to the identified pinyin as candidates. .
上記候補として抽出された漢字は、ユーザに提示される。ユーザは、提示された候補から所望の漢字を指定するたけでよい。つまり、アルファベットを入力したのち、それに対応するピンインを選択する操作を必要とすることなく、所望の漢字を指定して得ることが可能となる。 The kanji extracted as the candidate is presented to the user. The user only has to specify a desired kanji from the presented candidates. That is, after inputting the alphabet, it is possible to designate and obtain a desired kanji without requiring an operation of selecting the corresponding pinyin.
以上のことから、所望の表意文字(漢字)を得るための、表音文字(ピンイン)の入力操作を簡素化することが可能な文字変換装置を提供することができる。 From the above, it is possible to provide a character conversion device that can simplify the input operation of phonetic characters (pinyin) to obtain a desired ideogram (kanji).
なお、中国語の発音には四声があるために、1つのピンイン表記に対して4種類の発音が存在する。この四声を区別する情報を加えて、対応する漢字を記録してもよい。例えば、上記文字記録部に、四声の区別を格納するためのフィールドを用意し、ユーザが入力する四声の区別に基づいて、対応する漢字をさらに絞り込めば、上記文字候補抽出手段の抽出処理を効率よく行うことができる。 Since there are four voices in Chinese pronunciation, there are four types of pronunciation for one Pinyin notation. The information for distinguishing these four voices may be added to record the corresponding kanji. For example, if the field for storing the distinction of the four voices is prepared in the character recording unit, and the corresponding kanji is further narrowed down based on the distinction of the four voices input by the user, the extraction of the character candidate extraction means Processing can be performed efficiently.
あるいは、例えば、表音文字が注音の字母であり、表意文字が繁体字であってもよい。すなわち、表音文字列は注音であり、1つの注音には1または複数の繁体字が対応している。上記文字記録部には、注音の字母−注音、注音−繁体字の対応関係が記録されていればよい。 Alternatively, for example, the phonetic character may be a letter of the syllabary and the ideogram may be a traditional character. In other words, the phonetic character string is a note, and one or more traditional characters correspond to one note. In the character recording unit, it is only necessary to record the correspondence between the note-moji-to-note and the note-to-traditional character.
上記文字変換装置は、さらに、上記表意文字と、該表意文字を含む表意文字列とを関連付けて記録する文字列記録部と、ユーザにより選択された表意文字を受け付けて、該表意文字に関連付けられた表意文字列を、表意文字列の候補として上記文字列記録部から抽出する文字列候補抽出手段とを備えていてもよい。 The character conversion device further accepts an ideogram selected by the user by associating the ideogram with a character string recording unit that records the ideogram and an ideogram including the ideogram, and is associated with the ideogram. There may be provided character string candidate extracting means for extracting the ideographic character string from the character string recording unit as an ideographic character string candidate.
あるいは、本発明の文字変換装置は、入力された表音文字または表音文字列を、対応する表意文字に変換して、ユーザが選択する表意文字を入力する文字変換装置において、上記表意文字と、該表意文字を含む表意文字列とを関連付けて記録する文字列記録部と、ユーザにより選択された表意文字を受け付けて、該表意文字に関連付けられている表意文字列を、表意文字列の候補として上記文字列記録部から抽出する文字列候補抽出手段と、上記文字列候補抽出手段が抽出した候補の表示順序を、所定の条件に基づき決定する候補順序決定手段と、上記候補順序決定手段が決定した表示順序に基づいて候補を表示するようデータを出力する表示制御手段とを備えていることを特徴としている。 Alternatively, the character conversion device of the present invention converts the input phonetic character or phonetic character string into a corresponding ideographic character and inputs the ideographic character selected by the user. A character string recording unit that records the ideographic character string including the ideographic character in association with each other, accepts the ideographic character selected by the user, and converts the ideographic character string associated with the ideographic character into candidate ideographic character strings. The character string candidate extracting means for extracting from the character string recording unit, the candidate order determining means for determining the display order of the candidates extracted by the character string candidate extracting means based on a predetermined condition, and the candidate order determining means Display control means for outputting data so as to display candidates based on the determined display order is provided.
上記構成によれば、文字列記録部には、表意文字(例えば、漢字)と該表意文字を含む表意文字列(例えば、当該漢字を先頭にした熟語、など)との対応関係が記録されている。したがって、上記文字列候補抽出手段は、表意文字がユーザにより選択されたのに応じて、該表意文字に関連付けられた表意文字列を、候補として上記文字列記録部から抽出する。 According to the above configuration, the correspondence between the ideographic characters (for example, kanji) and the ideographic character strings including the ideographic characters (for example, idioms starting with the kanji) is recorded in the character string recording unit. Yes. Therefore, the character string candidate extraction unit extracts an ideographic character string associated with the ideographic character from the character string recording unit as a candidate in response to selection of the ideographic character by the user.
例えば、中国語の例を用いて説明する。ある漢字が入力されると、その漢字の次に続く文字(ユーザが所望する漢字)は、何の脈絡もない漢字よりも、その漢字から始まる熟語を構成する漢字である可能性が高い。したがって、入力が確定された漢字から始まる熟語を候補として表示すれば、ユーザは、その熟語の候補の中から所望の熟語を選択するのみで、別途ピンインを入力することなく、中国語を入力することが可能となる。 For example, explanation will be given using an example of Chinese. When a certain Chinese character is input, the character following the Chinese character (the Chinese character desired by the user) is more likely to be a Chinese character that constitutes an idiom starting from the Chinese character than a Chinese character without any context. Therefore, if a idiom that starts with a kanji that has been confirmed to be input is displayed as a candidate, the user can select the desired idiom from the idiom candidates and input Chinese without inputting pinyin separately. It becomes possible.
これにより、ユーザは、表音文字の入力に係る操作数について、さらに少ない操作数で、所望の表意文字の入力を得ることが可能となる。 As a result, the user can obtain a desired ideogram input with a smaller number of operations related to the input of phonogram characters.
さらに、上記文字変換装置は、ユーザにより筆記された表意文字を入力する筆記文字入力部をさらに備え、上記筆記文字入力部に入力された表意文字を認識し、該表意文字の情報を上記文字列候補抽出手段に供給する文字認識手段を備えていることが好ましい。 The character conversion device further includes a written character input unit for inputting an ideogram written by a user, recognizes the ideographic character input to the written character input unit, and converts the information of the ideographic character into the character string. It is preferable that character recognition means to be supplied to the candidate extraction means is provided.
これにより、所望の表意文字に対応する表音文字(列)が明瞭でない場合でも、所望の表意文字の入力を得ることが可能となる。 Thereby, even when the phonetic character (sequence) corresponding to the desired ideographic character is not clear, it is possible to obtain the input of the desired ideographic character.
さらに、上記文字変換装置の文字候補抽出手段は、ユーザにより入力された表音文字を受け付けると、連続して受け付けた表音文字列に対応する表意文字を、候補として抽出することが好ましい。 Furthermore, it is preferable that the character candidate extraction unit of the character conversion device extracts, as candidates, ideographic characters corresponding to the phonetic character strings received continuously when the phonetic characters input by the user are received.
上記構成によれば、表音文字がユーザによって入力されるたびに、特定するべき表音文字列の候補数が絞られる。よって、文字候補抽出手段は、対応する表意文字の候補数を大幅に絞り込んで抽出することができ、表示制御手段はその絞り込まれた表意文字の候補を出力することができる。 According to the above configuration, each time a phonetic character is input by the user, the number of candidates for the phonetic character string to be specified is reduced. Therefore, the character candidate extraction means can significantly narrow down and extract the number of corresponding ideographic character candidates, and the display control means can output the narrowed ideographic character candidates.
以上のことから、表音文字がユーザによって入力されるごとに、表示された表意文字の候補が、ユーザが所望する表意文字を含んでいる確率が上がるよう、文字変換装置を構成することができる。結果として、所望の表意文字を得るための、表音文字の入力操作を簡素化することが可能な文字変換装置を提供することができる。 From the above, the character conversion device can be configured so that the probability that the displayed ideographic character candidate includes the ideographic character desired by the user increases each time the phonic character is input by the user. . As a result, it is possible to provide a character conversion device capable of simplifying a phonetic character input operation for obtaining a desired ideogram.
さらに、上記文字変換装置の上記候補順序決定手段は、上記文字列候補抽出手段により抽出された表意文字列の候補が、上記文字候補抽出手段により抽出された表意文字の候補よりも優先して表示されるよう表示順序を決定することが好ましい。 Further, the candidate order determination means of the character conversion device displays the ideographic character string candidates extracted by the character string candidate extraction means in preference to the ideographic character candidates extracted by the character candidate extraction means. It is preferable to determine the display order.
上記構成によれば、文字候補抽出手段が文字記録部より抽出した表意文字の候補より、文字列候補抽出手段が文字列記録部より抽出した表意文字列の候補の方が先に表示されるよう、候補順序決定手段が候補の表示順序を決定する。 According to the above configuration, the ideographic character string candidate extracted by the character string candidate extraction unit from the character string recording unit is displayed first than the ideographic character candidate extracted by the character candidate extraction unit from the character recording unit. The candidate order determining means determines the candidate display order.
例えば、日本語や中国語の漢字入力において、何の脈絡もない漢字よりも、すでに入力されている漢字に続いて熟語(表意文字列)を構成するような漢字が続く(ユーザが所望する)可能性が高い。したがって、例えば、入力が確定された漢字から始まる熟語を候補として表示すれば、ユーザは、漢字(表意文字)の候補から表示された場合に比べて、より早く、少ない操作数で所望の漢字を入力することが可能となる。 For example, in Japanese or Chinese kanji input, a kanji that forms an idiom (ideographic character string) follows an already input kanji, rather than a kanji without any context (desired by the user). Probability is high. Therefore, for example, if an idiom starting from a kanji that has been confirmed to be input is displayed as a candidate, the user can select a desired kanji faster and with a smaller number of operations than when displayed from a candidate for a kanji (ideographic character). It becomes possible to input.
上記文字変換装置は、さらに、ユーザにより選択された表意文字を学習文字として学習語記録部に記録する学習制御手段を備え、上記候補順序決定手段は、上記文字候補抽出手段が抽出した候補が上記学習語記録部に記録された学習文字である場合に、該候補が優先して表示されるよう表示順序を決定してもよい。 The character conversion device further includes learning control means for recording an ideographic character selected by the user as a learning character in a learning word recording unit, and the candidate order determination means includes the candidate extracted by the character candidate extraction means as the candidate When the learning characters are recorded in the learning word recording unit, the display order may be determined so that the candidates are displayed with priority.
あるいは、ユーザにより選択された表意文字列を学習文字列として学習語記録部に記録する学習制御手段を備え、上記候補順序決定手段は、上記文字列候補抽出手段が抽出した候補が上記学習語記録部に記録された学習文字列である場合に、該候補が優先して表示されるよう表示順序を決定してもよい。 Alternatively, it comprises learning control means for recording an ideographic character string selected by the user as a learned character string in a learned word recording unit, and the candidate order determining means is configured such that the candidate extracted by the character string candidate extracting means is recorded as the learned word record. In the case of the learned character string recorded in the part, the display order may be determined so that the candidate is displayed with priority.
上記構成によれば、学習制御手段は、文字変換装置において入力が確定された(ユーザが所望した)表意文字または表意文字列を学習文字(列)として学習語記録部に記録させる。 According to the above configuration, the learning control unit causes the learning word recording unit to record the ideographic character or the ideographic character string whose input is confirmed (desired by the user) in the character conversion device as the learning character (string).
そして、上記候補抽出手段が候補を文字(列)記録部より抽出したのち、候補順序決定手段は、その抽出された候補のうち、上記学習語記録部に記録されているものを学習文字として判定することができる。候補が学習文字であるということは、すなわち、ユーザが過去に所望した表意文字(列)であって、学習文字でない候補よりも、ユーザに再び所望される可能性が高いことを意味する。 And after the said candidate extraction means extracts a candidate from a character (sequence) recording part, a candidate order determination means determines what was recorded on the said learning word recording part among the extracted candidates as a learning character. can do. That the candidate is a learning character means that the user is more likely to be desired again than a candidate that is an ideographic character (sequence) that the user has desired in the past and is not a learning character.
以上のことから、学習文字である候補の表示順序を上位にすることにより、ユーザがより早く、少ない操作数で所望の漢字を入力することが可能な文字変換装置を実現することができる。 From the above, it is possible to realize a character conversion device that allows a user to input a desired kanji faster and with a smaller number of operations by raising the display order of candidates that are learning characters.
あるいは、上記文字変換装置は、さらに、ユーザにより選択された表意文字を、該表意文字の直前に入力されている直前文字または直前文字列と関連付けて、ペア学習文字として学習語記録部に記録する学習制御手段を備え、上記候補順序決定手段は、上記文字候補抽出手段が抽出した候補が、直前文字または直前文字列と関連付けられて上記学習語記録部に記録されたペア学習文字である場合に、該候補が優先して表示されるよう表示順序を決定してもよい。 Alternatively, the character conversion device further records the ideographic character selected by the user in the learning word recording unit as a pair learning character in association with the immediately preceding character or the immediately preceding character string input immediately before the ideographic character. A learning control unit, wherein the candidate order determination unit is a pair learning character recorded in the learning word recording unit in association with the immediately preceding character or the immediately preceding character string. The display order may be determined so that the candidates are displayed with priority.
もしくは、ユーザにより選択された表意文字列を、該表意文字列の直前に入力されている直前文字または直前文字列と関連付けて、ペア学習文字列として学習語記録部に記録する学習制御手段を備え、上記候補順序決定手段は、上記文字列候補抽出手段が抽出した候補が、直前文字または直前文字列と関連付けられて上記学習語記録部に記録されたペア学習文字列である場合に、該候補が優先して表示されるよう表示順序を決定してもよい。 Alternatively, a learning control unit is provided that records the ideographic character string selected by the user in the learning word recording unit as a pair learning character string in association with the immediately preceding character or the immediately preceding character string input immediately before the ideographic character string. The candidate order determining means, when the candidate extracted by the character string candidate extracting means is a pair learning character string recorded in the learning word recording unit in association with the immediately preceding character or the immediately preceding character string, the candidate The display order may be determined so that is displayed with priority.
上記構成によれば、学習制御手段は、文字変換装置において入力が確定された(ユーザが所望した)表意文字または表意文字列を学習文字(列)として学習語記録部に記録させる際、その学習文字(列)の直前にすでに入力が確定している文字(列)(以下、直前文字(列)と称す)と関連付けて、ペア学習文字(列)として記録させる。 According to the above configuration, when the learning control unit records the ideographic character or the ideographic character string whose input is confirmed (desired by the user) in the character conversion device as the learning character (string) in the learning word recording unit, It is recorded as a pair learning character (string) in association with a character (string) whose input has already been confirmed immediately before the character (string) (hereinafter referred to as the immediately preceding character (string)).
上記ペア学習文字(列)は、上記関連付けられた直前文字(列)に続いて、ユーザに所望された履歴があるということになる。したがって、上記直前文字(列)が入力された場合には、上記ペア学習文字(列)がユーザに所望される可能性が高い。 The pair learning character (sequence) has a history desired by the user following the associated immediately preceding character (sequence). Therefore, when the immediately preceding character (string) is input, the pair learning character (string) is highly likely to be desired by the user.
上記候補順序決定手段は、候補抽出手段が抽出した候補が、ペア学習文字(列)である場合には、その候補の表示順序を上位に変更する。 When the candidate extracted by the candidate extraction unit is a pair learning character (string), the candidate order determination unit changes the display order of the candidates to the top.
これにより、ユーザがより早く、少ない操作数で所望の漢字を入力することが可能な文字変換装置を実現することができる。 Thereby, it is possible to realize a character conversion device that allows a user to input a desired kanji character earlier and with a smaller number of operations.
さらに、上記文字変換装置の上記学習制御手段は、学習語としての、上記学習文字または学習文字列、もしくは、上記ペア学習文字またはペア学習文字列を分類するためのグループ識別子を生成し、該グループ識別子を各学習語に関連付けて上記学習語記録部に記録し、上記グループ識別子は、上記学習語を構成する表意文字にあらかじめ割り当てられた、所定の長さの文字コードに基づいて生成されることが好ましい。 Furthermore, the learning control means of the character conversion device generates a group identifier for classifying the learning character or learning character string or the pair learning character or pair learning character string as a learning word, An identifier is associated with each learning word and recorded in the learning word recording unit, and the group identifier is generated based on a character code having a predetermined length assigned in advance to ideographic characters constituting the learning word. Is preferred.
上記構成によれば、学習制御手段は、学習語記録部に記録される学習語(学習文字または学習文字列、もしくは、ペア学習文字またはペア学習文字列)に対して、それを複数のグループに分類するためのグループ識別子を生成して割り当てる。学習制御手段は、上記学習語を構成する各表意文字にあらかじめ割り当てられた、文字コードを基に求められる数値を用いて上記グループ識別子を生成する。 According to the above configuration, the learning control means divides the learning word (learning character or learning character string, or pair learning character or pair learning character string) recorded in the learning word recording unit into a plurality of groups. Generate and assign group identifiers for classification. The learning control means generates the group identifier using a numerical value that is assigned in advance to each ideographic character constituting the learning word and that is obtained based on the character code.
このようにして生成されたグループ識別子は、どのような学習語に割り当てるものであっても固定長となる。すなわち、具体例を挙げると、2文字の熟語からなる学習語であっても、6文字の熟語からなる学習語であっても、それらには同サイズのグループ識別子が割り当てられる。 The group identifier generated in this way has a fixed length regardless of what learning word is assigned. That is, to give a specific example, a group identifier of the same size is assigned to a learning word consisting of a two-character idiom or a learning word consisting of a six-character idiom.
上記学習語記録部に記録される学習語の数が、膨大な量になればなるほど、また、それが熟語の場合、文字数が多くなればなるほど、データサイズが大きくなる。つまり、候補が学習語であるか否かを判定するために上記学習語記録部から合致する学習語を検索するのに膨大な時間がかかり、文字入力の処理効率が低下するという問題が発生する。 As the number of learning words recorded in the learning word recording unit becomes enormous, or when it is a idiom, the data size increases as the number of characters increases. That is, it takes a long time to search for a matching learning word from the learning word recording unit in order to determine whether or not the candidate is a learning word, resulting in a problem that the processing efficiency of character input decreases. .
しかし、上述したとおり、各学習文字に固定長のグループ識別子を割り当てれば、検索において、入力文字(列)と学習語が一致あるいは同一グループの文字(列)であるかを判定する時間は、学習語がどのような文字数からなっていようと関係なく一律となる。以上のことから、学習語の増加に対して検索にかかる時間が比例的に増加することを抑制することができ、処理効率の低下への影響が小さくすることができる。 However, as described above, if a fixed-length group identifier is assigned to each learning character, the time for determining whether the input character (string) matches the learning word or the character (string) in the same group in the search is as follows. Regardless of the number of characters in the learning word, it is uniform. As described above, it is possible to suppress a proportional increase in the time required for the search with respect to the increase in learning words, and to reduce the influence on the decrease in processing efficiency.
上記文字変換装置は、さらに、ユーザにより選択された表意文字または表意文字列と、該表意文字または表意文字列より前に入力が確定している前方文字または前方文字列との関連度合いを記録する関連度記録部を備え、上記候補順序決定手段は、上記候補が、上記前方文字または前方文字列との関連度が高いものほど優先して表示されるよう表示順序を決定してもよい。 The character conversion device further records the degree of association between the ideogram or ideogram string selected by the user and the forward character or the forward character string whose input is confirmed before the ideogram or ideogram string. The candidate order determination unit may include a relevance degree recording unit, and the candidate order determination unit may determine the display order such that the candidates are displayed with higher priority as the degree of relevance with the front character or the front character string is higher.
上記構成によれば、候補順序決定手段は、前方文字(列)との関連度合いに基づいて、候補の表示順序を決定する。上記関連度合いとは、上記文字入力確定手段が入力を確定した表意文字または表意文字列と、該表意文字または表意文字列より前に入力が確定されている前方文字または前方文字列との関連性のことである。 According to the above configuration, the candidate order determining means determines the candidate display order based on the degree of association with the forward character (string). The degree of relevance is the relationship between the ideogram or ideographic character string whose input has been confirmed by the character input confirmation means and the front character or the front character string whose input has been confirmed before the ideogram or ideographic character string. That is.
より具体的には、例えば、「上海交通大学」という熟語が頻繁に入力される場合について説明する。「交通」に続いて「規則」などの別の熟語が連続して入力される可能性が高い場合であっても、それよりも前方に「上海」がある場合は、候補順序決定手段は、「上海」と「大学」との関連性を考慮して、「大学」を候補の上位に変更する。 More specifically, for example, a case where the phrase “Shanghai Jiaotong University” is frequently input will be described. Even if there is a high probability that another phrase such as “rule” will be input in succession after “traffic”, if “Shanghai” precedes it, the candidate order determining means Considering the relationship between “Shanghai” and “University”, “University” is changed to a higher rank candidate.
これにより、候補順序決定手段は、直前の文字(列)との連続性のみならず、それよりも前方の文字(列)との関連性を考慮して、候補となる表意文字(列)の表示順序を決定するので、よりユーザの希望を反映した順序で候補を提示することが可能となる。 Thereby, the candidate order determining means considers not only the continuity with the immediately preceding character (sequence) but also the relationship with the preceding character (sequence), and the candidate ideographic characters (sequence). Since the display order is determined, the candidates can be presented in an order more reflecting the user's wishes.
結果として、ユーザは、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。 As a result, the user can obtain the input of a desired ideographic character with a smaller number of operations with respect to the number of operations related to the input of phonetic characters.
さらに、上記文字変換装置は、上記候補順序決定手段が候補の表示順序を決定する際に参照する所定の条件であって、ユーザにより指定された条件を設定する候補順序決定要素設定手段を備え、上記候補順序決定手段は、上記候補順序決定要素設定手段が設定した条件に基づき、候補の表示順序を決定することが好ましい。 Furthermore, the character conversion device includes a candidate order determination element setting unit that sets a predetermined condition that is specified by the user as a predetermined condition to be referred to when the candidate order determination unit determines the display order of candidates. Preferably, the candidate order determining means determines a candidate display order based on the conditions set by the candidate order determining element setting means.
上記構成によれば、上記候補順序決定手段が候補の表示順序を決定する際に参照する所定の条件が複数ある場合に、どのような条件に基づいて表示順序を決定するのかを、ユーザの指示に応じて、候補順序決定要素設定手段が設定する。 According to the above configuration, when there are a plurality of predetermined conditions to be referred to when the candidate order determination unit determines the display order of candidates, the user's instruction is used to determine the display order based on what conditions The candidate order determination element setting unit sets the response according to the above.
上記所定の条件の例としてはいくつか考えられる。例えば、上述したとおり、
(1)候補が文字(漢字)であるか、文字列(熟語)であるか、(2)候補が学習文字であるか否か、(3)候補がペア学習文字であるか否か、(4)いつの時期に学習されたのか、(5)一般的にどのくらい頻繁に使用されるのか、(6)現在読みとして入力された表音文字長は、候補の表音文字長と一致しているか否か(例えば、「技術」を入力したい場合に、「ぎじ(2文字)」と「ぎじゅつ(4文字)」とは表音文字長が不一致である)、(7)直前文字列との連続性はあるか、(8)前方文字列との関連性はあるか、(9)当該ユーザによってどのくらいの頻度で使用されているのか、など、さまざまな条件が考えられる。Several examples of the predetermined condition are conceivable. For example, as mentioned above,
(1) whether the candidate is a character (kanji), a character string (jukugo), (2) whether the candidate is a learning character, (3) whether the candidate is a pair learning character, 4) When was it learned, (5) How often it is generally used, (6) Is the phonetic character length currently input as reading consistent with the candidate phonetic character length? No (for example, when “technical” is desired to be input, “giji (2 characters)” and “gijutsu (4 characters)” are inconsistent in phonetic character length), (7) continuous with previous character string There are various conditions such as (8) whether there is a relationship with the forward character string, (9) how often it is used by the user.
ここで、どのような条件に基づいて(あるいは、どのような条件を重要視して)候補の表示順序を決定するのかということを、ユーザが任意に設定できれば、候補順序決定手段が決定する候補の表示順序は、ユーザの希望をより正確に反映したものとなる。 Here, if the user can arbitrarily set the display order of the candidates based on what conditions (or what conditions are emphasized), the candidates determined by the candidate order determination means The display order reflects the user's wish more accurately.
結果として、ユーザは、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。 As a result, the user can obtain the input of a desired ideographic character with a smaller number of operations with respect to the number of operations related to the input of phonetic characters.
本発明に係る複写機は、上述の文字変換装置と、各表音文字に対応するキーを備えてユーザにより押下されたキーに対応する表音文字を上記文字変換装置に供給する第1入力部と、ユーザが選択した候補を上記文字変換装置に入力する第2入力部と、上記文字候補抽出手段または上記文字列候補抽出手段が抽出する候補を、上記候補順序決定手段が定めた表示順序にしたがって表示する表示部とを備え、上記第1入力部および第2入力部と、上記表示部とは、互いに一体に形成されたタッチパネルまたはタブレットであることを特徴としている。 A copying machine according to the present invention includes the above-described character conversion device and a first input unit that includes a key corresponding to each phonetic character and supplies the phonetic character corresponding to the key pressed by the user to the character conversion device. And the second input unit for inputting the candidate selected by the user to the character conversion device and the candidates extracted by the character candidate extraction unit or the character string candidate extraction unit in the display order determined by the candidate order determination unit. Accordingly, the display unit includes a display unit, and the first input unit, the second input unit, and the display unit are touch panels or tablets formed integrally with each other.
これにより、ユーザにより選択された表音文字や表意文字を上記文字変換装置に入力するための第1および第2入力部と、候補としての表意文字(列)をユーザに提示するための表示部とを一体に備えたタブレットを有する複写機において、ユーザは、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。 Thus, the first and second input units for inputting the phonetic characters and ideograms selected by the user to the character conversion device, and the display unit for presenting the ideographic characters (sequences) as candidates to the user In a copier having a tablet integrated with the above, the user can obtain a desired ideogram input with a smaller number of operations related to the input of phonogram characters.
上記複写機は、ユーザにより筆記された表意文字を入力する筆記文字入力部をさらに備え、上記筆記文字入力部に入力された表意文字を認識し、該表意文字の情報を上記文字変換装置に供給する文字認識手段を備えていることが好ましい。 The copying machine further includes a written character input unit for inputting an ideographic character written by a user, recognizes the ideographic character input to the written character input unit, and supplies information of the ideographic character to the character conversion device. It is preferable to include a character recognition means.
これにより、所望の表意文字に対応する表音文字(列)が明瞭でない場合でも、所望の表意文字の入力を得ることが可能な複写機を実現することが可能となる。 As a result, it is possible to realize a copier that can obtain the input of a desired ideogram even when the phonogram (column) corresponding to the desired ideogram is not clear.
本発明に係る文字入力方法は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字または表意文字列を入力する文字変換装置における文字入力方法において、ユーザにより入力された表音文字を受け付けて、該表音文字に関連付けられている表意文字を、上記表音文字と、該表音文字を含む表音文字列に対応する表意文字とを関連付けて記録する文字記録部から、表意文字の候補として抽出する第1ステップと、上記第1ステップにて抽出した候補の表示順序を、所定の条件に基づき決定する第2ステップと、上記第2ステップにて決定した表示順序に基づいて候補を表示するようデータを出力するする第3ステップとを含むことを特徴としている。 A character input method according to the present invention is a character input method in a character conversion device that converts an input phonetic character or phonetic character string into a corresponding ideographic character and inputs an ideographic character or ideographic character string selected by the user. The phonetic character input by the user is received, and the ideogram associated with the phonetic character is the phonogram and the ideogram corresponding to the phonetic character string including the phonetic character. A first step of extracting as an ideographic character candidate from a character recording unit to be recorded in association; a second step of determining a display order of candidates extracted in the first step based on a predetermined condition; And a third step of outputting data so as to display candidates based on the display order determined in the steps.
上記方法によれば、第1ステップにて、ユーザ入力した表音文字を含む表音文字列と対応する表意文字の候補が抽出され、第2ステップにて、抽出された候補の表示順序が決定される。このとき、表示順序は、例えば、上述したような所定の条件に基づいて決定されればよい。そして、第3ステップにて、決定された表示順序に基づいて表意文字の候補が出力される。 According to the above method, in the first step, candidates for ideographic characters corresponding to the phonetic character string including the phonetic character input by the user are extracted, and in the second step, the display order of the extracted candidates is determined. Is done. At this time, the display order may be determined based on the predetermined condition as described above, for example. In a third step, ideographic character candidates are output based on the determined display order.
これにより、ユーザにより上記候補の中から所望の表意文字が指定されると、その指定された表意文字の入力が確定される。 Thus, when a desired ideogram is designated from the candidates by the user, the input of the designated ideogram is confirmed.
以上のことから、所望の表意文字(漢字)を得るための、表音文字(ピンイン)の入力操作を簡素化することが可能な文字変換装置を提供することができる。 From the above, it is possible to provide a character conversion device that can simplify the input operation of phonetic characters (pinyin) to obtain a desired ideogram (kanji).
なお、上記文字変換装置および複写機は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記文字変換装置または複写機をコンピュータにて実現させる制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。 The character conversion device and the copying machine may be realized by a computer. In this case, a control program for causing the character conversion device or the copying machine to be realized by the computer by causing the computer to operate as each of the above means, A computer-readable recording medium on which it is recorded also falls within the scope of the present invention.
〔補足事項2〕
本発明に係る文字変換装置は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字または表意文字列を入力する文字変換装置において、上記表音文字と、該表音文字を含む表音文字列に対応する表意文字とを関連付けて記録する文字記録部と、ユーザにより入力された表音文字を受け付けて、該表音文字に関連付けられた表意文字を、表意文字の候補として上記文字記録部から抽出する文字候補抽出手段と、上記候補抽出手段が抽出した候補の表示順序を決定する候補順序決定手段と、上記候補順序決定手段が決定した表示順序に基づいて候補を表示するようデータを出力する表示制御手段とを備え、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前よりさらに前方に入力された前方文字または前方文字列とを対応付けて、上記前方文字または前方文字列の後方に該表意文字または表意文字列が入力される可能性の高さを示す関連度が関連度記録部に記憶されており、上記候補順序決定手段は、上記関連度記録部から、上記候補の前方に入力されている前方文字または前方文字列と、各候補との関連度を検出し、該関連度が高い候補ほど優先して表示されるよう表示順序を決定することを特徴としている。[Supplement 2]
The character conversion device according to the present invention is a character conversion device that converts an input phonetic character or phonetic character string into a corresponding ideogram and inputs the ideogram or ideogram string selected by the user. A character recording unit that records a phonetic character and an ideogram corresponding to the phonetic character string including the phonetic character in association with each other, and accepts a phonetic character input by the user and associates the phonetic character with the phonetic character. Character candidate extraction means for extracting ideographic characters from the character recording unit as ideographic character candidates, candidate order determination means for determining the display order of candidates extracted by the candidate extraction means, and the candidate order determination means Display control means for outputting data so as to display candidates based on the display order, and an ideographic character or ideographic character string input in the past; The relevance degree is a degree of relevance indicating a high possibility that the ideogram or the ideographic character string is input behind the front character or the front character string in association with the front character or the front character string inputted in front. Stored in the recording unit, the candidate order determining means detects a degree of association between each candidate and a forward character or a forward character string input in front of the candidate from the association degree recording unit, The display order is determined so that candidates with higher relevance are displayed with higher priority.
あるいは、本発明の文字変換装置は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字を入力する文字変換装置において、上記表意文字と、該表意文字を含む表意文字列とを関連付けて記録する文字列記録部と、ユーザにより選択された表意文字を受け付けて、該表意文字に関連付けられている表意文字列を、表意文字列の候補として上記文字列記録部から抽出する文字列候補抽出手段と、上記文字列候補抽出手段が抽出した候補の表示順序を決定する候補順序決定手段と、上記候補順序決定手段が決定した表示順序に基づいて候補を表示するようデータを出力する表示制御手段とを備え、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前よりさらに前方に入力された前方文字または前方文字列とを対応付けて、上記前方文字または前方文字列の後方に該表意文字または表意文字列が入力される可能性の高さを示す関連度が関連度記録部に記憶されており、上記候補順序決定手段は、上記関連度記録部から、上記候補の前方に入力されている前方文字または前方文字列と、各候補との関連度を検出し、該関連度が高い候補ほど優先して表示されるよう表示順序を決定することを特徴としている。 Alternatively, the character conversion device of the present invention converts the input phonetic character or phonetic character string into a corresponding ideogram, and inputs the ideogram selected by the user. A character string recording unit that records the ideographic character string including the ideographic character in association with each other, accepts the ideographic character selected by the user, and uses the ideographic character string associated with the ideographic character as a candidate for the ideographic character string. Based on the character string candidate extracting means extracted from the character string recording unit, the candidate order determining means for determining the display order of the candidates extracted by the character string candidate extracting means, and the display order determined by the candidate order determining means Display control means for outputting data so as to display candidates, and an ideographic character or ideographic character string input in the past, and further forward from immediately before the ideographic character or ideographic character string The relevance degree recording unit associates the inputted front character or the front character string with each other and indicates the degree of possibility that the ideographic character or the ideographic character string is input behind the front character or the front character string. And the candidate order determination means detects the degree of association between each candidate and the forward character or the forward character string input in front of the candidate from the association degree recording unit. The display order is determined so that the higher the candidate is, the higher the priority is displayed.
これにより、ユーザは、表音文字の入力に係る操作数について、さらに少ない操作数で、所望の表意文字の入力を得ることが可能となる。 As a result, the user can obtain a desired ideogram input with a smaller number of operations related to the input of phonogram characters.
さらに、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前に入力された直前文字または直前文字列とを対応付けて、上記直前文字または直前文字列の直後に該表意文字または表意文字列が入力される可能性の高さを示す連続度が連続度記録部に記憶されており、上記候補順序決定手段は、上記前方文字または前方文字列との関連度、および、上記直前文字または直前文字列との連続度が高い候補ほど優先して表示されるよう表示順序を決定することが好ましい。 Further, an ideographic character or ideographic character string input in the past is associated with the immediately preceding character or immediately preceding character string input immediately before the ideographic character or ideographic character string, and immediately after the immediately preceding character or immediately preceding character string. The continuity indicating the high possibility that the ideogram or the ideogram is input is stored in the continuity recording unit, and the candidate order determining means includes the relevance with the forward character or the forward character string, In addition, it is preferable to determine the display order so that candidates with higher continuity with the immediately preceding character or the immediately preceding character string are displayed with higher priority.
さらに、上記文字変換装置の文字候補抽出手段は、ユーザにより入力された表音文字を受け付ける度に、該表音文字をすでに受け付けた表音文字列の末尾に連結し、該連結によって得られた表音文字列に対応する表意文字を候補として抽出することが好ましい。 Further, the character candidate extraction unit of the character conversion device connects the phonetic character to the end of the received phonetic character string every time it receives a phonetic character input by the user, and is obtained by the connection. It is preferable to extract ideographic characters corresponding to the phonetic character string as candidates.
さらに、上記文字変換装置の上記学習制御手段は、上記学習語記録部に記録する対象となる学習語としての、上記学習文字または学習文字列、もしくは、上記ペア学習文字またはペア学習文字列を分類するためのグループ識別子を生成し、該グループ識別子を各学習語に関連付けて上記学習語記録部に記録し、上記グループ識別子は、上記学習語を構成する表意文字にあらかじめ割り当てられた、所定の長さの文字コードに基づいて生成されることが好ましい。 Further, the learning control means of the character conversion device classifies the learning character or learning character string, or the pair learning character or pair learning character string as a learning word to be recorded in the learning word recording unit. A group identifier is generated, and the group identifier is recorded in the learning word recording unit in association with each learning word. The group identifier is a predetermined length assigned in advance to ideographic characters constituting the learning word. Preferably, it is generated based on the character code.
さらに、上記文字変換装置は、上記候補順序決定手段が候補の表示順序を決定する際に参照する所定の条件である、上記候補がユーザに選択される可能性の大きさを示す評価値の算出に使用可能な複数種類の要素から、ユーザにより指定された要素を設定する候補順序決定要素設定手段を備え、上記各候補に対応付けて上記関連度とは異なる要素が要素記録部に記憶されており、上記候補順序決定手段は、上記関連度と、上記候補順序決定要素設定手段によって設定された上記要素記録部に記憶されている要素とに基づき、候補の表示順序を決定することが好ましい。 Furthermore, the character conversion device calculates an evaluation value indicating a degree of possibility that the candidate is selected by the user, which is a predetermined condition to be referred to when the candidate order determination unit determines the display order of the candidates. A candidate order determination element setting means for setting an element designated by the user from a plurality of types of elements that can be used for the element, and an element different from the relevance level is stored in the element recording unit in association with each candidate The candidate order determining means preferably determines the display order of candidates based on the relevance and the elements stored in the element recording unit set by the candidate order determining element setting means.
本発明に係る文字入力方法は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字または表意文字列を入力する文字変換装置における文字入力方法において、上記文字変換装置は、文字候補抽出手段と、候補順序決定手段と、表示制御手段とを備えており、上記文字候補抽出手段が、ユーザにより入力された表音文字を受け付けて、該表音文字に関連付けられている表意文字を、上記表音文字と、該表音文字を含む表音文字列に対応する表意文字とを関連付けて記録する文字記録部から、表意文字の候補として抽出する第1ステップと、上記候補順序決定手段が、上記第1ステップにて抽出した候補の表示順序を決定する第2ステップと、上記表示制御手段が、上記第2ステップにて決定した表示順序に基づいて候補を表示するようデータを出力する第3ステップとを含み、上記第2ステップは、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前よりさらに前方に入力された前方文字または前方文字列とを対応付けて、上記前方文字または前方文字列の後方に該表意文字または表意文字列が入力される可能性の高さを示す関連度を記憶する関連度記録部から、上記候補の前方に入力されている前方文字または前方文字列と、各候補との関連度を検出し、該関連度が高い候補ほど優先して表示されるよう表示順序を決定するステップを含むことを特徴としている。 A character input method according to the present invention is a character input method in a character conversion device that converts an input phonetic character or phonetic character string into a corresponding ideographic character and inputs an ideographic character or ideographic character string selected by the user. The character conversion device includes character candidate extraction means, candidate order determination means, and display control means. The character candidate extraction means accepts a phonetic character input by a user, The ideogram associated with the phonetic character is extracted as an ideographic character candidate from a character recording unit that records the phonogram and the ideogram corresponding to the phonogram string including the phonogram in association with each other. A first step, a second step in which the candidate order determining means determines the display order of the candidates extracted in the first step, and a table determined by the display control means in the second step. A third step of outputting data so as to display candidates based on the order, wherein the second step further includes an ideographic character or ideographic character string input in the past, and immediately before the ideographic character or ideographic character string. Associating with the forward character or the forward character string inputted in front, the degree of relevance indicating the possibility that the ideographic character or the ideographic character string is inputted behind the forward character or the forward character string is stored. From the relevance level recording unit, the degree of relevance between the front character or the front character string input in front of the candidate and each candidate is detected, and the display order is set so that the candidate having the higher relevance degree is displayed with priority. It is characterized by including the step to determine.
以上のことから、所望の表意文字(漢字)を得るための、表音文字(ピンイン)の入力操作を簡素化することが可能な文字変換装置を提供することができる。 From the above, it is possible to provide a character conversion device that can simplify the input operation of phonetic characters (pinyin) to obtain a desired ideogram (kanji).
本発明に係る文字入力方法は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字を入力する文字変換装置における文字入力方法において、上記文字変換装置は、文字候補抽出手段と、候補順序決定手段と、表示制御手段とを備えており、上記文字候補抽出手段が、ユーザにより選択された表意文字を受け付けて、該表意文字に関連付けられている表意文字列を、上記表意文字と該表意文字を含む表意文字列とを関連付けて記録する文字列記録部から、表意文字列の候補として抽出する第1ステップと、上記候補順序決定手段が、上記第1ステップにて抽出した候補の表示順序を決定する第2ステップと、上記表示制御手段が、上記第2ステップにて決定した表示順序に基づいて候補を表示するようデータを出力する第3ステップとを含み、上記第2ステップは、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前よりさらに前方に入力された前方文字または前方文字列とを対応付けて、上記前方文字または前方文字列の後方に該表意文字または表意文字列が入力される可能性の高さを示す関連度を記憶する関連度記録部から、上記候補の前方に入力されている前方文字または前方文字列と、各候補との関連度を検出し、該関連度が高い候補ほど優先して表示されるよう表示順序を決定するステップを含むことを特徴としている。 The character input method according to the present invention is a character input method in a character conversion device for converting an input phonetic character or a phonetic character string into a corresponding ideogram and inputting an ideogram selected by a user. The conversion device includes character candidate extraction means, candidate order determination means, and display control means. The character candidate extraction means accepts an ideographic character selected by a user and associates it with the ideographic character. A first step of extracting the ideographic character string as a candidate for the ideographic character string from a character string recording unit for recording the ideographic character string in association with the ideographic character string including the ideographic character, and the candidate order determining means, A second step of determining the display order of the candidates extracted in the first step, and the display control means displays the candidates based on the display order determined in the second step A third step of outputting the data, wherein the second step includes an ideographic character or ideographic character string input in the past, and a forward character or a forward character input in front of the ideographic character or ideographic character string. From the relevance level recording unit that stores a relevance level that indicates a high possibility that the ideographic character or the ideographic character string is input behind the front character or the front character string in association with the front character string. Detecting a degree of association between the forward character or the forward character string input in front of each candidate and each candidate, and determining a display order so that a candidate having a higher degree of association is displayed with priority. It is said.
本発明は上述した各実施形態、各実施例に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。 The present invention is not limited to the above-described embodiments and examples, and various modifications can be made within the scope of the claims. That is, embodiments obtained by combining technical means appropriately modified within the scope of the claims are also included in the technical scope of the present invention.
本発明は、読み(表音文字)を変換する、特に読みを漢字に変換する各種装置に適用することができる。 The present invention can be applied to various devices that convert readings (phonetic characters), and in particular, convert readings to kanji.
Claims (22)
変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報、および、入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、
単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報、および、単語の先頭となる変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、
入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得手段と、
取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得手段と、
を備えていることを特徴とする、文字変換装置。In a character conversion device capable of converting an input character string made up of one or more input phonograms into converted characters and determining a word made up of the converted characters,
Conversion character correspondence information in which conversion character identification information for identifying a conversion character and conversion character phonetic information indicating a phonetic of the conversion character are associated with each other, an input phonetic character, and the phonetic A conversion character dictionary having a conversion character index in which the conversion character identification information having a character as the head of the conversion character phonetic information is associated with conversion character storage destination information indicating a storage destination in the conversion character correspondence information. When,
Word identification information for identifying a word, word correspondence information in which word phonetic information indicating the phonetic expression of the word is associated, and head conversion character identification for identifying a conversion character that is the head of the word A word dictionary having information and a word index in which word storage destination information indicating a storage destination in the word correspondence information of a word having a conversion character indicated by the head conversion character identification information at the head is associated with each other;
Conversion character identification information that refers to the conversion character dictionary based on the input phonetic character of the input character string and has the head phonetic character of the input character string as the head of the conversion character phonetic information First conversion character acquisition means for acquiring
Based on the acquired head conversion character identification information, referring to the word dictionary, a word acquisition means for acquiring a word having a conversion character at the head indicated by the head conversion character identification information;
A character conversion device comprising:
上記ユーザにより選択された先頭変換文字を受け付ける受付手段と、を備え、
上記単語取得手段は、上記選択された先頭変換文字の先頭変換文字識別情報に基づいて、単語を取得する処理を行うことを特徴とする請求項1に記載の文字変換装置。Display control means for displaying on the display unit the head conversion character indicated by the head conversion character identification information acquired by the head conversion character acquisition means so that the user can select it;
Receiving means for receiving the first conversion character selected by the user,
The character conversion apparatus according to claim 1, wherein the word acquisition unit performs a process of acquiring a word based on the first conversion character identification information of the selected first conversion character.
上記表示制御手段は、上記表示補助情報に基づき、先頭変換文字を並べ替えて、ユーザが選択可能に表示部に表示することを特徴とする請求項2に記載の文字変換装置。In the converted character correspondence information, display auxiliary information about the converted character indicated by the converted character identification information is further associated with the converted character identification information,
3. The character conversion apparatus according to claim 2, wherein the display control means rearranges the head conversion characters based on the display auxiliary information, and displays them on the display unit so that the user can select them.
単語の先頭となる先頭変換文字毎に、上記先頭変換文字識別情報と、単語の2文字目の先頭の表音文字である2文字目先頭表音文字との組み合わせに対して、上記単語対応情報における格納先が割り振られていることを特徴とする請求項1〜3の何れか1項に記載の文字変換装置。The word index of the above word dictionary is
For each head conversion character that is the head of a word, the above word correspondence information for the combination of the head conversion character identification information and the second head phonetic character that is the first phonetic character of the second character of the word The character conversion device according to any one of claims 1 to 3, wherein a storage location is assigned.
上記先頭変換文字取得手段は、上記取得補助情報を基に上記変換文字識別情報を取得することを特徴とする請求項1〜4の何れか1項に記載の文字変換装置。In the conversion character correspondence information, acquisition auxiliary information about the conversion character indicated by the conversion character identification information is further associated with the conversion character identification information,
The character conversion device according to claim 1, wherein the head conversion character acquisition unit acquires the conversion character identification information based on the acquisition auxiliary information.
(1)変換文字識別情報が示す変換文字が、上記入力文字列に対して、無条件に取得対象となるという情報
(2)変換文字識別情報が示す変換文字が、上記入力文字列が1文字では、取得対象外になるという情報
(3)変換文字識別情報が示す変換文字が、上記入力文字列が2文字以下では、取得対象外になるという情報
(4)変換文字識別情報が示す変換文字が、上記入力文字列が3文字以下では、取得対象外になるとういう情報6. The character conversion apparatus according to claim 5, wherein the acquisition auxiliary information is classified into the following four pieces of information.
(1) Information that the conversion character indicated by the conversion character identification information is unconditionally acquired with respect to the input character string. (2) The conversion character indicated by the conversion character identification information is one character of the input character string. (3) Information that the converted character indicated by the converted character identification information is not acquired if the input character string is 2 characters or less (4) The converted character indicated by the converted character identification information However, if the input string is 3 characters or less
上記変換文字対応情報では、漢字の先頭の表音文字が同一、かつ、声調コードが同一の、上記変換文字識別情報である漢字識別情報がグループとしてまとめられており、
中国語変換装置として用いられることを特徴とする請求項1〜8の何れか1項に記載の文字変換装置。The conversion character is Kanji,
In the conversion character correspondence information, the kanji identification information which is the conversion character identification information having the same phonogram at the beginning of the kanji and the same tone code is grouped together.
It is used as a Chinese conversion apparatus, The character conversion apparatus of any one of Claims 1-8 characterized by the above-mentioned.
変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報、および、入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、
単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報、および、単語の先頭となる変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、
を用いて、
入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得ステップと、
取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得ステップと、
を含む処理を行うことを特徴とする、文字変換装置の制御方法。In a control method of a character conversion device capable of converting an input character string composed of one or more input phonograms into converted characters and determining a word composed of the converted characters,
Conversion character correspondence information in which conversion character identification information for identifying a conversion character and conversion character phonetic information indicating a phonetic of the conversion character are associated with each other, an input phonetic character, and the phonetic A conversion character dictionary having a conversion character index in which the conversion character identification information having a character as the head of the conversion character phonetic information is associated with conversion character storage destination information indicating a storage destination in the conversion character correspondence information. When,
Word identification information for identifying a word, word correspondence information in which word phonetic information indicating the phonetic expression of the word is associated, and head conversion character identification for identifying a conversion character that is the head of the word A word dictionary having information and a word index in which word storage destination information indicating a storage destination in the word correspondence information of a word having a conversion character indicated by the head conversion character identification information at the head is associated with each other;
Using,
Conversion character identification information that refers to the conversion character dictionary based on the input phonetic character of the input character string and has the head phonetic character of the input character string as the head of the conversion character phonetic information A first conversion character acquisition step for acquiring
A word acquisition step of referring to the word dictionary based on the acquired head conversion character identification information and acquiring a word having a conversion character at the head indicated by the head conversion character identification information;
A method for controlling a character conversion device, comprising performing processing including:
上記先頭変換文字取得手段が取得した先頭変換文字識別情報が示す先頭変換文字の表示順序を、上記表示補助情報に基づき決定する順序決定手段と、
上記順序決定手段が決定した表示順序に基づいて上記先頭変換文字をユーザが選択可能に表示部に表示する表示制御手段とを備えていることを特徴とする請求項1に記載の文字変換装置。The conversion character identification information is associated with display auxiliary information about the conversion character indicated by the conversion character identification information,
Order determining means for determining the display order of the head conversion characters indicated by the head conversion character identification information acquired by the head conversion character acquisition means based on the display auxiliary information;
2. The character conversion apparatus according to claim 1, further comprising display control means for displaying the first converted character on the display unit so that the user can select the first converted character based on the display order determined by the order determining means.
上記順序決定手段は、先頭変換文字が上記学習語記録部に記録された学習文字であるか否かを示す表示補助情報に基づいて、上記先頭変換文字取得手段が取得した先頭変換文字が学習文字であるか否かを判断して、学習文字である上記先頭変換文字が他の先頭変換文字に優先して表示されるように表示順序を決定することを特徴とする請求項17に記載の文字変換装置。Learning control means for recording the first conversion character selected by the user as a learning character in a learning word recording unit,
The order determination means determines whether the first conversion character acquired by the first conversion character acquisition means is a learning character based on display auxiliary information indicating whether the first conversion character is a learning character recorded in the learning word recording unit. 18. The character according to claim 17, wherein the display order is determined so that the first conversion character as a learning character is displayed with priority over other first conversion characters. Conversion device.
上記順序決定手段は、上記学習時期が新しい先頭変換文字ほど優先して表示されるように表示順序を決定することを特徴とする請求項18に記載の文字変換装置。In the learning word recording unit, a learning time indicating a time when the first conversion character is recorded as a learning character by the learning control unit is stored in association with each first conversion character as the display auxiliary information,
19. The character conversion apparatus according to claim 18, wherein the order determination means determines the display order so that the first conversion character with the new learning time is displayed with priority.
上記単語取得手段が取得した単語の表示順序を、上記表示補助情報に基づき決定する順序決定手段と、
上記順序決定手段が決定した表示順序に基づいて上記単語をユーザが選択可能に表示部に表示する表示制御手段とを備えていることを特徴とする請求項1に記載の文字変換装置。The word identification information is associated with display auxiliary information about the word indicated by the word identification information,
Order determination means for determining the display order of the words acquired by the word acquisition means based on the display auxiliary information;
2. The character conversion device according to claim 1, further comprising display control means for displaying the word on the display unit so that the user can select the word based on the display order determined by the order determination means.
上記順序決定手段は、単語が上記学習語記録部に記録された学習単語であるか否かを示す表示補助情報に基づいて、上記単語取得手段が取得した単語が学習単語であるか否かを判断して、学習単語である上記単語が他の単語に優先して表示されるように表示順序を決定することを特徴とする請求項20に記載の文字変換装置。Learning control means for recording the word selected by the user as a learning word in a learning word recording unit;
The order determination means determines whether the word acquired by the word acquisition means is a learning word based on display auxiliary information indicating whether the word is a learning word recorded in the learning word recording unit. 21. The character conversion device according to claim 20, wherein the display order is determined so that the learning word is displayed with priority over other words.
上記順序決定手段は、上記学習時期が新しい単語ほど優先して表示されるように表示順序を決定することを特徴とする請求項21に記載の文字変換装置。The learning word recording unit stores a learning time indicating the time when the word was recorded as a learning word by the learning control unit in association with each word as the display auxiliary information,
The character conversion apparatus according to claim 21, wherein the order determination means determines a display order so that a word with a newer learning time is displayed with higher priority.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008528762A JP4890551B2 (en) | 2006-08-10 | 2007-07-18 | Character conversion device and method for controlling character conversion device |
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006218970 | 2006-08-10 | ||
| JP2006218970 | 2006-08-10 | ||
| JP2008528762A JP4890551B2 (en) | 2006-08-10 | 2007-07-18 | Character conversion device and method for controlling character conversion device |
| PCT/JP2007/064209 WO2008018274A1 (en) | 2006-08-10 | 2007-07-18 | Character converting device and character converting device control method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2008018274A1 JPWO2008018274A1 (en) | 2009-12-24 |
| JP4890551B2 true JP4890551B2 (en) | 2012-03-07 |
Family
ID=39032808
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008528762A Active JP4890551B2 (en) | 2006-08-10 | 2007-07-18 | Character conversion device and method for controlling character conversion device |
Country Status (3)
| Country | Link |
|---|---|
| JP (1) | JP4890551B2 (en) |
| CN (1) | CN101553810A (en) |
| WO (1) | WO2008018274A1 (en) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9195645B2 (en) * | 2012-07-30 | 2015-11-24 | Microsoft Technology Licensing, Llc | Generating string predictions using contexts |
| JP6491438B2 (en) * | 2014-08-29 | 2019-03-27 | 株式会社日立社会情報サービス | Migration support device |
| CN105404677B (en) * | 2015-11-20 | 2018-12-18 | 四川神琥科技有限公司 | A kind of search method based on tree structure |
| CN105426490B (en) * | 2015-11-20 | 2019-03-26 | 四川神琥科技有限公司 | A kind of indexing means based on tree structure |
| JP7446943B2 (en) | 2020-08-18 | 2024-03-11 | 株式会社日立製作所 | Information representation creation support device, information representation creation support method, and computer program |
| JP7543788B2 (en) * | 2020-08-31 | 2024-09-03 | 株式会社リコー | Display device, input method, and program |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0388662A (en) * | 1989-08-31 | 1991-04-15 | Toshiba Seiki Kk | form connection device |
| JPH04225415A (en) * | 1990-12-26 | 1992-08-14 | Mitsubishi Electric Corp | Pinyin kanji input system |
| JP2004005379A (en) * | 2002-04-16 | 2004-01-08 | Fujitsu Ltd | Information processing apparatus, information processing method, information processing program, and recording medium |
| JP2006050160A (en) * | 2004-08-03 | 2006-02-16 | Sharp Corp | Chinese input device, Chinese input program, and Chinese input recording medium |
| JP2006155322A (en) * | 2004-11-30 | 2006-06-15 | Nec Fielding Ltd | Input prediction dictionary system and input prediction method |
| JP2007188449A (en) * | 2006-01-16 | 2007-07-26 | Sharp Corp | Character input device, copier equipped with character input device, character input method, control program, and recording medium |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0540946U (en) * | 1991-10-29 | 1993-06-01 | カシオ計算機株式会社 | Word processor |
-
2007
- 2007-07-18 JP JP2008528762A patent/JP4890551B2/en active Active
- 2007-07-18 CN CNA2007800376037A patent/CN101553810A/en active Pending
- 2007-07-18 WO PCT/JP2007/064209 patent/WO2008018274A1/en not_active Ceased
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0388662A (en) * | 1989-08-31 | 1991-04-15 | Toshiba Seiki Kk | form connection device |
| JPH04225415A (en) * | 1990-12-26 | 1992-08-14 | Mitsubishi Electric Corp | Pinyin kanji input system |
| JP2004005379A (en) * | 2002-04-16 | 2004-01-08 | Fujitsu Ltd | Information processing apparatus, information processing method, information processing program, and recording medium |
| JP2006050160A (en) * | 2004-08-03 | 2006-02-16 | Sharp Corp | Chinese input device, Chinese input program, and Chinese input recording medium |
| JP2006155322A (en) * | 2004-11-30 | 2006-06-15 | Nec Fielding Ltd | Input prediction dictionary system and input prediction method |
| JP2007188449A (en) * | 2006-01-16 | 2007-07-26 | Sharp Corp | Character input device, copier equipped with character input device, character input method, control program, and recording medium |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2008018274A1 (en) | 2009-12-24 |
| CN101553810A (en) | 2009-10-07 |
| WO2008018274A1 (en) | 2008-02-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101004738B (en) | Character input device and method, copy machine possessing character input device | |
| US7061403B2 (en) | Apparatus and method for input of ideographic Korean syllables from reduced keyboard | |
| CN101292214B (en) | Improved text entry in the shorthand interface on the keyboard | |
| CN101067780B (en) | Character inputting system and method for intelligent equipment | |
| CN1154912C (en) | Method and apparatus for entering text messages from a keypad | |
| JP4829901B2 (en) | Method and apparatus for confirming manually entered indeterminate text input using speech input | |
| CN101681198A (en) | Providing relevant text auto-completions | |
| JP2006216044A (en) | Dictionary learning method, apparatus used therefor, and input method and user terminal unit using the same method | |
| JP4890551B2 (en) | Character conversion device and method for controlling character conversion device | |
| KR102182672B1 (en) | The method for searching integrated multilingual consonant pattern and apparatus thereof | |
| EP2994841A1 (en) | Information processing apparatus, information processing method, and program | |
| CN104635949A (en) | Chinese character input device and method | |
| CN1862472B (en) | System and method for abbreviated handwriting input of ideographic language phrases by submitting partial words and/or partial strokes of any given word | |
| US8296679B2 (en) | Method of learning character segments from received text, and associated handheld electronic device | |
| JP2013214187A (en) | Character input device, method for controlling character input device, control program and recording medium | |
| CN111857362A (en) | Character input method and character input device | |
| KR20200132070A (en) | Apparatus and method for inputting chinese characters | |
| KR20020021182A (en) | Method and apparatus for inputting Chinese characters using information of tone | |
| JP3376808B2 (en) | Word input device and word input method | |
| EP1665009A2 (en) | Apparatus and method for input of ideographic korean syllables from reduced keyboard | |
| HK1105314B (en) | Character input device and its method with copying machine including the same | |
| CN1991743A (en) | Method and device for voice input method | |
| CN110658923A (en) | Method and device for quickly inputting pinyin and Chinese characters | |
| CA2658586C (en) | Learning character segments from received text | |
| JP6507482B2 (en) | Character input device, character input method, and character input program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111122 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111214 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4890551 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141222 Year of fee payment: 3 |