Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4890551B2 - Character conversion device and method for controlling character conversion device - Google Patents
[go: Go Back, main page]

JP4890551B2 - Character conversion device and method for controlling character conversion device - Google Patents

Character conversion device and method for controlling character conversion device Download PDF

Info

Publication number
JP4890551B2
JP4890551B2 JP2008528762A JP2008528762A JP4890551B2 JP 4890551 B2 JP4890551 B2 JP 4890551B2 JP 2008528762 A JP2008528762 A JP 2008528762A JP 2008528762 A JP2008528762 A JP 2008528762A JP 4890551 B2 JP4890551 B2 JP 4890551B2
Authority
JP
Japan
Prior art keywords
character
word
conversion
kanji
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008528762A
Other languages
Japanese (ja)
Other versions
JPWO2008018274A1 (en
Inventor
斉志 広瀬
充宏 斗谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2008528762A priority Critical patent/JP4890551B2/en
Publication of JPWO2008018274A1 publication Critical patent/JPWO2008018274A1/en
Application granted granted Critical
Publication of JP4890551B2 publication Critical patent/JP4890551B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、ユーザが、キーボードやタッチパネル、タブレット、マウス等のポインティングデバイスを使って文字あるいは文字列を入力するための装置であり、変換指示を受け付けて、入力された文字あるいは文字列に応じて、変換された文字あるいは文字列を選択可能に表示し、この表示された文字あるいは文字列をユーザが選択することで所望の文字あるいは文字列の入力が行われる文字変換装置に関するものである。  The present invention is an apparatus for a user to input a character or a character string using a pointing device such as a keyboard, a touch panel, a tablet, or a mouse, receives a conversion instruction, and according to the input character or character string The present invention relates to a character conversion device that displays a converted character or character string so that the user can select the displayed character or character string, and allows the user to input a desired character or character string.

日本語や中国語などの漢字や単語を、ユーザがキーボードを用いて情報機器へ文字入力し表示させるには、漢字や単語に対する読み(表音文字)を入力し、変換指示操作を行うことで実現されている。読みを漢字に変換するには、読みと漢字や単語とを関連付けた辞書データが必要であり、辞書データの語彙数の量が情報機器(入力システム)の性能の一面となっている。  In order for the user to input and display kanji and words such as Japanese and Chinese on the information device using the keyboard, the user can input readings (phonetic characters) for kanji and words and perform conversion instruction operations. It has been realized. In order to convert readings into kanji, dictionary data that associates readings with kanji and words is necessary, and the amount of vocabulary in the dictionary data is one aspect of the performance of the information device (input system).

しかし、語彙数が多くなると、情報機器では、入力された読みに一致する漢字を辞書データから検索する時間が増加する。そのため、ユーザが読みを入力し変換を指示してから、変換結果を表示するまでのレスポンスが悪くなり、結果的に情報機器の使いにくさに繋がる。  However, as the number of vocabularies increases, the information device increases the time for searching the dictionary data for kanji that matches the input reading. For this reason, the response from when the user inputs a reading and gives a conversion instruction until the conversion result is displayed deteriorates, resulting in difficulty in using the information device.

そこで、漢字や単語の検索時間を削減するための工夫が行われている。例えば、辞書中の単語について、読みの先頭文字毎にその先頭文字の読みで始まる単語の読みの最大文字数を索引情報中に持たせることで、入力文字列に対する検索対象の制限を行い、検索に関する処理量の削減を行う変換装置がある(例えば、特許文献1参照)。
日本国公開特許公報特開平6−149787公報(1994年5月31日公開)
Therefore, ingenuity has been made to reduce the search time for kanji and words. For example, for words in the dictionary, the index information has the maximum number of readings of words starting with the reading of the first character for each first character of the reading, thereby limiting the search target for the input character string and There is a conversion device that reduces the amount of processing (for example, see Patent Document 1).
Japanese Patent Publication No. 6-149787 (published May 31, 1994)

しかしながら、上記従来の装置では、入力された読みの文字数が、索引情報に記録されている入力読み文字列の先頭文字の読みで始まる単語の読みの最大文字数以内であれば、その読みの範囲の全辞書データと一致しているか否かをくまなくチェックする必要がある。そのため、変換できる語彙数を増やすために辞書データに収録する語彙数が増加すると、先頭読み文字毎の漢字、単語数が多くなり、前記条件の時の処理時間が増加する。結局、表示出力までのレスポンスが低下してしまい、情報機器は使いにくいものとなってしまう。  However, in the above-described conventional apparatus, if the number of input characters is within the maximum number of words that start reading the first character of the input character string recorded in the index information, It is necessary to check all the data to see if it matches all dictionary data. Therefore, when the number of vocabulary recorded in the dictionary data is increased in order to increase the number of vocabularies that can be converted, the number of kanji and words for each first reading character increases, and the processing time under the above conditions increases. Eventually, the response until display output is reduced, and the information device becomes difficult to use.

本発明は、上記の問題点に鑑みてなされたものであり、その目的は、入力された表音文字に対する単語の検索時間を短縮できる文字変換装置、文字入力方法、文字入力プログラムおよびコンピュータ読取可能な記録媒体を実現することにある。  The present invention has been made in view of the above-described problems, and its object is to provide a character conversion device, a character input method, a character input program, and a computer readable program that can shorten a word search time for an input phonetic character. Is to realize a simple recording medium.

本発明に係る文字変換装置は、上記課題を解決するために、入力された1以上の表音文字よりなる入力文字列を変換文字に変換し、当該変換文字からなる単語を決定できる文字変換装置において、
(a−1)変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報および、(a−2)入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、
(b−1)単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報および、(b−2)単語の先頭となる先頭変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す先頭変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、
(c)入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得手段と、
(d)取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得手段と、を備えていることを特徴としている。
In order to solve the above problems, a character conversion device according to the present invention converts an input character string made up of one or more input phonetic characters into a converted character, and can determine a word made up of the converted character. In
(A-1) conversion character identification information for identifying a conversion character and conversion character correspondence information in which conversion character phonetic information indicating the phonetic of the conversion character is associated, and (a-2) input And the converted character storage location information indicating the storage location in the converted character correspondence information of the converted character identification information having the phonetic character as the head of the converted character phonetic information. A converted character dictionary having a converted character index;
(B-1) word correspondence information in which word identification information for identifying a word and word phonetic information indicating the phonetic expression of the word are associated with each other, and (b-2) head conversion that becomes the head of the word First conversion character identification information for identifying a character is associated with word storage destination information indicating the storage destination of the word having the first conversion character indicated by the first conversion character identification information in the word correspondence information. A word dictionary having a word index,
(C) Conversion with reference to the converted character dictionary based on the first phonogram of the input character string that is input, and having the first phonogram of the input character string as the head of the converted character phonogram information First conversion character acquisition means for acquiring character identification information;
(D) word acquisition means for referring to the word dictionary based on the acquired head conversion character identification information and acquiring a word having the conversion character indicated by the head conversion character identification information at the head; It is characterized by that.

上記構成によると、初めに先頭変換文字取得手段が、変換文字辞書を参照に、入力文字列の先頭の表音文字から、変換文字を検索し、次に、単語取得手段が、単語辞書を参照に、先頭変換文字取得手段が取得した変換文字を先頭に持つ単語を取得することができる。よって、単語の検索処理に係る時間を短縮できる。つまり、入力文字列と表音(読み)情報との比較を行う回数が制限できるので、応答速度の速い文字変換装置を提供することができる。  According to the above configuration, the first conversion character acquisition unit first searches for the conversion character from the first phonogram of the input character string with reference to the conversion character dictionary, and then the word acquisition unit references the word dictionary. In addition, it is possible to acquire a word having the conversion character acquired by the head conversion character acquisition means at the head. Therefore, the time related to the word search process can be shortened. That is, since the number of comparisons between the input character string and the phonetic (reading) information can be limited, a character conversion device with a high response speed can be provided.

ここで、変換文字とは、変換された後の文字を示している。変換文字が漢字であるとすると、表音文字(読み)の先頭文字は次のようになる。例えば、中国語で、「  Here, the conversion character indicates a character after conversion. If the converted character is kanji, the first character of the phonetic character (reading) is as follows. For example, in Chinese,

Figure 0004890551
Figure 0004890551

(以下では「外字1」とする)」の読みを表記すると「meinian」であり、「m」が読みの先頭文字にあたる。また、日本語で、「毎年」の読みを表記すると、「まいとし」なので、先頭文字は「ま」である。(Hereinafter referred to as “external character 1”) is “mainian”, and “m” is the first character of the reading. Also, in Japanese, the reading of “every year” is “Mai”, so the first character is “ma”.

また、先頭変換文字は、例えば「外字1」では、「  For example, in the case of “external character 1”, the leading conversion character is “

Figure 0004890551
Figure 0004890551

(以下では「外字2」とする)」に当たる。変換文字表音情報は、例えば「外字1」では、「meinian」である。(Hereinafter referred to as “external character 2”). The converted character phonetic information is, for example, “mainian” in “external character 1”.

なお、変換文字識別情報は、変換後の文字である変換文字を識別できる情報であればどのようなものでもよく、変換文字そのものであってもよい。例えば、変換文字が漢字である場合、漢字そのものであってもよいし、漢字コードであってもよい。これは、単語識別情報と、先頭変換文字識別情報とについても同様である。  The converted character identification information may be any information as long as it is information that can identify the converted character that is the character after conversion, or may be the converted character itself. For example, when the conversion character is a kanji, it may be a kanji itself or a kanji code. The same applies to the word identification information and the head conversion character identification information.

本発明のさらに他の目的、特徴、および優れた点は、以下に示す記載によって十分わかるであろう。また、本発明の利益は、添付図面を参照した次の説明で明白になるであろう。  Other objects, features, and advantages of the present invention will be fully understood from the following description. The benefits of the present invention will become apparent from the following description with reference to the accompanying drawings.

本発明の一実施形態を示すものであり、文字変換装置の要部構成を示すブロック図である。BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1, showing an embodiment of the present invention, is a block diagram showing a main configuration of a character conversion device. 上記文字変換装置が行う文字の変換についての処理のフローを示す図である。It is a figure which shows the flow of a process about the conversion of the character which the said character conversion apparatus performs. 本発明の実施例に係る漢字インデックスを説明する図である。It is a figure explaining the Chinese character index which concerns on the Example of this invention. 本発明の実施例に係る漢字対応情報を説明する図である。It is a figure explaining the kanji corresponding | compatible information which concerns on the Example of this invention. 本発明の実施例に係る1次インデックスを説明する図である。It is a figure explaining the primary index which concerns on the Example of this invention. 本発明の実施例に係る2次インデックスを説明する図である。It is a figure explaining the secondary index which concerns on the Example of this invention. 本発明の実施例に係る単語対応情報を説明する図である。It is a figure explaining the word corresponding | compatible information which concerns on the Example of this invention. 本発明の実施例に係るピンイン辞書インデックスを説明する図である。It is a figure explaining the pinyin dictionary index based on the Example of this invention. 本発明の実施例に係るピンイン辞書を説明する図である。It is a figure explaining the Pinyin dictionary which concerns on the Example of this invention. 本発明の実施例に係るピンイン分割処理例を表した図である。It is a figure showing the example of a pinyin division | segmentation process based on the Example of this invention. 本発明の実施例に係るピンイン分割処理において、確定したピンインを除くピンインの分割処理例を表した図である。In the pinyin division process according to the embodiment of the present invention, FIG. 本発明の実施形態に係る文字変換装置の要部構成を示すブロック図である。It is a block diagram which shows the principal part structure of the character conversion apparatus which concerns on embodiment of this invention. 本発明の文字変換装置を適用したマルチファンクションプリンタの概略構成を示すブロック図である。1 is a block diagram showing a schematic configuration of a multifunction printer to which a character conversion device of the present invention is applied. 文字変換装置の操作パネルに表示される、文字入力処理時の操作画面の一例を示す図である。It is a figure which shows an example of the operation screen at the time of the character input process displayed on the operation panel of a character conversion apparatus. 文字変換装置の候補抽出部が候補漢字を抽出するときに参照する、漢字辞書記録部に記録されている漢字辞書の例を示す図である。It is a figure which shows the example of the Chinese character dictionary recorded in the Chinese character dictionary recording part referred when the candidate extraction part of a character conversion apparatus extracts a candidate Chinese character. 本発明の他の実施形態に係る候補熟語を抽出する文字変換装置の要部構成を示すブロック図である。It is a block diagram which shows the principal part structure of the character conversion apparatus which extracts the candidate idiom which concerns on other embodiment of this invention. 文字変換装置の操作パネルの表示部に表示される候補熟語の例を示す図である。It is a figure which shows the example of the candidate idiom displayed on the display part of the operation panel of a character conversion apparatus. 熟語辞書記録部が記録する熟語辞書の例を示す図である。It is a figure which shows the example of the idiom dictionary which a idiom dictionary recording part records. 本発明の他の実施形態に係る文字変換装置の処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a process of the character conversion apparatus which concerns on other embodiment of this invention. 操作パネル上の候補文字表示領域および確定文字表示領域の表示例を示す図である。It is a figure which shows the example of a display of the candidate character display area and fixed character display area on an operation panel. 本発明の他の実施形態に係る学習機能を備えた文字変換装置の要部構成を示すブロック図である。It is a block diagram which shows the principal part structure of the character conversion apparatus provided with the learning function which concerns on other embodiment of this invention. 候補順序決定部32のさらに詳細な構成を示すブロック図である。4 is a block diagram showing a more detailed configuration of a candidate order determination unit 32. FIG. 連結度記録部に記録される、漢字(熟語)ごとの直前(前方)文字列との連結度を示した連結度テーブルの例を示す図である。It is a figure which shows the example of the connection degree table which showed the connection degree with the character string just before (front) for every kanji (jukugo) recorded in a connection degree recording part. 文字変換装置の候補順序決定部が表示順序を決定するときの、候補の分類手順を示す図である。It is a figure which shows the classification procedure of a candidate when the candidate order determination part of a character conversion apparatus determines a display order. 候補ごとに算出した表示順序の評価値を記憶するデータ構造の一例を示す図である。It is a figure which shows an example of the data structure which memorize | stores the evaluation value of the display order calculated for every candidate. 候補順序決定要素記録部に記録される優先度情報の一例を示す図である。It is a figure which shows an example of the priority information recorded on a candidate order determination element recording part. 操作パネルの文字入力枠に筆記された漢字の例、および、該漢字の座標情報の例を示す図である。It is a figure which shows the example of the kanji written in the character input frame of the operation panel, and the example of the coordinate information of this kanji. 操作パネルの表示例を示す図であり、図28の(a)は、表示一体型タブレットの文字入力枠に筆記された漢字の一例を示す図であり、図28の(b)は、候補文字表示領域に表示された認識文字候補の例を示す図であり、図28の(c)は、候補文字表示領域に表示された候補熟語の例を示す図である。It is a figure which shows the example of a display of an operation panel, (a) of FIG. 28 is a figure which shows an example of the Chinese character written in the character input frame of a display-integrated tablet, (b) of FIG. 28 is a candidate character It is a figure which shows the example of the recognition character candidate displayed on the display area, (c) of FIG. 28 is a figure which shows the example of the candidate idiom displayed on the candidate character display area. 筆記データ「外字2」の認識結果の例を示す図である。It is a figure which shows the example of the recognition result of handwritten data "external character 2". 本発明の他の実施形態に係る繁体字を入力する文字変換装置の要部構成を示すブロック図である。It is a block diagram which shows the principal part structure of the character conversion apparatus which inputs the traditional character based on other embodiment of this invention. 本発明の他の実施形態における、繁体字入力のための注音文字入力処理時の操作画面の一例を示す図である。It is a figure which shows an example of the operation screen at the time of the phonetic character input process for the traditional character input in other embodiment of this invention. 本発明の他の実施形態における、文字変換装置の候補抽出部が候補漢字を抽出するときに参照する、漢字辞書記録部に記録されている漢字辞書の例を示す図である。It is a figure which shows the example of the Chinese character dictionary recorded on the Chinese character dictionary recording part referred when the candidate extraction part of the character conversion apparatus in another embodiment of this invention extracts a candidate Chinese character. 本発明の他の実施形態における、文字変換装置の熟語辞書記録部が記録する熟語辞書の例を示す図である。It is a figure which shows the example of the idiom dictionary which the idiom dictionary recording part of the character converter in other embodiment of this invention records. 本発明の他の実施形態における、文字変換装置の連結度記録部に記録される、漢字(熟語)ごとの直前(前方)文字列との連結度を示した連結度テーブルの例を示す図である。The figure which shows the example of the connection degree table | surface which showed the connection degree with the character string immediately before for every kanji (jukugo) recorded in the connection degree recording part of the character converter in other embodiment of this invention. is there. 操作パネルの表示部に表示される操作画面の一例を示す図である。It is a figure which shows an example of the operation screen displayed on the display part of an operation panel. 操作パネルの表示部に表示される操作画面の一例を示す図である。It is a figure which shows an example of the operation screen displayed on the display part of an operation panel. 操作パネルの表示部に表示される操作画面の一例を示す図である。It is a figure which shows an example of the operation screen displayed on the display part of an operation panel. 操作パネルの表示部に表示される操作画面の一例を示す図である。It is a figure which shows an example of the operation screen displayed on the display part of an operation panel.

本発明の一実施形態(実施形態1〜4)について図12〜38に基づいて説明すると以下の通りである。本実施形態では、一例として、入力装置と出力装置とが一体になっているタッチパネルを備えたマルチファンクションプリンタ(複写機)に、本発明の文字変換装置を適用した場合について説明する。しかし、本実施形態で説明する複写機は一例であって、本発明の文字変換装置を、携帯電話、携帯端末、パソコン、リモコンなどに適用することも可能である。  One embodiment (Embodiments 1 to 4) of the present invention is described below with reference to FIGS. In this embodiment, as an example, a case will be described in which the character conversion device of the present invention is applied to a multifunction printer (copier) having a touch panel in which an input device and an output device are integrated. However, the copying machine described in this embodiment is merely an example, and the character conversion device of the present invention can be applied to a mobile phone, a mobile terminal, a personal computer, a remote controller, and the like.

〔背景技術と問題点〕
従来の文字変換装置において表意文字を得ようとすると、表音文字よりも操作が繁雑になってしまう。表意文字の文字種は膨大な量であり、それらに1つ1つキーを割り当てることなど現実的ではない。さらに、表意文字は同音異義語が多く存在することが一般的であり、複数の表音文字の組み合わせによっても、それに対応する表意文字の候補は膨大な量となる。その結果、膨大な量の候補から適切な表意文字を選び出す作業は、ユーザに多くの手間を強いることになる。
[Background technology and problems]
If an attempt is made to obtain an ideogram in a conventional character conversion device, the operation becomes more complicated than a phonetic character. There are an enormous amount of ideographic character types, and it is not realistic to assign keys one by one. Furthermore, it is common for ideograms to have many homonyms, and even when a plurality of phonograms are combined, the number of ideogram candidates corresponding to them is enormous. As a result, the task of selecting an appropriate ideographic character from a huge amount of candidates requires a lot of time and effort for the user.

この問題点は、日本語の文字入力システムに限って生じるものではなく、同様の表意文字入力システムであれば、同様に生じるものである。例えば、中国語はピンインを利用(中国語の特徴である四声は省略)して入力する。漢字を入力するには、次のような手順で行う。入力したい漢字のピンイン表記(アルファベットの文字列)をキーボードから入力し、そのピンインに対応する漢字への変換操作を行って所望の漢字を得る。上記問題点を解決するために、所望の表意文字を得るための表意文字の入力操作を簡素化することが可能な文字変換装置について説明する。  This problem does not occur only in a Japanese character input system, but similarly occurs in a similar ideographic character input system. For example, Chinese characters are input using Pinyin (four voices that are characteristic of Chinese characters are omitted). To enter kanji, follow the steps below. A pinyin notation (alphabet character string) of a kanji to be input is input from the keyboard, and a conversion to a kanji corresponding to the pinyin is performed to obtain a desired kanji. In order to solve the above problem, a character conversion device capable of simplifying an ideographic character input operation for obtaining a desired ideographic character will be described.

また、本実施形態では、ピンイン表記(アルファベット列)から中国語(簡体字)を入力可能な文字変換装置について説明するが、本発明の文字変換装置は中国語に限定されず、種々の表音文字から所望の表意文字を得られるものである。なお、上記ピンイン表記について、中国語には本来、4種の異なる発音を表す四声が存在するが、説明の簡略化のために四声の概念を省略して説明する。  In this embodiment, a character conversion device capable of inputting Chinese (simplified characters) from Pinyin notation (alphabet string) will be described. However, the character conversion device of the present invention is not limited to Chinese, and various phonetic characters are used. From which the desired ideogram can be obtained. Note that although the Pinyin notation originally has four voices representing four different pronunciations in Chinese, the concept of the four voices will be omitted for the sake of simplicity.

〔実施形態1〕
(マルチファンクションプリンタの構成)
図13は、本発明の文字変換装置1を適用したマルチファンクションプリンタの概略構成を示すブロック図である。
Embodiment 1
(Configuration of multi-function printer)
FIG. 13 is a block diagram showing a schematic configuration of a multifunction printer to which the character conversion apparatus 1 of the present invention is applied.

マルチファンクションプリンタは、図13に示すとおり、制御部10、操作パネル(タブレット)2、一時記憶部3、記録部40、画像読取ユニット4、画像転写ユニット5、紙送りユニット6を備えている。なお、ここで説明するマルチファンクションプリンタの構成は、本発明を実施するための一例として示すものであって、本発明の範囲を限定するものではない。  As shown in FIG. 13, the multi-function printer includes a control unit 10, an operation panel (tablet) 2, a temporary storage unit 3, a recording unit 40, an image reading unit 4, an image transfer unit 5, and a paper feed unit 6. Note that the configuration of the multifunction printer described here is shown as an example for carrying out the present invention, and does not limit the scope of the present invention.

制御部10は、マルチファンクションプリンタを統括制御するものである。制御部10は、記録部40に記録されている各種プログラムを読み出して、複写機としての機能を果たす、画像読取ユニット4、画像転写ユニット5、および、紙送りユニット6などを制御し、複写などの処理を行う。また、本発明に係る文字入力処理を行うための各部もこの制御部10に含まれている。  The control unit 10 performs overall control of the multifunction printer. The control unit 10 reads out various programs recorded in the recording unit 40, controls the image reading unit 4, the image transfer unit 5, the paper feeding unit 6, and the like that function as a copying machine, and performs copying, etc. Perform the process. Each unit for performing the character input processing according to the present invention is also included in the control unit 10.

記録部40は、操作パネル2、複写機として動作するための上述の各種ユニットの制御プログラム、および、文字変換装置1の制御プログラムを記録するものであり、ROM(read only memory)などの不揮発性記憶素子で実現される。  The recording unit 40 records a control program for the above-described various units for operating as the operation panel 2 and a copying machine, and a control program for the character conversion device 1, and is a non-volatile memory such as a ROM (read only memory). Realized by a memory element.

一時記憶部3は、プログラムを処理するための作業領域、読取画像の一時記憶に利用されるほか、本実施形態では、文字入力処理時の学習文字(列)などの一時記憶に利用される。RAM(random access memory)などの揮発性メモリで実現される。  The temporary storage unit 3 is used for temporary storage of a work area for processing a program and a read image. In this embodiment, the temporary storage unit 3 is used for temporary storage of learning characters (strings) during character input processing. It is realized by a volatile memory such as a RAM (random access memory).

操作パネル2は、ユーザがマルチファンクションプリンタに対して各種処理の実行を指示するためのものである。例えば、表示装置と入力装置とが一体に形成されたタッチパネルや、表示一体型タブレットで実現される。さらに、表示一体型タブレットを用いて筆記された文字を認識する手書き文字認識機能を備えていてもよい。また、ユーザが表示一体型タブレットの指示した位置に基づいて、その指示された文字、文字列、その他機能キーなどの情報を検出する機能を備えている。  The operation panel 2 is used by the user to instruct the multifunction printer to execute various processes. For example, it is realized by a touch panel in which a display device and an input device are integrally formed, or a display-integrated tablet. Furthermore, you may provide the handwritten character recognition function which recognizes the character written using the display integrated tablet. In addition, it has a function of detecting information such as the designated character, character string, and other function keys based on the position designated by the user on the display-integrated tablet.

ユーザは、操作パネル2に表示された、アルファベット(表音文字)に対応する各キーにペンや指などで軽く触れることにより、所望のアルファベットをマルチファンクションプリンタに入力することが可能となる。  The user can input a desired alphabet into the multifunction printer by lightly touching each key displayed on the operation panel 2 corresponding to the alphabet (phonetic character) with a pen or a finger.

あるいは、上記マルチファンクションプリンタは、操作パネル2に加えて、キーボード(第1入力部/第3入力部)7(例えば、PCで使用する汎用キーボード)を備えていてもよい。この場合、操作パネル2の表示されるキー、および、キーボード7のキーのいずれを用いてもアルファベットを入力することが可能となる。表音文字を入力するためのキーを備えた入力部(第1入力部)を、操作パネル2およびキーボード7の両方で同時に実現することもできるし、キーボード7のみで実現することもできる。あるいは、表音文字の入力を操作パネル2で行うか、キーボード7で行うかを切り替えられる構成としてもよい。  Alternatively, the multifunction printer may include a keyboard (first input unit / third input unit) 7 (for example, a general-purpose keyboard used in a PC) in addition to the operation panel 2. In this case, the alphabet can be input using any of the keys displayed on the operation panel 2 and the keys on the keyboard 7. An input unit (first input unit) having a key for inputting a phonetic character can be realized simultaneously with both the operation panel 2 and the keyboard 7, or can be realized with only the keyboard 7. Or it is good also as a structure which can switch whether the input of a phonetic character is performed with the operation panel 2 or with the keyboard 7. FIG.

以下、上記文字入力処理を行う本発明の文字変換装置1について、さらに詳細に説明する。  Hereinafter, the character conversion device 1 of the present invention that performs the character input process will be described in more detail.

(文字変換装置の構成)
図12は、本実施形態に係る文字変換装置1の要部構成を示すブロック図である。文字変換装置1は、図12に示すとおり、操作パネル2、制御部10、記録部40、および、一時記憶部3を備えた構成となっている。
(Configuration of character conversion device)
FIG. 12 is a block diagram illustrating a main configuration of the character conversion device 1 according to the present embodiment. As shown in FIG. 12, the character conversion device 1 includes an operation panel 2, a control unit 10, a recording unit 40, and a temporary storage unit 3.

操作パネル2は、上述したように、表示装置と入力装置とが一体に形成されたタッチパネルで実現されている。  As described above, the operation panel 2 is realized by a touch panel in which a display device and an input device are integrally formed.

表示部12は、ユーザに各種情報を提供するものである。図14は、操作パネル2に表示される文字入力処理時の操作画面の一例を示す図である。図14に示すとおり、表示部12には、ユーザが文字を入力するためのキーボードを表示する文字入力領域121、入力の候補として挙げられている文字(または、文字列)を表示する候補文字(列)表示領域122、および、すでに入力が完了し確定している入力確定文字を表示する確定文字(列)表示領域123が表示されている。入力部11は、ユーザが中国語発音表記のピンイン(表音文字列/表音情報)を入力するためのものであり、文字入力領域121に表示されたアルファベットのキーがユーザにより押下されると、パネル上のその押下位置に対応するアルファベットの信号が、文字変換装置1の入出力制御部20に入力される。また、入力部11は、ユーザが入力を確定させたい文字を選択するためのものでもある。候補文字表示領域122に表示されている漢字(表意文字/変換文字)が押下されると、その押下位置に表示されている漢字の信号が、入出力制御部20に入力され、該漢字の入力が確定する。  The display unit 12 provides various information to the user. FIG. 14 is a diagram illustrating an example of an operation screen during character input processing displayed on the operation panel 2. As shown in FIG. 14, the display unit 12 has a character input area 121 for displaying a keyboard for the user to input characters, and candidate characters (or character strings) for displaying characters (or character strings) listed as input candidates. Column) display area 122 and a confirmed character (column) display area 123 for displaying input confirmed characters that have already been entered and confirmed. The input unit 11 is for the user to input Chinese phonetic notation Pinyin (phonetic character string / phonetic information), and when the alphabet key displayed in the character input area 121 is pressed by the user. The alphabet signal corresponding to the pressed position on the panel is input to the input / output control unit 20 of the character conversion device 1. The input unit 11 is also used by the user to select a character for which input is to be confirmed. When a Chinese character (ideographic character / converted character) displayed in the candidate character display area 122 is pressed, a signal of the Chinese character displayed at the pressed position is input to the input / output control unit 20, and the input of the Chinese character is performed. Is confirmed.

制御部10は、入出力制御部20および文字入力制御部30を制御するものである。入出力制御部20は、操作パネル2と制御部10との間でやりとりされる信号の入出力を制御するものであり、入力受付部21、表示制御部(表示制御手段)22、および、候補選択受付部23を含んでいる。文字入力制御部30は、文字入力処理を実行するものであり、候補抽出部(文字候補抽出手段/文字列候補抽出手段)31、候補順序決定部(候補順序決定手段)32、および、文字確定部(文字入力確定手段)33を含んでいる。なお、制御部10内の各部は、コンピュータの中央演算装置(CPU)およびCPUによって実行されるソフトウェアにより実現される。このソフトウェアも、上述の記録部40に格納され、一時記憶部3に読み出されてCPUにより実行される。  The control unit 10 controls the input / output control unit 20 and the character input control unit 30. The input / output control unit 20 controls input / output of signals exchanged between the operation panel 2 and the control unit 10, and includes an input receiving unit 21, a display control unit (display control means) 22, and candidates. A selection receiving unit 23 is included. The character input control unit 30 executes character input processing, and includes a candidate extraction unit (character candidate extraction unit / character string candidate extraction unit) 31, a candidate order determination unit (candidate order determination unit) 32, and a character confirmation. Part (character input confirmation means) 33 is included. Each unit in the control unit 10 is realized by a central processing unit (CPU) of a computer and software executed by the CPU. This software is also stored in the recording unit 40 described above, read into the temporary storage unit 3, and executed by the CPU.

入出力制御部20の入力受付部21は、入力部11から入力された文字(アルファベットなど)の信号を受け付けて、候補抽出部31に供給するものである。表示制御部22は、表示部12の文字入力領域121、候補文字表示領域122、および、確定文字表示領域123の各々に表示すべき情報が表示されるよう表示部12を制御するものである。候補選択受付部23は、入力部11から入力された、候補文字表示領域122内の選択された候補漢字の信号、および、該選択された候補漢字の入力を確定する指示信号を受け付けて、文字確定部33に供給するものである。  The input receiving unit 21 of the input / output control unit 20 receives a signal of a character (such as an alphabet) input from the input unit 11 and supplies it to the candidate extracting unit 31. The display control unit 22 controls the display unit 12 to display information to be displayed in each of the character input area 121, the candidate character display area 122, and the confirmed character display area 123 of the display unit 12. The candidate selection receiving unit 23 receives the signal of the selected candidate kanji in the candidate character display area 122 and the instruction signal for confirming the input of the selected candidate kanji input from the input unit 11, This is supplied to the determination unit 33.

文字入力制御部30の候補抽出部31は、入力された文字に基づいて、候補となる漢字(または)単語を記録部40に記憶されている各辞書部から取得するものである。本実施形態では、候補抽出部31は、入力されたアルファベット(列)に基づいて、候補となる漢字を記録部40の漢字辞書部(文字記録部)41から抽出する。  The candidate extraction unit 31 of the character input control unit 30 acquires candidate kanji (or) words from each dictionary unit stored in the recording unit 40 based on the input characters. In the present embodiment, the candidate extraction unit 31 extracts candidate Chinese characters from the Chinese character dictionary unit (character recording unit) 41 of the recording unit 40 based on the input alphabet (column).

より詳細には、まず、入力されたアルファベット(列)に対応するピンインを特定して、特定した各ピンインに対応する漢字を、候補漢字として抽出する。候補抽出部31は、抽出した候補漢字を、内部バッファ(不図示)に記憶し、候補順序決定部32および表示制御部22に候補漢字の表示を指示する。  More specifically, first, pinyin corresponding to the input alphabet (column) is specified, and kanji corresponding to each specified pinyin is extracted as candidate kanji. The candidate extraction unit 31 stores the extracted candidate kanji in an internal buffer (not shown), and instructs the candidate order determination unit 32 and the display control unit 22 to display the candidate kanji.

候補抽出部31が参照する漢字辞書部41には、アルファベット(列)−ピンイン−漢字が対応付けて記録されている。漢字辞書部41の詳細は後述する。  In the Chinese character dictionary unit 41 referred to by the candidate extracting unit 31, alphabet (column) -pinyin-kanji characters are recorded in association with each other. Details of the Chinese character dictionary unit 41 will be described later.

候補順序決定部32は、候補抽出部31が抽出した候補漢字の表示順序を、所定の条件に基づいて決定するものである。表示順序とは、図14に示すように、候補文字表示領域122に候補漢字を表示する順序のことである。抽出されたすべての候補漢字が候補文字表示領域122内に一度に表示できる場合、順序が上の候補漢字ほど、候補文字表示領域122の上部に表示されるようにし、ユーザが選択しやすいようにすればよい。また、候補漢字が一度に表示できる数を上回る場合は、下位に続く順序の候補漢字を表示するようページを切り換えるようにしてもよい。この場合でも、順序が上の候補漢字ほど初めのページに表示されるようにして、上位の候補漢字ほどユーザに選ばれやすいようにしておく。したがって、候補順序決定部32は、抽出された候補漢字を、所定の条件に基づいてユーザに選択されやすいものから順に表示されるよう順序を決定する。どのような条件に基づいて候補漢字の順序を決定するのかについては後に詳しく説明する。  The candidate order determination unit 32 determines the display order of the candidate kanji extracted by the candidate extraction unit 31 based on a predetermined condition. The display order is the order in which candidate Chinese characters are displayed in the candidate character display area 122, as shown in FIG. When all the extracted candidate kanji characters can be displayed in the candidate character display area 122 at a time, the upper candidate kanji characters are displayed at the top of the candidate character display area 122 so that the user can easily select them. do it. In addition, when the number of candidate kanji characters exceeds the number that can be displayed at one time, the pages may be switched so as to display candidate kanji characters in the order following the lower order. Even in this case, the upper candidate kanji characters are displayed on the first page so that the higher candidate kanji characters are more easily selected by the user. Therefore, the candidate order determination unit 32 determines the order in which the extracted candidate Kanji characters are displayed in order from those that are easy for the user to select based on a predetermined condition. The condition for determining the order of candidate kanji based on what conditions will be described in detail later.

文字確定部33は、入力部11より入力されたユーザが選択した候補漢字の信号、および、該選択された候補漢字の入力を確定する指示信号を、候補選択受付部23より受け取り、ユーザにより選択された上記候補漢字の入力を確定させるものである。まず、選択された候補漢字は、確定前の選択されている状態を示す下線とともに、確定文字表示領域123に表示させる。さらに、入力確定の指示信号に応じて文字確定部33が確定した候補漢字は、入力確定文字として下線が付されない状態で、表示制御部22を介して確定文字表示領域123に表示される。  The character confirmation unit 33 receives the candidate kanji signal selected by the user input from the input unit 11 and the instruction signal for confirming the input of the selected candidate kanji from the candidate selection reception unit 23, and is selected by the user. The input of the candidate kanji is performed. First, the selected candidate kanji is displayed in the confirmed character display area 123 together with an underline indicating the selected state before confirmation. Further, the candidate Kanji characters determined by the character confirmation unit 33 according to the input confirmation instruction signal are displayed in the confirmed character display area 123 via the display control unit 22 without being underlined as input confirmation characters.

(漢字辞書)
次に、漢字辞書部41に記録される漢字辞書について説明する。図15は、候補抽出部31が候補漢字を抽出するときに参照する、漢字辞書部41に記録されている漢字辞書の例を示す図である。
(Kanji dictionary)
Next, the kanji dictionary recorded in the kanji dictionary unit 41 will be described. FIG. 15 is a diagram illustrating an example of a Chinese character dictionary recorded in the Chinese character dictionary unit 41 that is referred to when the candidate extraction unit 31 extracts candidate Chinese characters.

図15に示すとおり、本実施形態における漢字辞書140は、入力受付部21が受け付けたアルファベット(列)とピンインとの対応付けを記録した、アルファベット−ピンイン対応表(A/P対応表141)、および、ピンインと漢字との対応付けを記録した、ピンイン−漢字対応表(P/C対応表142)とを含んでいる。これにより、入力されたアルファベット(列)に対応する候補漢字を直接抽出することが可能となる。  As shown in FIG. 15, the Chinese character dictionary 140 in the present embodiment is an alphabet-pinyin correspondence table (A / P correspondence table 141) in which a correspondence between alphabets (columns) received by the input receiving unit 21 and pinyin is recorded. And a Pinyin-Kanji correspondence table (P / C correspondence table 142) in which the correspondence between Pinyin and Kanji is recorded. This makes it possible to directly extract candidate Chinese characters corresponding to the input alphabet (column).

具体的には、例えば、ユーザが「外字2」(ピンインは「mei」)という漢字を入力したいために、入力部11を用いて、まず「m」のキーを押下したとする。入力受付部21より「m」の信号が供給されると、候補抽出部31は、まず、漢字辞書140のA/P対応表141から、「m」と前方一致するピンイン(図15の例では、「ma」と「mei」)を特定し、該ピンインに対応する漢字が記録されている、P/C対応表142のアドレスを検出する(「cp_ml」と「cp_mi」)。  Specifically, for example, it is assumed that the user first presses the “m” key using the input unit 11 in order to input the Chinese character “external character 2” (pinyin is “mei”). When the “m” signal is supplied from the input receiving unit 21, the candidate extracting unit 31 first searches the A / P correspondence table 141 of the Chinese character dictionary 140 from the pinyin (in the example of FIG. 15) that matches forward with “m”. , “Ma” and “mei”), and the address of the P / C correspondence table 142 where the Chinese character corresponding to the pinyin is recorded is detected (“cp_ml” and “cp_mi”).

続いて、P/C対応表142の「cp_ml」と「cp_mi」とに基づいて、候補抽出部31は、「m」と前方一致のピンインに対応する漢字(  Subsequently, based on “cp_ml” and “cp_mi” in the P / C correspondence table 142, the candidate extraction unit 31 selects a Chinese character (

Figure 0004890551
Figure 0004890551

、麻、没、・・・「外字2」、、 Hemp 、 December ... "Gaiji 2"

Figure 0004890551
Figure 0004890551

・・・)を抽出する。抽出された漢字は、上述したとおり、候補漢字として候補順序決定部32に供給される。ここで、ユーザによりさらに「mei」と入力された場合には、候補抽出部31は、「mei」と前方一致する漢字に絞り込んで、漢字辞書部41から候補漢字を抽出する。...) is extracted. The extracted Chinese characters are supplied to the candidate order determination unit 32 as candidate Chinese characters as described above. Here, when “mei” is further input by the user, the candidate extraction unit 31 extracts candidate kanji from the kanji dictionary unit 41 by narrowing down to kanji characters that coincide with “mei”.

上記構成によれば、候補抽出部31は、ユーザが入力したアルファベットを受け付けて、そのアルファベットを含む、ピンインを特定する。候補抽出部31は、特定したピンインに基づいて、ユーザが入力したいと所望する漢字の候補を漢字辞書部41から抽出することができる。  According to the above configuration, the candidate extraction unit 31 receives an alphabet input by the user and specifies Pinyin including the alphabet. The candidate extraction unit 31 can extract, from the kanji dictionary unit 41, candidates for kanji that the user desires to input based on the specified pinyin.

候補順序決定部32は、上記候補抽出部31が抽出した漢字の候補を所定の条件に基づいて並べ替え、候補の表示順序を決定する。表示制御部22は、漢字の候補が、上記候補順序決定部32が決定した表示順序で表示されるよう表示部12を制御する。  The candidate order determination unit 32 rearranges the kanji candidates extracted by the candidate extraction unit 31 based on a predetermined condition, and determines a candidate display order. The display control unit 22 controls the display unit 12 so that kanji candidates are displayed in the display order determined by the candidate order determination unit 32.

最後に、ユーザが表示された入力したい候補漢字の中から、所望の漢字を指定すると、文字確定部33は、指定された漢字の入力を確定させる。  Finally, when a desired Chinese character is designated from the displayed candidate Chinese characters to be input, the character confirmation unit 33 confirms the input of the designated Chinese character.

これにより、所望の漢字を得るための入力操作を簡素化することが可能となる。  Thereby, it becomes possible to simplify input operation for obtaining a desired kanji.

また、候補抽出部31が抽出する候補となる漢字は、ユーザのアルファベット入力操作により、外部記憶装置(図示せず)への記憶および外部記憶装置からの読込みが行えるようになっていてもよく、読み込まれた漢字を、候補を表示する際に利用するようにしてもよい。  In addition, the kanji characters that are candidates for extraction by the candidate extraction unit 31 may be stored in an external storage device (not shown) and read from the external storage device by a user's alphabet input operation. The read Chinese characters may be used when displaying candidates.

(変形例1−候補単語の出力)
さらに、本発明の文字変換装置1は、某漢字が入力確定文字として選択されたのち、該漢字から始まる1つの意味を持つ1以上の漢字からなる漢字列(以下、単語(表意文字列)と称する)を候補単語として、候補文字表示領域122(図14)に表示することが好ましい。これにより、ユーザは、上記某漢字とともに単語を形成し得る漢字を候補文字表示領域122において得ることができるので、続く漢字のピンインを別途入力しなくても、所望の漢字を得ることが可能となる。したがって、所望の漢字を得るための入力操作を簡素化することが可能となる。
(Modification 1—Output of candidate word)
Furthermore, the character conversion device 1 of the present invention is configured to select a Chinese character string (hereinafter referred to as a word (ideographic character string)) having one or more Chinese characters having one meaning after the Chinese character is selected as an input confirmed character. Is displayed as a candidate word in the candidate character display area 122 (FIG. 14). Accordingly, the user can obtain kanji characters that can form words together with the kanji characters in the candidate character display area 122, so that it is possible to obtain a desired kanji character without separately inputting the subsequent kanji pinyin. Become. Therefore, it is possible to simplify the input operation for obtaining a desired kanji.

図16は、候補単語を出力する文字変換装置1の要部構成を示すブロック図である。なお、図16の各構成要素に付された符号は、図12の各構成要素に付された符号に対応しており、同じ符号は、同じ構成要素を示している。したがって、上述の各実施形態ですでに説明した構成要素についての説明は繰り返さない。図16に示す文字変換装置1において、図12と異なる点は、文字確定部33から候補抽出部31に制御信号が伝達される点と、記録部40に単語辞書部(文字列記録部)42が含まれている点である。  FIG. 16 is a block diagram illustrating a main configuration of the character conversion apparatus 1 that outputs candidate words. In addition, the code | symbol attached | subjected to each component of FIG. 16 respond | corresponds to the code | symbol attached | subjected to each component of FIG. 12, and the same code | symbol has shown the same component. Therefore, the description about the component already demonstrated by each above-mentioned embodiment is not repeated. In the character conversion device 1 shown in FIG. 16, the difference from FIG. 12 is that a control signal is transmitted from the character determination unit 33 to the candidate extraction unit 31 and a word dictionary unit (character string recording unit) 42 in the recording unit 40. Is included.

文字確定部33は、ユーザにより選択された漢字(または、入力確定文字)が候補選択受付部23を介して入力されると、続いて、候補抽出部31に対して、当該選択されたから始まる単語を抽出する指示を送る。  When the Chinese character (or input confirmed character) selected by the user is input via the candidate selection receiving unit 23, the character determination unit 33 continues to the candidate extraction unit 31 and starts with the selected word Send instructions to extract.

候補抽出部31は、上記の指示に基づいて、上記選択された漢字から始まる単語を、候補単語として単語辞書部42から抽出する。図17は、操作パネル2の表示部12に表示される候補単語の例を示す図である。図17に示す例では、漢字「外字2」が選択されているときに、「外字2」から始まる単語が、候補単語として表示部12の候補文字表示領域122に表示されている。  The candidate extraction unit 31 extracts a word starting from the selected kanji character from the word dictionary unit 42 as a candidate word based on the above instruction. FIG. 17 is a diagram illustrating an example of candidate words displayed on the display unit 12 of the operation panel 2. In the example shown in FIG. 17, when the Chinese character “external character 2” is selected, a word starting from “external character 2” is displayed as a candidate word in the candidate character display area 122 of the display unit 12.

候補抽出部31が参照する単語辞書部42には、漢字−単語が対応付けて記録されている。図18は、単語辞書部42が記録する単語辞書の例を示す図である。図18に示すとおり、本実施形態における単語辞書は、漢字辞書部41に記録されている漢字と、該漢字から始まる単語との対応付けを記録した、漢字−単語対応表(C/I対応表143)を含んでいる。これにより、選択された漢字に対応する候補単語をさらに抽出することが可能となる。  In the word dictionary unit 42 referred to by the candidate extraction unit 31, kanji-words are recorded in association with each other. FIG. 18 is a diagram illustrating an example of a word dictionary recorded by the word dictionary unit 42. As shown in FIG. 18, the word dictionary in the present embodiment is a kanji-word correspondence table (C / I correspondence table) in which associations between kanji recorded in the kanji dictionary unit 41 and words starting from the kanji are recorded. 143). This makes it possible to further extract candidate words corresponding to the selected kanji.

具体的には、例えば、ユーザにより、漢字「外字2」が選択されると、候補抽出部31は、P/C対応表142(図15)の「外字2」のアドレスを検出する(「wp_mi+j」)。続いて、単語辞書部42を参照し、アドレス「wp_mi+j」に基づいて、「外字2」から始まる単語(「外字2」月、「外字2」天・・・)を抽出する。抽出された単語は、上述の構成と同様に、候補単語として候補順序決定部32に供給され、候補文字表示領域122に表示される(図17)。  Specifically, for example, when the user selects the Chinese character “external character 2”, the candidate extraction unit 31 detects the address of “external character 2” in the P / C correspondence table 142 (FIG. 15) (“wp_mi + j”). "). Subsequently, referring to the word dictionary unit 42, based on the address “wp_mi + j”, a word starting from “external character 2” (“external character 2” month, “external character 2” heaven...) Is extracted. The extracted words are supplied as candidate words to the candidate order determining unit 32 and displayed in the candidate character display area 122 as in the above-described configuration (FIG. 17).

ある漢字が入力されると、その漢字の次に続く文字(ユーザが所望する漢字)は、何の脈絡もない漢字よりも、その漢字から始まる単語を構成する漢字である可能性が高い。したがって、入力が確定された漢字から始まる単語を候補として表示すれば、ユーザは、その単語の候補の中から所望の単語を選択するのみで、別途ピンインを入力することなく、中国語を入力することが可能となる。これにより、ユーザは、ピンインの入力に係る操作数について、さらに少ない操作数で、所望の漢字の入力を得ることが可能となる。  When a certain Chinese character is input, the character that follows the Chinese character (the Chinese character desired by the user) is more likely to be a Chinese character that constitutes a word starting from the Chinese character than an unrelated kanji. Therefore, if a word starting from a kanji that has been confirmed to be input is displayed as a candidate, the user can select the desired word from the word candidates and input Chinese without inputting pinyin separately. It becomes possible. Thus, the user can obtain a desired kanji input with a smaller number of operations related to the pinyin input.

(フローチャート)
次に、本発明の文字変換装置1(図16)の処理の流れを、図19に示すフローチャートと、図20に示す操作パネル2上の候補文字表示領域122および確定文字表示領域123の表示例に基づき説明する。以下では、ユーザが、「「外字2」天到郊外散歩」を入力しようとした場合について説明する。
(flowchart)
Next, the flow of processing of the character conversion device 1 (FIG. 16) of the present invention is shown in the flowchart shown in FIG. 19 and display examples of the candidate character display area 122 and the confirmed character display area 123 on the operation panel 2 shown in FIG. Based on In the following, a case where the user tries to input ““ External character 2 ”walk to the suburbs” will be described.

ユーザが操作パネル2の入力部11からアルファベット(漢字「外字2」(mei)のピンインの先頭アルファベット「m」)を入力すると(S201のYES)、入力受付部21は、入力されたアルファベット「m」の信号を、候補抽出部31に供給する。次に、候補抽出部31は、入力されたアルファベットに対応するピンインを特定し、特定したピンインに対応する漢字を、候補漢字として漢字辞書部41から抽出する(S202)。  When the user inputs an alphabet (the first alphabet “m” of Pinyin of the Chinese character “external character 2” (mei)) from the input unit 11 of the operation panel 2 (YES in S201), the input reception unit 21 receives the input alphabet “m”. ”Is supplied to the candidate extraction unit 31. Next, the candidate extraction unit 31 specifies Pinyin corresponding to the input alphabet, and extracts a Chinese character corresponding to the specified Pinyin from the Chinese character dictionary unit 41 as a candidate Chinese character (S202).

候補順序決定部32は、所定の条件に基づいて上記抽出された候補漢字の表示順序を決定する(詳細は後述)(S203)。続いて、表示制御部22は、候補順序決定部32が決定した表示順序でn個の候補漢字を表示するよう表示位置を定め、上記候補漢字を表示部12に出力し、ユーザに提示する(S204)。図20の(a)に、n=5として、漢字候補を5個づつ表示する場合の表示例を示す。  The candidate order determination unit 32 determines the display order of the extracted candidate Chinese characters based on a predetermined condition (details will be described later) (S203). Subsequently, the display control unit 22 determines a display position so that n candidate kanji characters are displayed in the display order determined by the candidate order determining unit 32, outputs the candidate kanji characters to the display unit 12, and presents them to the user ( S204). FIG. 20A shows a display example in the case where n = 5 and five Chinese character candidates are displayed.

ここで、ユーザにより、1度目に候補文字表示領域122に表示された漢字以外の次候補漢字を表示する指示(図20の(a)に所望の漢字「外字2」がないので、例えば、「次候補表示」のボタンを押すなどする)が入力されると(S205のNO、S206のYES)、S204に戻り、表示制御部22は、次の候補漢字のリストを表示する(図20の(b))。さらに、次候補漢字の表示指示も、候補漢字の選択指示も入力されず(S205、S206においてNO)、新たにアルファベットが入力された場合には、S202に戻り、候補抽出部31は、これまでに入力されたアルファベット列に対応するピンインをさらに絞り込んで特定し、特定したピンインに対応する漢字を、候補漢字として抽出する。  Here, the user does not have an instruction to display the next candidate kanji other than the kanji displayed in the candidate character display area 122 for the first time (since there is no desired kanji “external character 2” in FIG. When a “next candidate display” button is pressed (NO in S205, YES in S206), the process returns to S204, and the display control unit 22 displays a list of next candidate kanji characters (( b)). Furthermore, when neither the next candidate kanji display instruction nor the candidate kanji selection instruction is input (NO in S205 and S206), if a new alphabet is input, the process returns to S202, and the candidate extraction unit 31 has so far performed. The pinyin corresponding to the alphabet string input to is further narrowed down and specified, and the kanji corresponding to the specified pinyin is extracted as a candidate kanji.

一方、ユーザが、入力部11を介して、候補文字表示領域122に表示された所望の漢字「外字2」(図20の(b)の“3011”)を選択すると(S205のYES)、候補選択受付部23は、選択された候補漢字「外字2」の信号を受け付けて、文字確定部33に供給する。  On the other hand, when the user selects a desired Chinese character “external character 2” (“3011” in FIG. 20B) displayed in the candidate character display area 122 via the input unit 11 (YES in S205), the candidate is selected. The selection receiving unit 23 receives a signal of the selected candidate Chinese character “external character 2” and supplies it to the character determination unit 33.

文字確定部33は、選択された「外字2」を表示するよう表示制御部22に指示するとともに、候補抽出部31に対して、次に「外字2」から始まる単語を抽出するよう指示する。候補抽出部31は、続いて、「外字2」から始まる単語を候補単語として単語辞書部42から抽出する(S207)(図20の(c))。  The character determination unit 33 instructs the display control unit 22 to display the selected “external character 2” and also instructs the candidate extraction unit 31 to extract a word starting from “external character 2” next. Subsequently, the candidate extraction unit 31 extracts a word starting from “external character 2” as a candidate word from the word dictionary unit 42 (S207) ((c) of FIG. 20).

候補順序決定部32は、所定の条件に基づいて上記抽出された候補単語の表示順序を決定する(詳細は後述)(S208)。続いて、表示制御部22は、候補順序決定部32が決定した表示順序にて上記候補単語を表示部12に出力し、ユーザに提示する(S209)。  The candidate order determination unit 32 determines the display order of the extracted candidate words based on a predetermined condition (details will be described later) (S208). Subsequently, the display control unit 22 outputs the candidate words to the display unit 12 in the display order determined by the candidate order determination unit 32 and presents them to the user (S209).

ここで、ユーザにより、次候補単語を表示する指示が入力されると(S210のNO、S211のYES)、S209に戻り、表示制御部22は、次の候補単語のリストを表示する。さらに、次候補単語の表示指示も、候補単語の選択指示も入力されず(S210、S211においてNO)、新たにアルファベットが入力された場合には、S202に戻り、候補抽出部31は、これまでに入力されたアルファベットに対応するピンインを特定し、特定したピンインに対応する漢字を、候補漢字として抽出する。  Here, when an instruction to display the next candidate word is input by the user (NO in S210, YES in S211), the process returns to S209, and the display control unit 22 displays a list of next candidate words. Further, when neither a next candidate word display instruction nor a candidate word selection instruction is input (NO in S210 and S211) and a new alphabet is input, the process returns to S202, and the candidate extraction unit 31 has so far Pinyin corresponding to the alphabet input in is identified, and kanji corresponding to the identified pinyin is extracted as candidate kanji.

一方、ユーザが、入力部11を介して、候補文字表示領域122に表示された所望の単語「「外字2」天」(図20の(c)の“020”)を選択すると(S210のYES)、候補選択受付部23は、選択された候補単語「「外字2」天」の信号を受け付けて、文字確定部33に供給する。  On the other hand, when the user selects the desired word ““ external character 2 ”heaven” (“020” in FIG. 20C) displayed in the candidate character display area 122 via the input unit 11 (YES in S210). ), The candidate selection receiving unit 23 receives a signal of the selected candidate word ““ external character 2 ”heaven” and supplies it to the character determination unit 33.

文字確定部33は、選択された候補単語を表示するよう表示制御部22に指示し、表示制御部22は、選択された候補単語を表示部12に表示する(S212)(図20の(d))。同時に、候補抽出部31に対して、次に該候補単語から始まる単語を抽出するよう指示する。文字の入力を終了する指示が入力されなければ(S213のNO)、候補抽出部31は、S207に戻り、上記選択された候補単語から始まる単語を候補単語として単語辞書部42から抽出する。  The character determination unit 33 instructs the display control unit 22 to display the selected candidate word, and the display control unit 22 displays the selected candidate word on the display unit 12 (S212) ((d in FIG. 20) )). At the same time, the candidate extraction unit 31 is instructed to extract the next word starting from the candidate word. If an instruction to end character input is not input (NO in S213), the candidate extraction unit 31 returns to S207, and extracts a word starting from the selected candidate word from the word dictionary unit 42 as a candidate word.

ユーザの次の所望の漢字「到」が候補漢字として表示されない場合、ユーザは、「到」(dao)の先頭ピンイン「d」を入力することができる(S211のNO、S201のYES)(図20の(e))。以降同様の処理を繰り返し、所望の漢字を入力することが可能となる。  When the user's next desired Chinese character “To” is not displayed as a candidate Chinese character, the user can input the first Pinyin “d” of “To” (dao) (NO in S211, YES in S201) (FIG. 20 (e)). Thereafter, it is possible to input a desired kanji by repeating the same processing.

選択された候補単語が選択されたのち(「散歩」まで入力が確定されたのち)、文字の入力を終了する指示が入力されれば(S213のYES)、処理を終了する。  After the selected candidate word is selected (after input is confirmed until “walk”), if an instruction to end character input is input (YES in S213), the process ends.

(変形例2−学習機能)
さらに、本発明の文字変換装置1は、ユーザの選択により入力が確定された漢字(単語)を記録する構成を備えていることが好ましい。これにより、文字変換装置1は、過去に入力した漢字、つまり、ユーザが使用したことのある漢字の記録に基づいて、候補漢字を表示することができる。過去に使用された漢字は、ユーザによって再度使用される可能性は大きい。したがって、そのような使用履歴が反映された候補漢字の一覧を用いることにより、ユーザは少ない操作数で所望の漢字を得ることが可能となる。
(Modification 2-Learning function)
Furthermore, it is preferable that the character conversion device 1 of the present invention has a configuration for recording kanji (words) whose input is determined by the user's selection. Thereby, the character conversion apparatus 1 can display a candidate Chinese character based on the recording of the Chinese character input in the past, ie, the Chinese character which the user has used. There is a high possibility that Chinese characters used in the past will be used again by the user. Therefore, by using a list of candidate kanji that reflects such usage history, the user can obtain a desired kanji with a small number of operations.

図21は、学習機能を備えた文字変換装置1の要部構成を示すブロック図である。なお、図21の各構成要素に付された符号は、図12の各構成要素に付された符号に対応しており、同じ符号は、同じ構成要素を示している。したがって、上述の各実施形態ですでに説明した構成要素についての説明は繰り返さない。図21に示す文字変換装置1において、図12と異なる点は、文字入力制御部30が、さらに、学習制御部(学習制御手段)34を有している点と、記録部40に学習辞書記録部(学習語記録部)43およびペア学習辞書記録部(学習語記録部)44が含まれている点である。  FIG. 21 is a block diagram showing a main configuration of the character conversion device 1 having a learning function. Note that the reference numerals given to the respective constituent elements in FIG. 21 correspond to the reference numerals given to the respective constituent elements in FIG. 12, and the same reference numerals indicate the same constituent elements. Therefore, the description about the component already demonstrated by each above-mentioned embodiment is not repeated. In the character conversion device 1 shown in FIG. 21, the difference from FIG. 12 is that the character input control unit 30 further has a learning control unit (learning control means) 34 and that the recording unit 40 records the learning dictionary. Part (learning word recording part) 43 and pair learning dictionary recording part (learning word recording part) 44 are included.

学習制御部34は、ユーザの指示により、文字変換装置1に入力(使用)された漢字の記録(学習)を制御するものである。具体的には、ユーザにより使用された漢字を学習漢字として、学習辞書記録部43に格納したり(以下、単独学習(機能)と称す)、または、ユーザにより使用された漢字を、直前に入力されている漢字と関連付けてペア学習辞書記録部44に格納したり(以下、ペア学習(機能)と称す)する。ユーザにより過去に入力されたことのある漢字は、ユーザによって再度使用される可能性が大きいので、そのような学習漢字を候補漢字として利用することにより、ユーザがより少ない操作数で所望の漢字を得る確率が高まる。  The learning control unit 34 controls recording (learning) of Chinese characters input (used) to the character conversion device 1 in accordance with a user instruction. Specifically, the kanji used by the user is stored as a learning kanji in the learning dictionary recording unit 43 (hereinafter referred to as independent learning (function)), or the kanji used by the user is input immediately before. It is stored in the pair learning dictionary recording unit 44 in association with the kanji that has been set (hereinafter referred to as pair learning (function)). Kanji characters that have been input by the user in the past are highly likely to be used again by the user, so by using such learning kanji as candidate kanji, the user can obtain a desired kanji with fewer operations. Increases the probability of getting.

学習辞書記録部43は、ユーザにより過去に使用された漢字(入力確定文字)を単独学習漢字として記録するものである。学習辞書記録部43に記録される学習辞書には、その単独学習漢字が記録された日時の情報や、使用頻度の情報(過去に何回使用されたか、所定期間内に何回使用されたかなど)が、漢字ごとに対応付けて記録されていてもよい。  The learning dictionary recording unit 43 records kanji (input confirmed characters) used in the past by the user as independent learning kanji. The learning dictionary recorded in the learning dictionary recording unit 43 includes information on the date and time when the single learning kanji was recorded, information on the usage frequency (how many times it was used in the past, how many times it was used within a predetermined period, etc. ) May be recorded in association with each Chinese character.

学習制御部34は、文字確定部33から、ユーザにより選択された候補漢字の信号を受け取ると、一時記憶部3に該選択された候補漢字を書き込む。学習制御部34は、文字確定部33が確定指示信号に応じて入力を確定させたとき、文字確定部33より当該入力確定文字の単独学習処理の指示を受け付ける。学習制御部34は、一時記憶部3から、上記候補漢字を内部バッファに読み出し、一時記憶部3から読み出された候補漢字の削除および内容の更新を行う。そして、内部バッファに記憶した候補漢字を単独学習漢字として学習辞書記録部43に記憶する。  When the learning control unit 34 receives a candidate kanji signal selected by the user from the character determination unit 33, the learning control unit 34 writes the selected candidate kanji into the temporary storage unit 3. The learning control unit 34 receives an instruction for a single learning process for the input confirmed character from the character confirmation unit 33 when the character confirmation unit 33 confirms the input according to the confirmation instruction signal. The learning control unit 34 reads the candidate kanji from the temporary storage unit 3 into the internal buffer, and deletes the candidate kanji read from the temporary storage unit 3 and updates the content. Then, the candidate kanji stored in the internal buffer is stored in the learning dictionary recording unit 43 as a single learning kanji.

ペア学習辞書記録部44は、ユーザにより過去に使用された漢字を、当該漢字がどの漢字に続いて確定されたのかを示す情報(直前漢字)と関連付けて、ペア学習漢字として記録するものである。直前漢字は、すでに学習辞書記録部43において単独学習漢字として記録されている。ペア学習辞書記録部44に記録される学習辞書には、そのペア学習漢字ごとに、上記直前漢字が関連付けて記録される。この漢字のペアごとに、記録された日時の情報や、使用頻度の情報を対応付けて記録してもよい。  The pair learning dictionary recording unit 44 records kanji used in the past by the user as a pair learning kanji in association with information (preceding kanji) indicating which kanji is determined following the kanji. . The immediately preceding kanji has already been recorded as a single learning kanji in the learning dictionary recording unit 43. In the learning dictionary recorded in the pair learning dictionary recording unit 44, the preceding kanji is recorded in association with each pair learning kanji. For each pair of Kanji characters, recorded date and time information and usage frequency information may be recorded in association with each other.

学習制御部34は、文字確定部33より入力確定文字のペア学習処理の指示を受け付ける。学習制御部34は、一時記憶部3から、上記入力確定文字と、その直前漢字とを内部バッファに読み出し、一時記憶部3から読み出された文字列の削除および内容の更新を行う。そして、内部バッファに記憶した入力確定文字を直前漢字と関連付けて、ペア学習漢字としてペア学習辞書記録部44に記憶する。  The learning control unit 34 receives an instruction of the input confirmed character pair learning process from the character confirming unit 33. The learning control unit 34 reads the input confirmed character and the previous kanji character from the temporary storage unit 3 into the internal buffer, and deletes the character string read from the temporary storage unit 3 and updates the content. Then, the input confirmed character stored in the internal buffer is associated with the preceding kanji and stored in the pair learning dictionary recording unit 44 as a pair learning kanji.

なお、上記では、学習辞書記録部43およびペア学習辞書記録部44において、各学習辞書が漢字ごとに記録される構成について説明したが、これに限定されない。上記構成に加えて、単語を辞書に記録する構成としてもよい。すなわち、学習制御部34の単独学習機能により、使用された単語が、学習辞書記録部43に記録されるようにしてもよい。例えば、「給水」という単語が使用された場合、「給」という漢字に加え、「給水」という単語が、単独学習漢字(単語)として学習辞書記録部43に記録される。  In the above description, the learning dictionary recording unit 43 and the pair learning dictionary recording unit 44 have described the configuration in which each learning dictionary is recorded for each Chinese character. However, the present invention is not limited to this. In addition to the above configuration, the word may be recorded in a dictionary. That is, the used word may be recorded in the learning dictionary recording unit 43 by the single learning function of the learning control unit 34. For example, when the word “water supply” is used, the word “water supply” is recorded in the learning dictionary recording unit 43 as a single learning kanji (word) in addition to the kanji “supply”.

また、学習制御部34のペア学習機能によれば、「大学」「教授」という単語が続けて入力された場合、漢字「教」を、「学」および/または「大学」の直前漢字(単語)と関連付けて、ペア学習漢字として記録することもできる。さらに、単語「教授」を、「学」および/または「大学」の直前漢字(単語)と関連付けて、ペア学習単語として記録することもできる。  Further, according to the pair learning function of the learning control unit 34, when the words “university” and “professor” are continuously input, the kanji “teaching” is changed to “kanji” and / or “university” immediately before the kanji (word ) And can be recorded as pair learning kanji. Furthermore, the word “professor” can be recorded as a pair learning word in association with the previous kanji (word) of “study” and / or “university”.

(候補順序決定要素)
次に、文字変換装置1の候補順序決定部32(図12、16、21)が候補(候補漢字/候補単語)の表示順序を決定するための所定の条件(以下、候補順序決定要素と称する)について説明する。
(Candidate order determining element)
Next, a predetermined condition (hereinafter referred to as a candidate order determination element) for the candidate order determination unit 32 (FIGS. 12, 16, and 21) of the character conversion device 1 to determine the display order of candidates (candidate kanji / candidate words). ).

上述したとおり、操作パネル2に設けられた表示部12において、一度により多くの候補を表示できる方が、ユーザがより早く所望の漢字を得る可能性が高くなるというメリットがある。しかも、操作パネル2をタッチパネルなどの表示/入力一体型の入出力デバイスで実現した場合、ユーザが所望の漢字を得るための操作数を格段に減らすことが可能である。しかし、一方で、多くの候補を大きな表示画面に一覧表示しても、その中から所望の候補を探す負担が逆に大きくなるという問題が生じる。そこで、限られた表示領域に限られた数の候補を表示する際、ユーザが所望する(選択する)可能性の大きい漢字(単語)から順に表示されることが望まれる。  As described above, in the display unit 12 provided on the operation panel 2, there is an advantage that the possibility that the user can obtain a desired Chinese character earlier is higher when more candidates can be displayed at once. In addition, when the operation panel 2 is realized by a display / input integrated input / output device such as a touch panel, the number of operations for the user to obtain a desired kanji can be significantly reduced. However, on the other hand, even if many candidates are displayed as a list on a large display screen, there arises a problem that the burden of searching for a desired candidate from among them increases. Therefore, when displaying a limited number of candidates in a limited display area, it is desirable that the kanji (words) that are most likely to be desired (selected) by the user are displayed in order.

本発明では、ユーザの嗜好に合致した、より精度の高い表示順序で候補が表示されるよう、表示する候補の順序を決定する。これにより、所望の漢字を得るための入力操作を簡素化することが可能な文字変換装置を実現することができる。  In the present invention, the order of candidates to be displayed is determined so that the candidates are displayed in a more accurate display order that matches the user's preference. Thereby, the character conversion apparatus which can simplify input operation for obtaining a desired Chinese character is realizable.

以下では、候補単語の表示順序を決定する方法について説明するが、候補漢字/候補単語のいずれの表示順序も同じ方法にて決定される。  In the following, a method of determining the display order of candidate words will be described. However, the display order of any candidate kanji / candidate word is determined by the same method.

本実施形態では、候補順序決定部32は、以下の7つの候補順序決定要素に基づいて、候補の表示順序を決定する。  In this embodiment, the candidate order determination unit 32 determines a candidate display order based on the following seven candidate order determination elements.

(要素A)出現頻度
出現頻度とは、ある言語の文字(列)において、どの程度出現するのかの指標となる情報である。出現頻度が高ければ高いほど、その言語使用環境下においてよく使用されているということになるので、出現頻度の高い候補ほど表示順序を上位にする。出現頻度は、既知の統計データを用いた固定的な情報を用いればよい。
(Element A) Appearance Frequency Appearance frequency is information that serves as an index of how often a character (string) in a language appears. The higher the appearance frequency, the more frequently it is used in the language usage environment. Therefore, the higher the appearance frequency, the higher the display order. The appearance frequency may be fixed information using known statistical data.

(要素B)ピンイン長の一致/不一致
入力されたアルファベット(列)の文字数と、対応する候補のピンインの文字数が一致するか否かに基づいて表示順序を決定する。ピンイン長が、入力されたピンイン文字数と一致する候補の表示順序を上位にする。
(Element B) Pinyin length match / mismatch The display order is determined based on whether the number of characters in the input alphabet (column) matches the number of characters in the corresponding candidate Pinyin. The display order of candidates whose pinyin length matches the number of input pinyin characters is made higher.

(要素C)直前文字列との連続性
その時点までにすでに入力が確定している入力確定文字および/または現時点で選択中の文字(列)の直後に続く可能性(直前文字列との連続性)の大きい候補ほど表示順序を上位にする。あるいは、過去の入力履歴より、上記直前文字列に連続して入力されたことの有無を判定して、連続して入力された履歴が残っている候補の表示順序を上位にする。
(Element C) Continuity with the immediately preceding character string Possibility of continuing immediately after the input confirmed character and / or the currently selected character (string) at the current time (continuation with the immediately preceding character string) The higher the candidate), the higher the display order. Alternatively, from the past input history, the presence / absence of continuous input to the immediately preceding character string is determined, and the display order of candidates in which the history input continuously remains remains higher.

(要素D)前方文字列との関連性
その時点までにすでに入力が確定している入力確定文字(列)に関連し、当該文字(列)の後方に入力される可能性(前方文字列との関連性)の大きい候補ほど表示順序を上位にする。
(Element D) Relevance to the forward character string There is a possibility that an input is confirmed after the character (string) in relation to the input confirmed character (string) that has already been confirmed by that time (the forward character string and The display order is set higher in the candidate with the greater relevance).

(要素E)単独学習漢字/単語
学習辞書記録部43に記録されている単独学習漢字(単語)であるか否かによって、表示順序を決定する。過去に入力(使用)されたことのある漢字(単語)であれば、再び、使用される可能性は大きい。したがって、単独学習漢字(単語)として記録されている候補の表示順序を上位にする。
(Element E) Single learning kanji / word The display order is determined depending on whether or not it is a single learning kanji (word) recorded in the learning dictionary recording unit 43. If a Chinese character (word) that has been input (used) in the past is likely to be used again. Therefore, the display order of candidates recorded as independent learning kanji (words) is set higher.

(要素F)ペア学習漢字/単語
ペア学習辞書記録部44に記録されているペア学習漢字(単語)であるか否かによって、表示順序を決定する。過去に入力(使用)されたことのある漢字(単語)の組み合わせであれば、再び、その組み合わせで使用される可能性は大きい。したがって、ペア学習漢字(単語)として記録されている候補の表示順序を上位にする。
(Element F) Pair learning kanji / word The display order is determined depending on whether or not the pair learning kanji (word) is recorded in the pair learning dictionary recording unit 44. If a combination of Chinese characters (words) that have been input (used) in the past is likely to be used again in that combination. Therefore, the display order of candidates recorded as pair learning kanji (words) is set higher.

(要素G)学習時期
候補漢字(単語)に一致する学習漢字(単語)が、学習辞書記録部43および/またはペア学習辞書記録部44に記録された時期に基づいて表示順序を決定する。記録された時期が新しいものほど、ユーザにより選択される可能性が大きいので、最近記録された漢字(単語)の候補ほど表示順序を上位にする。
(Element G) Learning Time The display order is determined based on the time when the learning kanji (word) matching the candidate kanji (word) is recorded in the learning dictionary recording unit 43 and / or the pair learning dictionary recording unit 44. The newer the recorded time, the greater the possibility of selection by the user. Therefore, the more recently recorded Chinese character (word) candidates, the higher the display order.

以上の各要素を条件にすることにより、ユーザに選択される可能性の大きい候補ほど、優先して候補文字表示領域122(図14)に表示させることができるので、ユーザは、少ないキー操作数で、所望の漢字を得ることが可能となる。  By setting each of the above elements as a condition, a candidate that is more likely to be selected by the user can be preferentially displayed in the candidate character display area 122 (FIG. 14). Thus, it becomes possible to obtain a desired kanji.

上述したとおり、候補順序決定要素とは、候補順序決定部32が、候補漢字/候補単語の表示順序を決定するために必要な情報である。より具体的には、候補順序決定部32が、候補漢字/候補単語がユーザに選択される可能性の大きさを示す評価値を算出するために使用する情報である。候補(候補漢字/候補単語)ごとに候補順序決定要素の情報が対応づけられて記録部40の各(記録)部に記憶されており、候補順序決定部32は、記録部40の各部を参照して、候補ごとに候補順序決定要素を特定することが可能となる。さらに、記録部40には、候補順序決定部32が特定した候補順序決定要素からどのようにして上記評価値を算出するのかを規定した評価値算出ルールが記憶されていてもよい。これにより、候補順序決定部32は、特定した候補順序決定要素と評価値算出ルールとにしたがって、候補ごとに評価値を求め、候補の表示順序を決定することが可能となる。候補順序決定部32の評価値算出方法は、後述する。  As described above, the candidate order determination element is information necessary for the candidate order determination unit 32 to determine the display order of candidate kanji / candidate words. More specifically, this is information used by the candidate order determination unit 32 to calculate an evaluation value indicating the likelihood that a candidate kanji / candidate word will be selected by the user. Information on candidate order determination elements is associated with each candidate (candidate kanji / candidate word) and stored in each (recording) unit of the recording unit 40. The candidate order determination unit 32 refers to each unit of the recording unit 40. Thus, it becomes possible to specify a candidate order determination element for each candidate. Furthermore, the recording unit 40 may store an evaluation value calculation rule that defines how the evaluation value is calculated from the candidate order determination element specified by the candidate order determination unit 32. Thereby, the candidate order determination unit 32 can obtain the evaluation value for each candidate according to the identified candidate order determination element and the evaluation value calculation rule, and determine the display order of the candidates. The evaluation value calculation method of the candidate order determination unit 32 will be described later.

(候補順序決定部の構成)
図22は、候補順序決定部32のさらに詳細な構成を示すブロック図である。候補順序決定部32は、学習漢字判定部131、ピンイン長判定部132、連結度判定部133、出現頻度判定部134、および、学習時期判定部135を備えている。記録部40(図12、16、21)は、上述の各記憶部に加えて、出現頻度記録部45および連結度記録部(関連度記録部)46を含んでいる。一時記憶部3は、内部に、抽出候補一時記憶部51、評価値一時記憶部52、および、表示順序一時記憶部53を含んでいる。
(Configuration of candidate order determination unit)
FIG. 22 is a block diagram showing a more detailed configuration of the candidate order determination unit 32. The candidate order determination unit 32 includes a learning kanji determination unit 131, a pinyin length determination unit 132, a connectivity determination unit 133, an appearance frequency determination unit 134, and a learning time determination unit 135. The recording unit 40 (FIGS. 12, 16, and 21) includes an appearance frequency recording unit 45 and a connection degree recording unit (relevance degree recording unit) 46 in addition to the storage units described above. The temporary storage unit 3 includes an extraction candidate temporary storage unit 51, an evaluation value temporary storage unit 52, and a display order temporary storage unit 53 therein.

一時記憶部3内の抽出候補一時記憶部51は、候補抽出部31が抽出した候補(以下、抽出候補と称する)としての漢字および/または単語を一時的に保持するものである。候補順序決定部32は、抽出候補一時記憶部51から抽出候補を読み出して、各抽出候補の表示順序を決定する処理を行う。  The extraction candidate temporary storage unit 51 in the temporary storage unit 3 temporarily holds kanji and / or words as candidates extracted by the candidate extraction unit 31 (hereinafter referred to as extraction candidates). The candidate order determination unit 32 reads out extraction candidates from the extraction candidate temporary storage unit 51 and performs a process of determining the display order of each extraction candidate.

評価値一時記憶部52は、候補順序決定要素と評価値算出ルールとに基づいて算出された、上記各抽出候補に付与される評価値を一時的に保持するものである。表示順序は、最終的に算出された評価値を基に決定されてもよい。  The evaluation value temporary storage unit 52 temporarily stores the evaluation value given to each extraction candidate calculated based on the candidate order determination element and the evaluation value calculation rule. The display order may be determined based on the finally calculated evaluation value.

表示順序一時記憶部53は、上記各抽出候補に対して決定された表示順序の情報を一時的に保持するものである。候補順序決定部32は、決定した表示順序を表示順序一時記憶部53に格納する。表示順序一時記憶部53の表示順序の情報は、抽出候補を表示部12に表示する際に表示制御部22によって参照される。  The display order temporary storage unit 53 temporarily holds information on the display order determined for each extraction candidate. The candidate order determination unit 32 stores the determined display order in the display order temporary storage unit 53. The display order information in the display order temporary storage unit 53 is referred to by the display control unit 22 when the extraction candidates are displayed on the display unit 12.

候補順序決定部32の学習漢字判定部131は、抽出候補が、学習漢字(単語)であるか否か、および、それが単独学習であるかペア学習であるかを判定するものである。具体的には、抽出された候補と一致する漢字(単語)が学習辞書記録部43内に記録されている場合は、単独学習漢字(単語)であると判定し、ペア学習辞書記録部44内に記録されている場合は、ペア漢字(単語)であると判定する。学習漢字判定部131は、判定結果を評価値一時記憶部52の評価値または表示順序一時記憶部53の表示順序に反映させる。これにより、要素Eおよび/または要素Fに基づく表示順序を決定することができる。  The learning kanji determination unit 131 of the candidate order determination unit 32 determines whether or not the extraction candidate is a learning kanji (word) and whether it is single learning or pair learning. Specifically, if a kanji (word) that matches the extracted candidate is recorded in the learning dictionary recording unit 43, it is determined that it is a single learning kanji (word), and the pair learning dictionary recording unit 44 Is recorded as a paired kanji (word). The learning kanji determination unit 131 reflects the determination result in the evaluation value in the evaluation value temporary storage unit 52 or the display order in the display order temporary storage unit 53. Thereby, the display order based on the element E and / or the element F can be determined.

ピンイン長判定部132は、入力受付部21(図12、16、21)に入力されたアルファベット(列)の文字数と、対応する候補のピンインの文字数が一致するか否かを判定するものである。例えば、漢字「「外字2」(ピンイン:mei)」を得るために、「me」まで入力していたとする。この時点では、入力文字数は2で、対応する候補漢字「「外字2」(mei)」のピンイン長は3であるため、ピンイン長判定部132は、ピンイン長不一致と判定する。一方、ユーザによって「mei」まで入力された時点では、ピンイン長が一致すると判定し、候補漢字「「外字2」」の表示順序を上がるよう、評価値一時記憶部52の評価値または表示順序一時記憶部53の表示順序を変更する。これにより、要素Bに基づく表示順序を決定することができる。  The pinyin length determination unit 132 determines whether or not the number of characters in the alphabet (column) input to the input receiving unit 21 (FIGS. 12, 16, and 21) matches the number of characters in the corresponding candidate pinyin. . For example, suppose that “me” has been input to obtain the Chinese character “External character 2” (pinyin: mei). At this time, since the number of input characters is 2 and the pinyin length of the corresponding candidate Chinese character ““ external character 2 ”(mei)” is 3, the pinyin length determination unit 132 determines that the pinyin length does not match. On the other hand, when the user inputs “mei”, it is determined that the Pinyin lengths match, and the evaluation value or the display order in the evaluation value temporary storage unit 52 is temporarily increased so as to increase the display order of the candidate kanji ““ External character 2 ””. The display order of the storage unit 53 is changed. Thereby, the display order based on the element B can be determined.

連結度判定部133は、その時点までにすでに入力が確定している入力確定文字および/または現時点で選択中の文字(漢字/単語)とのつながり具合、つまり、連結度に応じて次にユーザが所望する文字を予測して候補に挙げる判定を行うものである。連結度判定部133は、連結度記録部46に記録されている連結度テーブル150を参照して、確定あるいは選択された前方文字列および/または直前文字列との連結度を判定する。前方文字列および/または直前文字列との連結度が高いものほど、ユーザが所望する文字である確率が高いとして、その表示順序を上位にする。これにより、要素Cおよび/または要素Dに基づく表示順序を決定することができる。連結度記録部46の連結度テーブル150および連結度判定部133の詳細については後述する。  The connection degree determination unit 133 determines whether the connection with the input confirmed character and / or the currently selected character (kanji / word) has been confirmed until that time, that is, according to the degree of connection. Predicts a desired character and makes a determination as a candidate. The connectivity determination unit 133 refers to the connectivity table 150 recorded in the connectivity recording unit 46 to determine the connectivity with the confirmed or selected forward character string and / or immediately preceding character string. The higher the degree of connectivity with the preceding character string and / or the immediately preceding character string, the higher the probability that the character is desired by the user, and the higher the display order. Thereby, the display order based on the element C and / or the element D can be determined. Details of the connectivity table 150 and the connectivity determination unit 133 of the connectivity recording unit 46 will be described later.

出現頻度判定部134は、出現頻度記録部45に記録される、既知の統計データに基づいて、候補漢字(単語)が出現する(使用される)頻度を判定するものである。出現頻度が高いものほど、その文字がよく使用されていることになるので、ユーザにより選択される可能性も大きい。したがって、出現頻度の高い候補ほど表示順序を上位にする。これにより、要素Aに基づく表示順序を決定することができる。  The appearance frequency determination unit 134 determines the frequency at which candidate kanji (words) appear (use) based on known statistical data recorded in the appearance frequency recording unit 45. The higher the appearance frequency, the more frequently the character is used, so the possibility of being selected by the user is high. Therefore, the higher the appearance frequency, the higher the display order. Thereby, the display order based on the element A can be determined.

学習時期判定部135は、候補漢字(単語)に一致する学習漢字(単語)が、学習辞書記録部43および/またはペア学習辞書記録部44に記録された時期を判定するものである。学習漢字(単語)が記録された時期が新しいものほど、ユーザにより選択される可能性も大きい。したがって、学習時期が最近の漢字(単語)ほど上位になるよう候補の表示順序を決定する。これにより、要素Gに基づく表示順序を決定することができる。  The learning time determination unit 135 determines the time when the learning kanji (word) matching the candidate kanji (word) was recorded in the learning dictionary recording unit 43 and / or the pair learning dictionary recording unit 44. The newer the time when the learning kanji (word) is recorded, the more likely it is to be selected by the user. Therefore, the display order of candidates is determined so that the more recent kanji (word) is at the higher learning time. Thereby, the display order based on the element G can be determined.

上記構成によれば、候補順序決定部32は、上述のさまざまな条件に基づいて、候補の表示順序を決定することができる。  According to the above configuration, the candidate order determination unit 32 can determine the display order of candidates based on the various conditions described above.

これにより、ユーザの希望をより正確に反映した表示順序で候補を表示することが可能となり、結果として、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。  This makes it possible to display candidates in a display order that more accurately reflects the user's wishes. As a result, the number of operations related to the input of phonograms can be input with a smaller number of operations. Can be obtained.

(連結度の判定)
次に、連結度判定部133の動作について、さらに詳細に説明する。
(Determining connectivity)
Next, the operation of the connectivity determination unit 133 will be described in more detail.

図23は、連結度記録部46に記録される、漢字(単語)ごとの直前(前方)文字列との連結度を示した連結度テーブル150の例を示す図である。図23に示すとおり、連結度テーブル150は、漢字(単語)ごとに格納されている直前文字列との連続性情報のアドレスおよび前方文字列との関連性情報のアドレスを検出するための連結度対応表151と、漢字(単語)ごとに直前文字列との連続性を格納する連続性テーブル152と、漢字(単語)ごとに前方文字列との関連性を格納する前方関連性テーブル153とを含んでいる。  FIG. 23 is a diagram showing an example of the connectivity table 150 showing the connectivity with the immediately preceding (front) character string for each Chinese character (word) recorded in the connectivity recording unit 46. As shown in FIG. 23, the connectivity table 150 detects the connectivity of the continuity information with the immediately preceding character string and the address of the relevance information with the preceding character string stored for each Chinese character (word). A correspondence table 151, a continuity table 152 that stores continuity with the immediately preceding character string for each Chinese character (word), and a forward relationship table 153 that stores the relationship with the forward character string for each Chinese character (word). Contains.

例えば、「交通」という単語がユーザにより選択されると、連結度判定部133は、直前文字列としての「交通」のあとに連続する確率が高い漢字(単語)を連結度テーブル150から検索する。連結度判定部133は、連結度対応表151を参照し、直前文字列「交通」との連続性情報が、連続性テーブル152のアドレス「npi+l」に格納されていることを検知する。  For example, when the word “traffic” is selected by the user, the connectivity determination unit 133 searches the connectivity table 150 for a kanji (word) having a high probability of being continued after “traffic” as the immediately preceding character string. . The connectivity determination unit 133 refers to the connectivity correspondence table 151 and detects that continuity information with the immediately preceding character string “traffic” is stored at the address “npi + l” of the continuity table 152.

次に、連結度判定部133は、連続性テーブル152のアドレス「npi+l」を参照し、「規則(連続性21)」、「大学(16)」、「工具(15)」・・・の順に、連続性が高いことを検出する。最後に、上述の各候補単語の表示順序を、「規則」「大学」「工具」・・・の順にすることを決定する。  Next, the connectivity determination unit 133 refers to the address “npi + 1” in the continuity table 152, and in the order of “rule (continuity 21)”, “university (16)”, “tool (15)”,. , Detect high continuity. Finally, it is determined that the display order of the above candidate words is in the order of “rule”, “university”, “tool”,.

また、単語「上海」の入力が確定されたのちに、「交通」が選択されると、連結度判定部133は、前方文字列としての「上海」の後ろに関連して入力される確率が高い漢字(単語)を連結度テーブル150から検索する。連結度判定部133は、連結度対応表151を参照し、前方文字列「上海」との関連性情報が、前方関連性テーブル153のアドレス「ppi+s」に格納されていることを検知する。  Further, when “traffic” is selected after the input of the word “Shanghai” is confirmed, the connectivity determination unit 133 has a probability that it will be input in association with “Shanghai” as the forward character string. A high kanji (word) is searched from the connectivity table 150. The connectivity determination unit 133 refers to the connectivity correspondence table 151 and detects that the relevance information with the forward character string “Shanghai” is stored at the address “ppi + s” of the forward relevance table 153.

次に、連結度判定部133は、前方関連性テーブル153のアドレス「ppi+s」を参照し、「大学(関連性10)」、「規則(5)」、「警察(3)」・・・の順に、関連性が高いことを検出する。最後に、上述の各候補単語の表示順序を、「大学」「規則」「警察」・・・の順にすることを決定する。  Next, the connectivity determination unit 133 refers to the address “ppi + s” in the forward relevance table 153 and selects “university (relevance 10)”, “rule (5)”, “police (3)”,. In order, it detects that the relevance is high. Finally, it is determined that the display order of the above candidate words is in the order of “university” “rule” “police”.

これにより、ユーザがよく入力する単語の並びにしたがって、候補漢字(単語)の表示順序を決定することができるので、ユーザの嗜好を反映した表示順序でもって候補漢字・単語を表示させることができる。結果として、ユーザのキー操作回数を減らし、所望の漢字を得るためのユーザの入力操作を簡素化することが可能となる。  As a result, the display order of candidate kanji (words) can be determined as a sequence of words frequently input by the user, so that the candidate kanji / words can be displayed in a display order that reflects user preferences. As a result, the number of key operations by the user can be reduced, and the user's input operation for obtaining a desired kanji can be simplified.

(連結度の判定−変形例)
表示順序の決定を、要素C(直前文字列との連続性)および要素D(前方文字列との関連性)の両方を用いて実行する場合、要素Dに基づく判定結果を優先させてもよい。この場合、上述の例で言えば、「交通」が選択された場合に、候補単語「規則」を常に優先して表示するのではなく、前方に「上海」が入力されている場合には、候補単語「大学」を優先して表示することができる。
(Determining connectivity-modification)
When the display order is determined using both the element C (continuity with the immediately preceding character string) and the element D (relevance with the preceding character string), the determination result based on the element D may be prioritized. . In this case, in the above example, when “Transport” is selected, the candidate word “Rule” is not always displayed with priority, but “Shanghai” is input ahead. The candidate word “university” can be displayed with priority.

ユーザが「上海交通大学」を頻繁に入力している文字変換装置1において、「上海交通大学」を入力するときの文字変換装置1の動作について説明する。ユーザが、「上」(shang)の入力のために、ピンインの先頭文字「s」を入力すると、上述の手順で、「上」を候補漢字として表示する。ユーザによって「上」が選択されると、「上」で始まる単語を候補単語として表示する。  The operation of the character conversion device 1 when the user inputs “Shanghai Jiaotong University” in the character conversion device 1 where the user frequently inputs “Shanghai Jiaotong University” will be described. When the user inputs the first character “s” of Pinyin to input “up” (shang), “up” is displayed as a candidate kanji in the above-described procedure. When “upper” is selected by the user, words starting with “upper” are displayed as candidate words.

ユーザによって、「上海」が選択されると、確定文字表示領域123(図14)上に単語「上海」が表示する。同時に、文字変換装置1の候補抽出部31は、入力確定文字「上海」に続いて入力される候補単語を抽出する。候補順序決定部32は、「上海」に続く確率の高い単語を上位に表示するために、図22の連結度記録部46を参照し、候補単語の表示順序を決定する。  When “Shanghai” is selected by the user, the word “Shanghai” is displayed on the fixed character display area 123 (FIG. 14). At the same time, the candidate extraction unit 31 of the character conversion device 1 extracts candidate words that are input following the input confirmed character “Shanghai”. The candidate order determining unit 32 determines the display order of the candidate words with reference to the connectivity recording unit 46 of FIG. 22 in order to display the word with a high probability following “Shanghai” at the top.

まず、連結度判定部133は、連結度対応表151(図23)に基づいて、連続性テーブル152のアドレス「npi+s」を参照し、単語候補を、単語「上海」に直接連続する確率(連続度)の高い順に並べる。すなわち、図23に示す例では、「大学(15)」「交通(13)」「警察(12)」「規則(8)」...の順に候補が求まる。続いて、連結度判定部133は、入力確定文字「上海」の前方に位置する単語との関連性に基づいて、「上海」のあとに続く候補単語の表示順序を並べ替える。しかし、ここでは、「上海」の前方に位置する漢字・単語がないため、前方文字列との関連性による表示順序の変更は実行されない。  First, the connectivity determination unit 133 refers to the address “npi + s” of the continuity table 152 based on the connectivity correspondence table 151 (FIG. 23), and the probability that the word candidate is directly connected to the word “Shanghai” (continuous). Arrange in descending order. That is, in the example shown in FIG. 23, “University (15)” “Transport (13)” “Police (12)” “Rule (8)”. . . Candidates are found in the order of. Subsequently, the connectivity determination unit 133 rearranges the display order of the candidate words following “Shanghai” based on the relevance to the word positioned in front of the input confirmed character “Shanghai”. However, here, since there is no kanji / word located in front of “Shanghai”, the display order is not changed due to the relationship with the forward character string.

上記手順で表示された候補単語の中から、ユーザによって「交通」が選択されると、文字変換装置1は、続いて、入力確定文字「交通」に直接連続する候補単語を上位に表示するための表示順序を決定する。  When “traffic” is selected by the user from the candidate words displayed in the above procedure, the character conversion device 1 subsequently displays the candidate words directly continuous to the input confirmed character “traffic” at the top. Determine the display order.

連結度判定部133は、連続性テーブル152のアドレス「npi+l」を参照し、連続度に基づいて「規則(21)」、「大学(16)」、「工具(15)」、「警察(14)」...の順に候補を求める。次に、前方関連性テーブル153のアドレス「ppi+s」を参照して、「交通」の前方に位置する漢字・単語(ここでは、「上海」)との関連性(関連度)に基づいて、「交通」のあとに続く候補単語の表示順序を並べ替える。より具体的には、図23に示す例では、前方関連性テーブル153によれば、候補単語の「上海」との関連度は、順に、「大学(10)」、「規則(5)」、「警察(3)」、「工具(2)」...となっている。  The connectivity determination unit 133 refers to the address “npi + 1” in the continuity table 152 and determines “rule (21)”, “university (16)”, “tool (15)”, “police (14) based on the continuity. ) ". . . Search for candidates in the following order. Next, referring to the address “ppi + s” in the forward relationship table 153, based on the relationship (relevance) with the kanji / word (here “Shanghai”) located in front of “Transport”, “ Rearrange the display order of the candidate words that follow "Transport". More specifically, in the example shown in FIG. 23, according to the forward relevance table 153, the degree of association with the candidate word “Shanghai” is “University (10)”, “Rule (5)”, "Police (3)", "Tool (2)". . . It has become.

そこで、連結度判定部133は、上記候補単語の関連度を優先し、関連度の順に表示順序を変更する。この場合、「上海交通」に続く、候補単語の表示順序は、「規則」、「大学」、「工具」、「警察」...の順から、「大学」、「規則」、「警察」、「工具」...の順に変更される。あるいは、連結度および関連度の合計に基づいて、表示順序を変更してもよい。また、連結度および関連度の平均値、最大値に基づいて表示順序を変更してもよい。例えば、連結度と関連度との合計を評価値として算出することを規定した評価値算出ルールが、記録部40に記憶されており、候補順序決定部32は、上記評価値算出ルールにしたがって、連結度および関連度の合計を評価値として算出し、その評価値に基づいて表示順序を決定することができる。  Therefore, the connectivity determination unit 133 prioritizes the relevance of the candidate word and changes the display order in the order of relevance. In this case, the display order of candidate words following “Shanghai Jiao” is “rule”, “university”, “tool”, “police”. . . From the order of "University", "Rules", "Police", "Tools". . . The order is changed. Alternatively, the display order may be changed based on the sum of the degree of connection and the degree of association. Further, the display order may be changed based on the average value and the maximum value of the degree of connection and the degree of association. For example, an evaluation value calculation rule that prescribes that the total of the connectivity and the relevance is calculated as an evaluation value is stored in the recording unit 40, and the candidate order determination unit 32 follows the evaluation value calculation rule described above. The sum of the degree of connection and the degree of association can be calculated as an evaluation value, and the display order can be determined based on the evaluation value.

以上のことから、ユーザの嗜好に沿った、より精度の高い表示順序でもって候補漢字・単語を表示させることができるので、ユーザのキー操作回数を減らすことができる。結果として、所望の漢字を得るためのユーザの入力操作を簡素化することが可能となる。  From the above, candidate kanji / words can be displayed in a display order with higher accuracy according to the user's preference, so that the number of key operations by the user can be reduced. As a result, the user's input operation for obtaining a desired kanji can be simplified.

(表示順序決定手順)
本実施形態では、上述の各候補順序決定要素を組み合わせて、抽出された候補の表示順序を決定する。以下にその一例について説明するが、本発明は、以下で説明する組み合わせに限定されず、上述の各要素を適宜組み合わせることより表示順序を決定することが可能である。
(Display order determination procedure)
In this embodiment, the display order of the extracted candidates is determined by combining the above-described candidate order determination elements. One example will be described below, but the present invention is not limited to the combination described below, and the display order can be determined by appropriately combining the above-described elements.

図24は、候補順序決定部32が表示順序を決定するときの、候補の分類手順を示す図である。候補順序決定部32は、まず、所定の条件(上記要素A〜Gおよびその組み合わせ)によって、表示順序ごとにいくつかのグループに候補を分類し、そのグループに内において、最終的な表示順序を決定する。  FIG. 24 is a diagram illustrating a candidate classification procedure when the candidate order determination unit 32 determines the display order. First, the candidate order determination unit 32 classifies the candidates into several groups for each display order according to predetermined conditions (the elements A to G and combinations thereof), and sets the final display order within the groups. decide.

候補抽出部31によって抽出された候補単語Gは、まず、一時記憶部3の抽出候補一時記憶部51(図22)に格納される。格納された候補単語Gに対し、学習漢字判定部131(図22)は、学習単語であるか否かの判定を行う(S301)。また、ピンイン長判定部132は、候補単語Gが抽出された時点で入力されているピンイン長(アルファベットの文字数)と、候補単語Gの各ピンイン長との比較を行う(S302)。  The candidate word G extracted by the candidate extraction unit 31 is first stored in the extraction candidate temporary storage unit 51 (FIG. 22) of the temporary storage unit 3. For the stored candidate word G, the learning kanji determination unit 131 (FIG. 22) determines whether or not it is a learning word (S301). Further, the pinyin length determination unit 132 compares the pinyin length (number of letters of the alphabet) input at the time when the candidate word G is extracted with each pinyin length of the candidate word G (S302).

ここで、候補単語Gのうち、学習単語であり、かつ、ピンイン長も一致すると判定された候補単語は、表示順序が最上位のグループAに分類される。学習単語であるが、ピンイン長は一致しないと判定された候補単語は、グループAに次いで上位のグループBに分類される。学習単語ではないが、ピンイン長は一致すると判定された候補単語は、グループB下位のグループCに分類される。学習単語でもなく、ピンイン長も一致しないと判定された候補単語は、最下位のグループDに分類される。  Here, among the candidate words G, candidate words that are determined to be learning words and have the same pinyin length are classified into the group A having the highest display order. Candidate words that are learning words but are determined not to have the same Pinyin length are classified into group B, which is higher than group A. Candidate words that are not learning words but are determined to have the same Pinyin length are classified into group C, which is lower than group B. Candidate words that are not learning words and are determined not to have the same Pinyin length are classified into the lowest group D.

グループA、Bに分類された、学習単語である候補単語に対し、学習漢字判定部131は、さらに、単独学習単語であるかペア学習単語であるかの判定を行う(S303)。また、連結度判定部133は、直前文字列との連続性の有無についての判定を行う(S304)。  For the candidate words that are learning words classified into groups A and B, the learning kanji determination unit 131 further determines whether the learning word is a single learning word or a pair learning word (S303). Further, the connectivity determination unit 133 determines whether or not there is continuity with the immediately preceding character string (S304).

ここで、グループAの候補単語のうち、ペア学習単語であって、直前文字列との連続性ありと判定された候補単語は、最上位のグループA1に分類される。ペア学習単語であるが、直前文字列との連続性なしと判定された候補単語は、上位のグループA2に分類される。ペア学習単語でないが、直前文字列との連続性ありと判定された候補単語は、下位のグループA3に分類される。ペア学習単語でなく、直前文字列との連続性もないと判定された候補単語は、最下位のグループA4に分類される。グループBの候補単語についても同様に分類される。  Here, among the candidate words of group A, the candidate words that are pair learning words and are determined to have continuity with the immediately preceding character string are classified into the highest group A1. Although it is a pair learning word, the candidate word determined to have no continuity with the immediately preceding character string is classified into the upper group A2. Although it is not a pair learning word, the candidate word determined to have continuity with the immediately preceding character string is classified into the lower group A3. Candidate words that are not pair-learned words and are determined not to have continuity with the immediately preceding character string are classified into the lowest group A4. The group B candidate words are also classified in the same manner.

一方、グループC、Dに分類された候補単語に対しては、連結度判定部133が直前文字列との連続性の有無を判定して(S305)、上位のグループC(D)1と下位のグループC(D)2とに分類する。  On the other hand, for candidate words classified into groups C and D, the connectivity determination unit 133 determines the presence or absence of continuity with the immediately preceding character string (S305), and the upper group C (D) 1 and lower And group C (D) 2.

最終的に、全候補単語(G)は、上位のグループから順に、グループA1、グループA2、グループA3、グループA4、グループB1、グループB2、グループB3、グループB4、グループC1、グループC2、グループD1、グループD2、の小グループに分類される。グループA、Bの各小グループは、さらに学習時期(要素G)によって順序が決定され(最近学習された漢字ほど上位)、グループC、Dの各小グループは、さらに出現頻度(要素A)によって順序が決定される(一般によく使われる単語ほど上位)。  Finally, all the candidate words (G) are group A1, group A2, group A3, group A4, group B1, group B2, group B3, group B4, group C1, group C2, and group D1 in order from the upper group. , Group D2, and a small group. The order of each small group of groups A and B is further determined by the learning time (element G) (the more recently learned kanji is higher), and each small group of groups C and D is further determined by the appearance frequency (element A) The order is determined (the more commonly used words are higher).

なお、上述の実施形態では、学習された候補漢字・単語を、所定の条件で(すなわち、新しく学習された順に)並べ替えると説明したが、候補として抽出された候補漢字の後に、過去に学習された候補単語として並べてもよい。あるいは、過去に学習された単語が候補漢字より優先して表示されるように並べてもよい。また、候補漢字を含む過去に使用された単語が複数ある場合は、文字数が少ない順に並べてもよい。あるいは、時間的な経過として、学習された順もしくはその逆順に並べてもよい。  In the above-described embodiment, it has been described that learned candidate kanji / words are rearranged under a predetermined condition (that is, in the newly learned order). However, learning is performed in the past after candidate kanji extracted as candidates. You may arrange as a candidate word made. Or you may arrange so that the word learned in the past may be displayed with priority over a candidate Chinese character. Moreover, when there are a plurality of words used in the past including candidate Chinese characters, they may be arranged in ascending order of the number of characters. Alternatively, as time course, they may be arranged in the learned order or vice versa.

(変形例3−四声の入力)
本実施形態では、四声の区別を無視してアルファベット(列)とピンインとを対応させる構成について説明したが、本発明の文字変換装置1は上記構成に限定されない。四声の区別を行って、アルファベット(列)とピンインとを対応させる構成も可能である。例えば、四声コード(例えば、PCでの入力では一声から四声を1から4、軽声を5で表現している)を含めて、図15に示すA/P対応表141を作成すればよい。より具体的には、図15に示すA/P対応表141およびP/C対応表142において、ピンイン「shang」は、漢字「上」と関連付けられていることがわかる。ここで、「上」の四声ありのピンインは「三声のshang」であるため、A/P対応表141の「cp_si」に対応する「shang」を「shang3」と記述することで、四声ありのピンイン「shang3」と「上」とを関連付けることができる。
(Modification 3-Input of four voices)
In the present embodiment, the configuration in which the alphabet (column) and Pinyin are associated with each other while ignoring the distinction between the four voices has been described, but the character conversion device 1 of the present invention is not limited to the above configuration. A configuration is also possible in which alphabets (rows) and Pinyin are made to correspond by distinguishing four voices. For example, if the A / P correspondence table 141 shown in FIG. 15 is created, including a four-voice code (for example, one to four voices are represented by 1 to 4 and a light voice is represented by 5 in PC input). Good. More specifically, in the A / P correspondence table 141 and the P / C correspondence table 142 shown in FIG. 15, it can be seen that Pinyin “shang” is associated with the Chinese character “above”. Here, since the pinyin with four voices “upper” is “three voices shang”, “shang” corresponding to “cp_si” in the A / P correspondence table 141 is described as “shang3”. Pinyin “shang3” with voice can be associated with “above”.

〔実施形態2〕
本発明の文字変換装置1は、さらに、上述の候補順序決定要素に優先度の情報を付与し、候補漢字(単語)の表示順序を決定するときの条件(評価値算出ルール)を、ユーザが任意に設定できるように構成してもよい。表示順序を決定するときの条件をユーザが任意に設定できるので、文字変換装置1を備えたマルチファンクションプリンタにおいて、ユーザの嗜好に合致した表示順序で候補を表示することが可能となる。結果として、所望の漢字を得るための入力操作を簡素化することができる。
[Embodiment 2]
The character conversion device 1 of the present invention further assigns priority information to the above-mentioned candidate order determination elements, and the conditions (evaluation value calculation rules) when the user determines the display order of candidate kanji (words) are determined by the user. You may comprise so that it can set arbitrarily. Since the user can arbitrarily set the conditions for determining the display order, the multi-function printer provided with the character conversion device 1 can display candidates in the display order that matches the user's preference. As a result, an input operation for obtaining a desired kanji can be simplified.

(文字変換装置の構成)
本実施形態における文字変換装置1は、上述の実施形態1の構成に加えて、文字入力制御部30の内部に、候補順序決定要素設定部(候補順序決定要素設定手段)35を備えており、記録部40の内部に、さらに候補順序決定要素記録部47を含んでいる(図12)。
(Configuration of character conversion device)
The character conversion device 1 according to the present embodiment includes a candidate order determination element setting unit (candidate order determination element setting means) 35 inside the character input control unit 30 in addition to the configuration of the first embodiment described above. A candidate order determination element recording unit 47 is further included inside the recording unit 40 (FIG. 12).

本実施形態では、図22に示す評価値一時記憶部52に、候補ごとに算出した評価値を一時的に記憶し、その評価値に基づいて表示順序を決定する。すなわち、候補順序決定要素設定部35によって設定された、優先度の高い候補順序決定要素ほど、上記評価値の算出により大きな影響を与える。候補順序決定要素設定部35が設定した候補順序決定要素およびその優先度は、候補順序決定要素記録部47に記録される。  In this embodiment, the evaluation value calculated for each candidate is temporarily stored in the evaluation value temporary storage unit 52 shown in FIG. 22, and the display order is determined based on the evaluation value. That is, a candidate order determination element having a higher priority set by the candidate order determination element setting unit 35 has a greater influence on the calculation of the evaluation value. The candidate order determination elements set by the candidate order determination element setting unit 35 and their priorities are recorded in the candidate order determination element recording unit 47.

まず、評価値一時記憶部52に記憶される候補ごとの評価値のデータ構造について説明する。  First, the data structure of the evaluation value for each candidate stored in the evaluation value temporary storage unit 52 will be described.

図25は、候補ごとに算出した表示順序の評価値を記憶するデータ構造の一例を示す図である。本実施形態では、候補ごとの評価値を16ビットで表現する。すなわち、図25に示す16の領域に、ある候補漢字(単語)の特性(要素A〜G)を示す「0」または「1」の値を記憶する。本実施形態では、ビット位置は、評価値の高低に関連があり、上位ビットになるにつれて、評価値の上位桁を表すようになっている。よって、優先度の高い候補順序決定要素に関する判定結果は、上位ビットに反映させる。すなわち、評価値算出ルールは、候補漢字(単語)の候補順序決定要素要素から「0」または「1」の値をどのように求めるかを規定するとともに、そのように求まった値を、評価値のどのビット位置に反映させるかを規定している。  FIG. 25 is a diagram illustrating an example of a data structure that stores display order evaluation values calculated for each candidate. In this embodiment, the evaluation value for each candidate is expressed by 16 bits. That is, the value of “0” or “1” indicating the characteristics (elements A to G) of a certain candidate Chinese character (word) is stored in the 16 areas shown in FIG. In the present embodiment, the bit position is related to the level of the evaluation value, and represents the upper digit of the evaluation value as it becomes higher bits. Therefore, the determination result regarding the candidate order determination element having a high priority is reflected in the upper bits. That is, the evaluation value calculation rule defines how to obtain the value of “0” or “1” from the candidate order determination element element of the candidate kanji (word), and the value thus obtained is used as the evaluation value. This specifies the bit position to be reflected.

このようなデータ構造によれば、文字変換装置1が候補ごとの評価値を算出するときの、評価値に与える要素の重要度をビット位置によって調節することが可能となる。つまり、重要な要素ほど上位位置に割り当てているので、ビットのON「1」/OFF「0」操作を行うことのみで、候補の表示順序の評価値を容易に適切に数値化することができる。また、各要素に対して個別に変数を割り当てると、表示順序を決定するために確保すべき評価値のデータサイズが大きくなる。よって、各要素による判定結果を1ビットに割り当てていることにより、データサイズの削減を実現することができる。  According to such a data structure, when the character conversion device 1 calculates an evaluation value for each candidate, it is possible to adjust the importance of an element given to the evaluation value by the bit position. In other words, since important elements are assigned to higher positions, the evaluation value of the candidate display order can be easily quantified easily only by performing the bit ON “1” / OFF “0” operation. . In addition, if a variable is assigned to each element individually, the data size of evaluation values to be secured for determining the display order increases. Therefore, the data size can be reduced by assigning the determination result of each element to 1 bit.

候補順序決定要素記録部47は、候補の表示順序を決定するための候補順序決定要素の優先度情報を記録するためのものである。図26の(a)および図26の(b)は、候補順序決定要素記録部47に記録される優先度情報の一例を示す図である。  The candidate order determination element recording unit 47 is for recording priority information of candidate order determination elements for determining a candidate display order. FIGS. 26A and 26B are diagrams illustrating an example of priority information recorded in the candidate order determination element recording unit 47. FIG.

優先度情報は、候補順序決定要素ごとに、その候補順序決定要素に関する判定結果を、評価値のデータ構造のどのビット位置に反映させるかを示すビット位置情報を含んでいる。図26の(a)に示す例では、要素Bの判定結果を図25に示すビット位置12の領域に格納するよう設定されている。すなわち、ピンイン長が一致した場合は、ビット位置12の領域に「1」が、一致しなければ「0」が評価値として記憶される。高いビット位置を割り当てられている候補順序決定要素ほど、優先度が高く、候補の評価値を定めるのに与える影響が大きい。  The priority information includes, for each candidate order determination element, bit position information indicating in which bit position of the evaluation value data structure the determination result related to the candidate order determination element is reflected. In the example shown in FIG. 26A, the determination result of the element B is set to be stored in the area of the bit position 12 shown in FIG. That is, when the Pinyin lengths match, “1” is stored as the evaluation value in the area of the bit position 12 and when they do not match, “0” is stored as the evaluation value. The candidate order determination element to which a higher bit position is assigned has a higher priority and has a larger influence on determining the evaluation value of the candidate.

なお、本実施形態では、評価値を16ビットで表現し、ビット位置0〜12の領域を用いて評価値を算出しているが、本発明はこの例に限定されない。候補順序決定要素数を減らしたり、新たな要素の追加または各要素の評価値としてのレンジ幅の変更をしたりする場合は、それらが十分に納まるビット長にすることも可能である。例えば、図26の(a)および図26の(b)に示す例において、出現頻度を8ビットで表現しているが、出現頻度の差を明確にするために16ビット確保する、あるいは、出現頻度の差を重視しないために4ビットに縮小することなどが可能である。また、空きのビット位置13〜15を用いてもよい。  In this embodiment, the evaluation value is expressed by 16 bits, and the evaluation value is calculated using the region of bit positions 0 to 12, but the present invention is not limited to this example. When the number of candidate order determination elements is reduced, or when a new element is added or a range width is changed as an evaluation value of each element, it is possible to make the bit length sufficiently large. For example, in the example shown in FIG. 26 (a) and FIG. 26 (b), the appearance frequency is expressed by 8 bits, but 16 bits are secured or the appearance appears to clarify the difference in the appearance frequency. Since the difference in frequency is not important, it can be reduced to 4 bits. Also, empty bit positions 13 to 15 may be used.

候補順序決定要素設定部35は、入力部11(図12)を介してユーザが指定する候補順序決定要素の優先度を設定し、優先度情報を候補順序決定要素記録部47に格納するものである。  The candidate order determination element setting unit 35 sets priorities of candidate order determination elements designated by the user via the input unit 11 (FIG. 12), and stores priority information in the candidate order determination element recording unit 47. is there.

より具体的には、例えば、ユーザが候補順序決定要素の優先度設定メニューを、操作パネル2を用いて文字変換装置1に指示すると、操作パネル2の表示部12は、候補順序決定要素の優先順位の指定を促す操作画面を表示する。例えば、「(各要素(A〜G)を)優先したい順に指示してください。」などのメッセージとともに、優先度を設定できる候補順序決定要素一覧を表示すればよい。ユーザが、優先したい順に表示されている各要素を指示すると、決定するか否かを問うメッセージの表示を行う。例えば、「変更を決定する場合は、決定キーを押してください。」などのメッセージを表示すればよい。  More specifically, for example, when the user instructs the priority conversion menu of the candidate order determination element to the character conversion device 1 using the operation panel 2, the display unit 12 of the operation panel 2 gives priority to the candidate order determination element. Displays an operation screen that prompts you to specify the order. For example, a list of candidate order determination elements for which priority can be set may be displayed together with a message such as “Please specify each element (A to G) in order of priority”. When the user indicates each element displayed in the order of priority, a message asking whether to decide is displayed. For example, a message such as “If you decide to change, press the enter key” may be displayed.

ユーザが操作パネル2の決定キーを押すと、候補順序決定要素設定部35は、入力された指示信号に応じて、低いビット位置から、ユーザが指定した優先度が低い候補順序決定要素の領域として順に割り当て、各候補順序決定要素の判定結果を格納するビット位置の情報を変更する。  When the user presses the determination key on the operation panel 2, the candidate order determination element setting unit 35 determines the candidate order determination element region having a low priority designated by the user from a low bit position according to the input instruction signal. The bit position information for storing the determination result of each candidate order determination element is changed in order.

例えば、ユーザが、図26の(a)に示した例の状態から、要素Fのペア学習漢字/単語を最も優先度の高い候補順序決定要素として、順に、要素E、要素F、要素B、要素C、要素D、要素A/Gを指定したとすると、優先度情報は、図26の(b)に示すとおりに変更される。図26の(b)に示す例では、要素Fの判定結果が、ビット位置12の領域に格納されることになる。  For example, from the state of the example shown in FIG. 26A, the user sets the element learning pair Kanji / word of element F as the candidate order determination element with the highest priority in order of element E, element F, element B, If element C, element D, and element A / G are designated, the priority information is changed as shown in FIG. In the example shown in (b) of FIG. 26, the determination result of the element F is stored in the area of the bit position 12.

上記構成によれば、候補順序決定部32の各部(図22)は、候補順序決定要素記録部47が指定する候補順序決定要素の優先度情報に基づいて、判定結果に係る評価値を指定された評価値一時記憶部52のビット位置に格納する。  According to the above configuration, each part (FIG. 22) of the candidate order determination unit 32 is designated with the evaluation value related to the determination result based on the priority information of the candidate order determination element specified by the candidate order determination element recording unit 47. The evaluation value temporary storage unit 52 stores the bit position.

これにより、表示順序を決定するための評価値を、ユーザが優先させたい候補順序決定要素をもとに算出することが可能となるので、よりユーザの嗜好に合致した表示順序で候補を表示させることが可能となる。  As a result, the evaluation value for determining the display order can be calculated based on the candidate order determining element that the user wants to prioritize, so that the candidates are displayed in a display order that more matches the user's preference. It becomes possible.

なお、この候補順序決定要素の優先度情報は、候補漢字と候補単語とで別に設定できる構成としてもよいし、候補漢字・候補単語の両方の表示順序に同様に適用する1つの優先度情報を設定できる構成としてもよい。候補漢字と候補単語とで別に設定できる構成とした場合、優先度の変更操作を、1回の優先度設定メニュー呼び出し操作によって、候補漢字、候補単語の順に候補順序決定要素の優先度変更操作を行えるようにしてもよいし、候補漢字用、候補単語用それぞれの優先度設定メニュー呼び出し操作および優先度変更操作を行えるようにしてもよい。  The priority information of the candidate order determination element may be configured to be set separately for candidate kanji and candidate words, or one priority information that is similarly applied to the display order of both candidate kanji and candidate words. It is good also as composition which can be set up. In a configuration in which candidate kanji and candidate words can be set separately, the priority change operation can be performed by changing the priority of the candidate order determination element in the order of candidate kanji and candidate words by one priority setting menu call operation. It may be possible to perform a priority setting menu call operation and a priority change operation for candidate Chinese characters and candidate words.

また、設定終了キーを設け、設定終了キーを押した時点までの内容に関して、所望の優先度情報の変更を行うようにしてもよい。例えば、候補順序決定要素の優先度の変更途中で設定終了キーを押した場合には、優先度の変更内容を反映しないようにし、候補順序決定要素の変更だけを反映さえるなどすることが可能である。  Further, a setting end key may be provided, and desired priority information may be changed with respect to contents up to the point when the setting end key is pressed. For example, when the setting end key is pressed in the middle of changing the priority of the candidate order determination element, it is possible not to reflect the change contents of the priority and reflect only the change of the candidate order determination element. is there.

次に、図22に示す候補順序決定部32の各部の判定結果に基づいて、図25に示す評価値を算出する方法についてより詳細に説明する。なお、以下で説明する例では、優先度は、図26の(a)に示すとおりに設定されているものとする。  Next, a method for calculating the evaluation value shown in FIG. 25 based on the determination result of each part of the candidate order determination unit 32 shown in FIG. 22 will be described in more detail. In the example described below, it is assumed that the priority is set as shown in FIG.

まず、候補抽出部31が抽出した候補は、一旦抽出候補一時記憶部51に格納される。評価値一時記憶部52において、格納された候補ごとに、その評価値を表す16ビットの領域(図25)が確保される。  First, the candidates extracted by the candidate extraction unit 31 are temporarily stored in the extraction candidate temporary storage unit 51. In the evaluation value temporary storage unit 52, a 16-bit region (FIG. 25) representing the evaluation value is secured for each stored candidate.

次に、候補が学習漢字(単語)である場合には、学習時期判定部135が、そうでない場合には、出現頻度判定部134が、学習時期または出現頻度をそれぞれ算出し、評価値算出ルールに基づいて、算出結果をビット位置0〜7(図25)に格納する。  Next, when the candidate is a learning kanji (word), the learning time determination unit 135 calculates the learning time or the appearance frequency, respectively, otherwise, the evaluation frequency calculation rule. Based on the above, the calculation result is stored in bit positions 0 to 7 (FIG. 25).

出現頻度は、あらかじめ大量の新聞や雑誌などの様々な文書文字データについて統計的に文字および単語ごとに求めた使用頻度であり、頻度が大きいほど一般的によく使われる文字・単語であるとする。本実施形態では、出現頻度の領域を8ビット確保しているので、出現頻度に基づいて、評価値算出ルールにしたがい、候補の評価値を0〜255の間で定めることができる。  Appearance frequency is the usage frequency obtained statistically for each character and word for various document character data such as a large number of newspapers and magazines in advance, and the higher the frequency, the more commonly used characters and words. . In this embodiment, since the appearance frequency area is 8 bits, the candidate evaluation value can be set between 0 and 255 according to the evaluation value calculation rule based on the appearance frequency.

学習時期についても同様に、最近学習されたものほど評価値が高くなるよう0〜255の間で定めることができる。学習時期とは、候補漢字(単語)がいつ学習されたかを表す。評価値算出ルールについて具体的に説明すれば以下のとおりである。例えば、学習時期をX、学習できる最大個数をNとし、学習できる漢字・単語の学習した時点をn、現時点の学習できる時点をmとすると任意の漢字・単語の学習時期Xは、以下の式で求まる。
m−n≧0のとき
X=N+m−n−1・・・(式1−1)
m−n<0のとき
X=n−m−1・・・(式1−2)
ここで、学習時期Xにおいて、Xの値が小さいほど過去に学習されたものとする。
Similarly, the learning time can be set between 0 and 255 so that the more recently learned, the higher the evaluation value. The learning time represents when the candidate kanji (word) is learned. The evaluation value calculation rule will be specifically described as follows. For example, if the learning time is X, the maximum number that can be learned is N, the learning time of a kanji / word that can be learned is n, and the current learning time is m, the learning time X of any kanji / word can be expressed by the following equation: It is obtained by.
When m−n ≧ 0, X = N + mn−1 (Formula 1-1)
When m−n <0, X = n−m−1 (Formula 1-2)
Here, in the learning period X, it is assumed that learning is performed in the past as the value of X is small.

なお、上記式のXの値域が、学習時期の評価値として確保されているビット長の範囲(本実施形態では8ビット)を越える場合は、Xの値をビット長の範囲への数値変換や、ビット長の変更を行えばよい。  When the value range of X in the above formula exceeds the bit length range (8 bits in this embodiment) reserved as the evaluation value for the learning time, the value of X is converted into a numerical value range of bit length, The bit length may be changed.

ビット位置8〜12には、それぞれ、要素D、C、F、E、Bについての判定結果が格納される。学習漢字判定部131、ピンイン長判定部132、および、連結度判定部133は、候補の特性が条件を満足していると判定した場合には「1」、そうでない場合には「0」を指定されたビット位置にセットする。例えば、連結度判定部133は、候補がすでに入力されている前方文字列と関連性ありと判定した場合には、ビット位置8に「1」をセットする。  Bit positions 8 to 12 store determination results for elements D, C, F, E, and B, respectively. The learning kanji determination unit 131, the pinyin length determination unit 132, and the connectivity determination unit 133 set “1” when it is determined that the characteristics of the candidate satisfy the condition, and “0” otherwise. Set to the specified bit position. For example, the connectivity determination unit 133 sets “1” in the bit position 8 when determining that the candidate is related to the forward character string already input.

すべての候補について表示順序の評価値を算出すると、候補順序決定部32は、候補を評価値一時記憶部52に記憶される評価値の大きい順に並べ替え、最終的な表示順序を表示順序一時記憶部53に格納する。最後に、表示制御部22(図12)は、表示順序一時記憶部53に記憶されている上記表示順序に基づいて、候補を表示部12に表示する。  When the display order evaluation values are calculated for all candidates, the candidate order determination unit 32 rearranges the candidates in descending order of evaluation values stored in the evaluation value temporary storage unit 52, and temporarily stores the final display order in the display order temporarily. Stored in the unit 53. Finally, the display control unit 22 (FIG. 12) displays candidates on the display unit 12 based on the display order stored in the display order temporary storage unit 53.

〔実施形態3〕
上述の各実施形態では、ピンインを構成するアルファベットキーの入力による中国語入力の説明を行った。しかし、本発明の文字変換装置1はこれに限定されない。操作パネル2の入力部11(図12)が、手書き文字の入力機能を備え、入出力制御部20が手書き文字を認識することにより、中国語を入力する文字変換装置1を構成することも可能である。
[Embodiment 3]
In each of the above-described embodiments, Chinese input by inputting alphabet keys constituting Pinyin has been described. However, the character conversion device 1 of the present invention is not limited to this. The input unit 11 (FIG. 12) of the operation panel 2 has an input function of handwritten characters, and the input / output control unit 20 can recognize the handwritten characters to configure the character conversion device 1 that inputs Chinese. It is.

また、手書き文字を入力するための入力部(筆記文字入力部)11は、例えば、表示一体型タブレットとしての操作パネル2の表示領域に手書き文字入力のための枠を表示することにより実現することができる。  Moreover, the input part (written character input part) 11 for inputting a handwritten character is implement | achieved by displaying the frame for a handwritten character input in the display area of the operation panel 2 as a display integrated tablet, for example. Can do.

文字変換装置1は、入出力制御部20内部に、上記文字入力枠にユーザが筆記した文字の筆記情報(座標データ)を認識するための文字認識部(文字認識手段)(図示せず)を備える。また、記録部40に、上記文字認識部で認識された入力文字パターンとマッチングするために用いる認識辞書(図示せず)をさらに含む。そして、表示制御部22が、入力文字の認識結果を出力するように構成されている。  The character conversion device 1 includes a character recognition unit (character recognition means) (not shown) for recognizing writing information (coordinate data) of characters written by the user in the character input frame inside the input / output control unit 20. Prepare. The recording unit 40 further includes a recognition dictionary (not shown) used for matching with the input character pattern recognized by the character recognition unit. And the display control part 22 is comprised so that the recognition result of an input character may be output.

ユーザは、操作パネル2の文字入力枠に所望の文字を筆記すると、操作パネル2は筆記された文字の座標情報60(図27)を検出し、入出力制御部20の内部バッファに記憶する。文字認識部は、内部バッファに記憶している座標情報と認識辞書の辞書パターンとマッチング(例えば、DPマッチング)を行い、入力パターンと辞書パターンの類似度(例えば距離)を求め、辞書パターンに対応する文字コードと類似度を関連付けて内部バッファに記憶する。文字認識部は、入力パターンと認識辞書の各パターンとのマッチングを行うと、内部バッファの認識結果を類似度の高い順に並べ換える。そして、認識結果を候補漢字(単語)として候補抽出部31に供給する。  When the user writes a desired character in the character input frame of the operation panel 2, the operation panel 2 detects the coordinate information 60 (FIG. 27) of the written character and stores it in the internal buffer of the input / output control unit 20. The character recognition unit matches the coordinate information stored in the internal buffer with the dictionary pattern of the recognition dictionary (for example, DP matching), obtains the similarity (for example, distance) between the input pattern and the dictionary pattern, and corresponds to the dictionary pattern The character code to be associated with the similarity is stored in the internal buffer. When the character recognition unit performs matching between the input pattern and each pattern in the recognition dictionary, the character recognition unit rearranges the recognition results in the internal buffer in descending order of similarity. Then, the recognition result is supplied to the candidate extraction unit 31 as a candidate kanji (word).

以下、手書き文字認識機能を備えた文字変換装置1の動作を具体的に説明する。  Hereinafter, the operation of the character conversion device 1 having a handwritten character recognition function will be described in detail.

ユーザが、表示一体型タブレットの文字入力枠に「外字2」を筆記すると(図28の(a))、操作パネル2は「外字2」の座標データを検出し、内部バッファに記憶する(図27)。文字認識部は、内部バッファの「外字2」の座標データと認識辞書の各辞書パターンとDPマッチングを行い、距離を計算し、距離の小さい順に並べ替える(図29)。入出力制御部20は、認識結果を表示制御部22に転送する。  When the user writes “external character 2” in the character input frame of the display-integrated tablet (FIG. 28A), the operation panel 2 detects the coordinate data of “external character 2” and stores it in the internal buffer (FIG. 28). 27). The character recognition unit performs DP matching with the coordinate data of “external character 2” in the internal buffer and each dictionary pattern of the recognition dictionary, calculates distances, and rearranges them in ascending order of distance (FIG. 29). The input / output control unit 20 transfers the recognition result to the display control unit 22.

表示制御部22は、認識結果に基づいて、認識文字候補となるn個の文字(ここでは、漢字)の表示位置を求め、表示位置の情報および認識文字候補n個を操作パネル2の表示部12に表示する(図28の(b))。操作パネル2は、表示された認識文字候補と表示位置を関連付けて内部バッファに記憶する。  The display control unit 22 obtains a display position of n characters (here, kanji characters) that are recognition character candidates based on the recognition result, and displays the display position information and n recognition character candidates n on the display unit of the operation panel 2. 12 (FIG. 28B). The operation panel 2 stores the displayed recognized character candidate and the display position in association with each other in the internal buffer.

ユーザは、「外字2」が表示されていることを確認すると、操作パネル2上の「外字2」を指定する。操作パネル2は指示された位置を検出し、入出力制御部20の候補選択受付部23に位置情報を転送する。そして、候補選択受付部23で「外字2」が指示されたことを検出し、「外字2」から始まる単語(「「外字2」天」・・・)が表示される(図28の(c))。このときの動作は、すでに説明しているので、ここでは繰り返さない。  When the user confirms that “external character 2” is displayed, the user designates “external character 2” on the operation panel 2. The operation panel 2 detects the instructed position and transfers the position information to the candidate selection receiving unit 23 of the input / output control unit 20. Then, it is detected that “external character 2” is instructed by the candidate selection receiving unit 23, and a word starting from “external character 2” (“external character 2” heaven ”...) Is displayed ((c) in FIG. )). Since the operation at this time has already been described, it will not be repeated here.

これにより、ユーザが所望の漢字に対応するピンインを把握していない場合でも、所望の漢字を入力することが可能となり、所望の漢字を得るための入力操作を簡素化することができる。  Thereby, even when the user does not grasp the pinyin corresponding to the desired kanji, it becomes possible to input the desired kanji, and the input operation for obtaining the desired kanji can be simplified.

なお、手書き文字を認識するための、文字変換装置1の上記文字認識部の機能について、マルチファンクションプリンタを例に挙げて説明したが、これに限定されない。表示一体型のタッチパネルを備えた機器であればいずれも、上記文字認識部を適用することが可能である。したがって、筆記文字を入力することにより所望の漢字・単語を入力することが可能な本発明の文字変換装置を、上記マルチファンクションプリンタ以外の機器においても実現することが可能である。  In addition, although the function of the said character recognition part of the character conversion apparatus 1 for recognizing a handwritten character was demonstrated taking the example of the multifunction printer, it is not limited to this. Any device provided with a display-integrated touch panel can apply the character recognition unit. Therefore, the character conversion device of the present invention that can input a desired kanji / word by inputting written characters can be realized in devices other than the multifunction printer.

〔実施形態4〕
(繁体字の入力)
上述の実施形態では、ピンイン表記から中国語(簡体字)を入力可能な文字変換装置について説明した。しかしながら、本発明の文字変換装置1は上記構成に限定されない。
[Embodiment 4]
(Traditional input)
In the above-described embodiment, the character conversion device capable of inputting Chinese (simplified characters) from Pinyin notation has been described. However, the character conversion device 1 of the present invention is not limited to the above configuration.

例えば、本発明の文字変換装置1を、主に台湾で使用される繁体字を入力するための文字変換装置として実現することも可能である。  For example, the character conversion device 1 of the present invention can also be realized as a character conversion device for inputting traditional characters used mainly in Taiwan.

本実施形態では、以下、表音文字としての注音文字(注音の字母)の入力を受け付けて、表意文字としての繁体字を、候補漢字(単語)としてユーザに提示する文字変換装置1について説明する。  In the present embodiment, hereinafter, a character conversion device 1 that accepts input of a phonetic character (a phonetic character) as a phonetic character and presents a traditional character as an ideogram as a candidate kanji (word) to the user will be described. .

図30は、本実施形態に係る文字変換装置1の要部構成を示すブロック図である。なお、図30の各構成要素に付された符号は、図12・図22の各構成要素に付された符号に対応しており、同じ符号は、同じ構成要素を示している。したがって、上述の各実施形態ですでに説明した構成要素についての説明は繰り返さない。  FIG. 30 is a block diagram showing the main configuration of the character conversion device 1 according to this embodiment. 30 correspond to the reference numerals assigned to the constituent elements in FIGS. 12 and 22, and the same reference numerals indicate the same constituent elements. Therefore, the description about the component already demonstrated by each above-mentioned embodiment is not repeated.

図30に示す文字変換装置1において、図12・図22と異なる点は、入力部11が、注音文字を入力するための、各注音文字に対応付けられたキーを備えている点と、入力受付部21が、上記入力された注音文字を受け付けて候補抽出部31に供給するための注音文字入力受付部24を備えている点と、漢字辞書部41において、注音文字−注音、および、注音−繁体字の対応関係を記録した対応表が含まれている点である。  In the character conversion device 1 shown in FIG. 30, the difference from FIGS. 12 and 22 is that the input unit 11 includes a key associated with each sung character for inputting the sung character. The reception unit 21 includes a utterance character input reception unit 24 for receiving the input phonon character and supplying it to the candidate extraction unit 31. In the kanji dictionary unit 41, the phonation character-note sound and the sound injection -A correspondence table that records the correspondence of traditional characters is included.

図31は、本実施形態における、繁体字入力のための注音文字入力処理時の操作画面の一例を示す図である。本実施形態における表示一体型の操作パネル2では、アルファベットを表示するほかに、注音文字を表示してもよい(文字入力領域121)。繁体字の入力では、アルファベットではなく注音文字を入力することが一般的である。図31に示すとおり、キーボードのキーに注音文字が割り当てられており、これにより、繁体字に対応した注音を入力することができる。  FIG. 31 is a diagram illustrating an example of an operation screen at the time of a sung character input process for inputting traditional characters according to the present embodiment. In the display-integrated operation panel 2 in the present embodiment, in addition to displaying the alphabet, a sung character may be displayed (character input area 121). In inputting traditional Chinese characters, it is common to input phonic characters instead of alphabets. As shown in FIG. 31, a sound-injecting character is assigned to a key on the keyboard, so that a sound-injecting sound corresponding to a traditional character can be input.

図32は、本実施形態における、漢字辞書部41(図30)に記録される、漢字辞書(繁体字)の例を示す図である。  FIG. 32 is a diagram showing an example of a Chinese character dictionary (traditional character) recorded in the Chinese character dictionary unit 41 (FIG. 30) in the present embodiment.

図33は、本実施形態における、単語辞書部42に記録される、単語辞書の例を示す図である。  FIG. 33 is a diagram showing an example of a word dictionary recorded in the word dictionary unit 42 in the present embodiment.

図34は、本実施形態における、連結度記録部46に記録される、連結度テーブル150aの例を示す図である。  FIG. 34 is a diagram illustrating an example of the connectivity table 150a recorded in the connectivity recording unit 46 in the present embodiment.

上記構成によれば、中国語(簡体字)を入力する場合と同様に、所望の表意文字(台湾で主に用いられる繁体字)を得るための、表音文字(注音の字母)を入力する操作を簡素化することが可能な文字変換装置を実現することが可能となる。  According to the above configuration, as in the case of inputting Chinese (simplified characters), an operation for inputting a phonetic character (a syllabary character) to obtain a desired ideogram (a traditional character used mainly in Taiwan). It is possible to realize a character conversion device that can simplify the above.

〔学習機能について〕
(学習漢字・単語における表示順序決定方法)
学習漢字・単語の表示順序は、例えば以下のような計算によって、学習された順序(学習順位Yと称する)を算出することにより、決定することもできる。学習順位Yの算出は、図22に示す学習時期判定部135が実行すればよい。
Y=学習番号−学習カウンタ−1・・・(式2)
学習番号は、新たに学習される漢字に割り当てるべきユニークな番号を表しており、この番号が、学習カウンタとして学習漢字とともに記録されることにより、その漢字がいつ学習されたかを知ることができるものである。図21の学習辞書記録部43(または、ペア学習辞書記録部44)には、500個の学習漢字(単語)を記録することが可能であるとすると、学習番号は、0〜499までを用意すればよい。
[About the learning function]
(Method for determining the display order of learning kanji and words)
The learning kanji / word display order can also be determined by calculating the learned order (referred to as learning order Y), for example, by the following calculation. The learning order Y may be calculated by the learning time determination unit 135 shown in FIG.
Y = learning number−learning counter−1 (Expression 2)
The learning number represents a unique number that should be assigned to a newly learned kanji, and this number is recorded with the learning kanji as a learning counter so that it can be known when the kanji has been learned. It is. If it is possible to record 500 learning kanji (words) in the learning dictionary recording unit 43 (or pair learning dictionary recording unit 44) in FIG. 21, learning numbers 0 to 499 are prepared. do it.

上記式2の計算により、Yがマイナスになる場合は、学習番号の上限値(ここでは、500程度)を加算する。  If Y is negative by the calculation of Equation 2, the upper limit value of learning numbers (here, about 500) is added.

さらに、学習時期判定部135は、候補の並び替えの手間を省くために、候補ごとに求まった学習順位Yをまるめる処理を行ってもよい。例えば、以下の手順にしたがって、学習順位をまるめることができる。
(イ)0≦Y≦9のとき、Y←Y(そのまま)
(ロ)10≦Y≦29のとき、Y←(Y−10)/2+10
(ハ)30≦Y≦109のとき、Y←(Y−30)/8+20
(ニ)Y≧110のとき、Y←(Y−110)/32+30、さらに、Y>39のとき、Y←39
以上のように、上記式2を用いれば、学習漢字(単語)を学習された順、あるいは、学習された時期が新しい順に効率よく並べ替えることができるので、学習時期に応じて候補としての表示順序を決定することが可能となる。
Furthermore, the learning time determination unit 135 may perform a process of rounding the learning rank Y obtained for each candidate in order to save the time and effort of rearranging the candidates. For example, the learning order can be rounded according to the following procedure.
(B) When 0 ≦ Y ≦ 9, Y ← Y (as it is)
(B) When 10 ≦ Y ≦ 29, Y ← (Y−10) / 2 + 10
(C) When 30 ≦ Y ≦ 109, Y ← (Y−30) / 8 + 20
(D) When Y ≧ 110, Y ← (Y−110) / 32 + 30, and when Y> 39, Y ← 39
As described above, by using the above formula 2, it is possible to efficiently rearrange the learning kanji (words) in the order in which they were learned, or in the order in which the learning time was new, so that they are displayed as candidates according to the learning time. The order can be determined.

(学習カウンタ付与方法)
次に、図21に示す学習制御部34が制御する学習番号(初期値=0)および学習カウンタ(初期値=0)について、より具体的に説明する。学習辞書記録部43に500個の学習漢字を記録できるものとし、学習辞書記録部43における学習漢字の記録位置(アドレス)の初期値をID=0とする。
(Learning counter assignment method)
Next, the learning number (initial value = 0) and the learning counter (initial value = 0) controlled by the learning control unit 34 shown in FIG. 21 will be described more specifically. It is assumed that 500 learning kanji characters can be recorded in the learning dictionary recording unit 43, and the initial value of the recording position (address) of the learning kanji in the learning dictionary recording unit 43 is ID = 0.

学習番号=0のときに漢字「学」を学習すると、学習制御部34は、学習辞書記録部43に学習されている学習漢字のうち、現在の学習番号に等しい学習カウンタを持つ学習漢字を検索する。検索された学習漢字のアドレスIDの漢字を削除し、新規の学習漢字をセットする。現在の学習番号に等しい学習カウンタを持つ学習漢字が無い場合は、IDの位置に学習漢字と学習カウンタを共に記録する。そして、学習番号に1を加算する。ここでは、最初の学習であるため、アドレス「ID=0」の位置に、学習漢字「学」を学習カウンタ=0とともに記録し、学習番号に1加算して、学習番号=1とする。  When learning the kanji “gaku” when the learning number = 0, the learning control unit 34 searches the learning kanji learned in the learning dictionary recording unit 43 for learning kanji having a learning counter equal to the current learning number. To do. The kanji with the address ID of the searched learning kanji is deleted, and a new learning kanji is set. If there is no learning kanji having a learning counter equal to the current learning number, both the learning kanji and the learning counter are recorded at the ID position. Then, 1 is added to the learning number. Here, since it is the first learning, the learning kanji character “gaku” is recorded at the position of the address “ID = 0” together with the learning counter = 0, and 1 is added to the learning number, so that the learning number = 1.

この動作を繰り返して、学習番号=499のときに「文」を学習すると、学習制御部34は、学習辞書記録部43のアドレス「k」の位置に、学習漢字「文」を、学習カウンタ499とともに記録し、学習番号=0に更新する(学習番号499に1を加算した結果、学習番号が500以上になる場合は、500を減算して学習番号を0に戻す)。  When this operation is repeated and “sentence” is learned when the learning number = 499, the learning control unit 34 sets the learning kanji “sentence” to the learning counter 499 at the address “k” in the learning dictionary recording unit 43. And the learning number is updated to 0 (if the learning number becomes 500 or more as a result of adding 1 to the learning number 499, 500 is subtracted and the learning number is returned to 0).

さらに、新しく漢字(例えば「大」)が学習されると、学習制御部34は、新たな学習漢字「大」を、学習カウンタ0とともに記録されている「学」に上書きする形で記録する。このとき「大」には、学習カウンタ0が関連付けて記録される。続いて、上記と同様学習番号=2に更新する。  Further, when a new kanji character (for example, “Large”) is learned, the learning control unit 34 records the new learned Kanji character “Large” overwriting the “Language” recorded together with the learning counter 0. At this time, “Large” is recorded with the learning counter 0 associated therewith. Subsequently, the learning number is updated to 2 as described above.

(学習辞書のデータ構造)
次に、学習辞書記録部43(および、ペア学習辞書記録部44)に記録される学習単語のデータ構造について説明する。
(Data structure of learning dictionary)
Next, the data structure of learning words recorded in the learning dictionary recording unit 43 (and the pair learning dictionary recording unit 44) will be described.

学習辞書記録部43に記録される学習単語には、その単語を構成する漢字の文字コードから生成されるグループ識別子(GId値)が割り当てられており、学習単語はGId値と関連付けて記録される。このGId値を用いることにより、学習辞書記録部43から目的の学習単語を検索するための処理効率が向上する。  The learning word recorded in the learning dictionary recording unit 43 is assigned a group identifier (GId value) generated from the character codes of kanji characters constituting the word, and the learning word is recorded in association with the GId value. . By using this GId value, the processing efficiency for searching the target learning word from the learning dictionary recording unit 43 is improved.

GId値の生成方法について、具体例を挙げて説明する。なお、以下の説明では、漢字を一意に特定するための漢字コードおよびGId値をともに16ビットで表すものとする。本実施形態では、一例として、GId値は、当該単語の文字数を示す上位4ビットと、単語を構成する各漢字の漢字コードの演算により求まった数値を示す下位12ビットとで構成されるものとするが、本発明の文字変換装置1で利用されるGId値のデータ構造はこれに限定されない。  A method for generating the GId value will be described with a specific example. In the following description, both the kanji code for uniquely identifying the kanji and the GId value are represented by 16 bits. In this embodiment, as an example, the GId value is composed of the upper 4 bits indicating the number of characters of the word and the lower 12 bits indicating the numerical value obtained by the operation of the kanji code of each kanji constituting the word. However, the data structure of the GId value used in the character conversion device 1 of the present invention is not limited to this.

例えば、「上海」という単語の入力が確定されたとする。このとき、学習制御部34(図21)は、まず「上海」という単語のGId値を生成する。GId値を生成するために、単語「上海」を構成する各漢字の漢字コードの下位8ビットを、各漢字を表す数値(「上」=「009F(16進数)」、「海」=「00A3(16進数)」)として用いるものとする。例えば、GId値の下位12ビットを、上記漢字コード16ビットの下位8ビット同士の加算により求めるとすると、学習制御部34は、下位12ビットとして、9F+A3=「141(16進数)」を算出する。  For example, assume that the input of the word “Shanghai” is confirmed. At this time, the learning control unit 34 (FIG. 21) first generates a GId value of the word “Shanghai”. In order to generate the GId value, the lower 8 bits of the kanji code of each kanji constituting the word “Shanghai” are expressed by numerical values (“upper” = “009F (hexadecimal number)”, “sea” = “00A3”. (Hexadecimal number) "). For example, if the lower 12 bits of the GId value are obtained by adding the lower 8 bits of the 16 Kanji code, the learning control unit 34 calculates 9F + A3 = “141 (hexadecimal number)” as the lower 12 bits. .

次に、「上海」は2文字であるので、この単語が2文字で構成されていることを示す「2(16進数)」を上位4ビットとして算出する。以上のようにして、単語「上海」のGId値を「2141(16進数)」として算出する。  Next, since “Shanghai” has two characters, “2 (hexadecimal number)” indicating that this word is composed of two characters is calculated as the upper 4 bits. As described above, the GId value of the word “Shanghai” is calculated as “2141 (hexadecimal number)”.

上述のようにして生成されたGId値は、どのような文字数からなる単語であっても(ただし、上述の例のように文字数を4ビットで表す場合、最大8文字までを単語として学習するものとする)、固定長(例えば、16ビット)に要約されることになる。したがって、固定長で構成されるGId値によって、目的の単語を絞り込んでから、検索処理を実行することができるので、学習単語の検索効率を向上させることが可能となる。  The GId value generated as described above is a word consisting of any number of characters (however, when the number of characters is expressed by 4 bits as in the above example, up to 8 characters are learned as words) And a fixed length (for example, 16 bits). Therefore, the search processing can be executed after narrowing down the target word by the GId value configured with a fixed length, so that the search efficiency of the learning word can be improved.

〔操作パネルについて〕
操作パネル2に表示される文字入力処理時の操作画面は、図14や図17で示す例に限定されない。操作パネル2に表示される操作画面の他の例について説明する。
[About the operation panel]
The operation screen displayed during the character input process displayed on the operation panel 2 is not limited to the examples shown in FIGS. Another example of the operation screen displayed on the operation panel 2 will be described.

操作パネル2に表示される、ピンインを入力するためのアルファベットキーは、図35に示すように、PCのキーボードを模したキー配列としてもよいし、図36に示すように、入力文字をアルファベット順にm×nのキー配列に当てはめるようにしてもよい。  The alphabet keys for inputting pinyin displayed on the operation panel 2 may be arranged as a key imitating a PC keyboard as shown in FIG. 35, or the input characters are arranged in alphabetical order as shown in FIG. It may be applied to an m × n key arrangement.

また、候補漢字を表示するための候補文字表示領域122を確定文字表示領域123に重畳させて表示してもよい(図37の(a)〜(c))。  Also, a candidate character display area 122 for displaying candidate kanji characters may be displayed superimposed on the confirmed character display area 123 ((a) to (c) of FIG. 37).

さらに、候補漢字を選択後、選択した漢字から始まる候補単語を表示するための第2の候補文字表示領域122’を、候補文字表示領域122および確定文字表示領域123に重畳させて表示してもよいし(図38の(a))、候補文字表示領域122と並べて表示してもよい(図38の(b))。  Further, after selecting a candidate kanji, a second candidate character display area 122 ′ for displaying a candidate word starting from the selected kanji may be displayed superimposed on the candidate character display area 122 and the confirmed character display area 123. Alternatively, it may be displayed side by side with the candidate character display area 122 (FIG. 38B).

〔実施形態5〕
本発明の一実施形態について図1〜図11に基づいて説明すると以下の通りである。ここでは、漢字(変換文字、変換された後の文字)の読み(表音文字)を入力して漢字を含む単語を決定する装置とするが、これに限定されない。つまり、以下で説明する実施の形態は本発明を実施するための一例であって、本発明を実現する上で制限されるものではない。
[Embodiment 5]
An embodiment of the present invention will be described below with reference to FIGS. Here, although it is set as the apparatus which inputs the reading (phonetic character) of a Chinese character (converted character, the character after conversion), and determines the word containing a Chinese character, it is not limited to this. That is, the embodiment described below is an example for carrying out the present invention, and is not limited in realizing the present invention.

図1は、本実施の形態に係る文字変換装置1の構成を示すブロック図である。文字変換装置1は、入力部11、辞書検索部310、表示制御部22、漢字辞書部(変換文字辞書)41、単語辞書部(単語辞書)42、一時記憶部3、制御部10、表示部12を備えている。なお、図1の各構成要素に付された符号は、図12・図16・図21・図22・図30の各構成要素に付された符号に対応しており、同じ符号は、同じ構成要素を示している。なお、図1には示されていない図12・図16・図21・図22・図30の各部を、図1の文字変換装置1が備えていてもよい。  FIG. 1 is a block diagram showing a configuration of a character conversion device 1 according to the present embodiment. The character conversion device 1 includes an input unit 11, a dictionary search unit 310, a display control unit 22, a kanji dictionary unit (converted character dictionary) 41, a word dictionary unit (word dictionary) 42, a temporary storage unit 3, a control unit 10, and a display unit. 12 is provided. 1 correspond to the reference numerals given to the constituent elements in FIGS. 12, 16, 21, 21, 22 and 30, and the same reference numerals denote the same constituent elements. Indicates an element. 1 may be provided with each part of FIG. 12, FIG. 16, FIG. 21, FIG. 22, and FIG. 30 that are not shown in FIG.

入力部11は、キーボード等からなり、ユーザが所望の入力文字列の読み(表音文字)、後段で説明する選択した漢字、選択した単語等を、入力することができるように構成されている。また、入力部11は、ユーザが文字変換装置1への各種指示を入力できるように構成されている。なお、入力部11と表示部12とを兼用して、操作パネル2(タッチパネル)として設けられていてもよい。  The input unit 11 includes a keyboard or the like, and is configured so that the user can input a desired input character string (phonetic character), a selected kanji character, a selected word, and the like described later. . The input unit 11 is configured such that the user can input various instructions to the character conversion device 1. Note that the input unit 11 and the display unit 12 may also be used as the operation panel 2 (touch panel).

表示制御部22は、入力部11から入力された読み及び読みを基に、辞書検索部310が検索した漢字、単語及びそれらの候補をユーザが選択可能に表示部12に表示する。表示部12は、表示制御部22の制御の下、各種データの表示を行う。  Based on the readings and readings input from the input unit 11, the display control unit 22 displays the kanji and words searched by the dictionary search unit 310 on the display unit 12 so that the user can select them. The display unit 12 displays various data under the control of the display control unit 22.

本実施形態では、候補抽出部31は、辞書検索部310を備えている。辞書検索部310は、記録部40に記憶されている各辞書部(漢字辞書部41および単語辞書部42)を検索し、候補となる漢字(または単語)を検出する。本実施形態では、辞書検索部310は、さらに、漢字取得部(先頭変換文字取得手段)311と単語取得部(単語取得手段)312とを備えている。  In this embodiment, the candidate extraction unit 31 includes a dictionary search unit 310. The dictionary search unit 310 searches each dictionary unit (the kanji dictionary unit 41 and the word dictionary unit 42) stored in the recording unit 40, and detects candidate kanji (or words). In the present embodiment, the dictionary search unit 310 further includes a kanji acquisition unit (first conversion character acquisition unit) 311 and a word acquisition unit (word acquisition unit) 312.

漢字取得部311は、入力受付部(受付手段)21が受け付けた読みの文字列を入力とし、漢字辞書部41を検索して所望の条件に一致した漢字(あるいは、以下で説明する漢字情報)を検索結果として一時記憶部3に記憶する。さらに単語取得部312は、漢字取得部311の検索結果及び入力受付部21が受け付けた読みの文字列を入力とし、単語辞書部42を検索して所望の条件に一致した単語(あるいは、以下で説明する単語情報)を検索結果として一時記憶部3に記憶する。漢字取得および単語取得の詳細は後述する。  The kanji acquisition unit 311 receives the character string of the reading received by the input receiving unit (accepting means) 21 and searches the kanji dictionary unit 41 to match the desired condition (or kanji information described below). Is stored in the temporary storage unit 3 as a search result. Further, the word acquisition unit 312 uses the search result of the kanji acquisition unit 311 and the character string of the reading received by the input reception unit 21 as input, and searches the word dictionary unit 42 to search for a word (or below) that matches a desired condition. Word information to be described) is stored in the temporary storage unit 3 as a search result. Details of kanji acquisition and word acquisition will be described later.

漢字辞書部41は、読みと漢字とを対応付けた漢字対応情報144を保持している。さらに、読みの先頭文字と該先頭文字を先頭とする漢字の、漢字対応情報144での格納先のアドレス情報を対応付けた漢字インデックス(漢字インデックステーブル)145を保持している。ここでは、漢字インデックス145は、漢字の読みの順に並べられているものとする。  The kanji dictionary unit 41 holds kanji correspondence information 144 that associates readings with kanji. Furthermore, a kanji index (kanji index table) 145 is stored in which the first character of the reading is associated with the address information of the storage destination of the kanji corresponding to the first character in the kanji correspondence information 144. Here, it is assumed that the kanji index 145 is arranged in the order of reading kanji.

単語辞書部42は、単語と該単語の読みとが対応付けられた単語対応情報162を保持している。さらに、単語の先頭となりうる先頭文字と、該先頭文字を先頭に持つ単語の、単語対応情報162での格納先のアドレス情報とが対応付けられた単語インデックス(単語インデックステーブル)161を保持している。単語対応情報162と単語インデックス161とは、単語の先頭文字毎にグループ化されている。  The word dictionary unit 42 holds word correspondence information 162 in which a word and a reading of the word are associated with each other. Furthermore, a word index (word index table) 161 in which the first character that can be the head of the word and the address information of the storage destination in the word correspondence information 162 of the word having the first character at the head is stored. Yes. The word correspondence information 162 and the word index 161 are grouped for each leading character of the word.

また、漢字対応情報144は、漢字に対応付けて補助情報を格納している。また、単語対応情報162は、単語に対応付けて補助情報を格納している。これら、補助情報は、例えば、読みの文字数(例えば、上述の各実施形態におけるピンイン長(要素B))(検索補助情報)や出現頻度(上述の要素A)(表示補助情報)等が挙げられる。上記補助情報は、読みの文字数及び出現頻度を所定の値域、例えば、1から100の範囲に変換した数値とする。以下では、漢字情報とは、漢字とその漢字に対応付けられた情報(読み、補助情報)とを指すものとする。また、単語情報とは、単語とその単語に対応付けられた情報(読み、補助情報)とを指すものとする。しかし、補助情報は、もちろん、上記に限定されず、これ以外の情報であってもよい。例えば、上述の各実施形態で述べた候補順序決定要素(要素C〜要素G)を補助情報として、候補(漢字/単語)に対応付けて記憶しておいてもよい。  The kanji correspondence information 144 stores auxiliary information in association with kanji. The word correspondence information 162 stores auxiliary information in association with words. Examples of the auxiliary information include the number of reading characters (for example, the Pinyin length (element B) in each of the above-described embodiments) (search auxiliary information), the appearance frequency (the above-described element A) (display auxiliary information), and the like. . The auxiliary information is a numerical value obtained by converting the number of characters read and the appearance frequency into a predetermined range, for example, a range of 1 to 100. In the following, kanji information refers to kanji and information (reading, auxiliary information) associated with the kanji. The word information refers to a word and information (reading and auxiliary information) associated with the word. However, the auxiliary information is of course not limited to the above, and may be other information. For example, the candidate order determination elements (element C to element G) described in the above embodiments may be stored as auxiliary information in association with candidates (kanji / words).

制御部10は、文字変換装置1における各種構成の動作を統括的に制御する。例えば、入力部11から入力された文字列の文字数をカウントする。また、辞書検索部310、表示制御部22の制御を行う。また、入力受付部21を備えおり、ユーザが入力部11から入力した文字列を受け付けるようになっている。  The control unit 10 comprehensively controls operations of various components in the character conversion device 1. For example, the number of characters in the character string input from the input unit 11 is counted. Further, the dictionary search unit 310 and the display control unit 22 are controlled. Moreover, the input reception part 21 is provided and the character string which the user input from the input part 11 is received.

次に、文字変換装置1の処理動作について、図2に示すフローチャートを用いて説明する。  Next, the processing operation of the character conversion apparatus 1 will be described using the flowchart shown in FIG.

ユーザが入力部11から入力したい文字列の先頭文字の読みとして、その読みの先頭文字を含む1以上の読み文字列を入力部11から入力すると、入力受付部21は入力された読み文字列を制御部10に転送する。  When the user inputs one or more reading character strings including the first character of the reading as the reading of the first character of the character string that the user wants to input from the input unit 11, the input receiving unit 21 inputs the input reading character string. Transfer to the control unit 10.

制御部10は入力部11から転送された読み文字列の文字数をカウントし、読み文字列とその文字数を一時記憶部3に記憶する。そして、制御部10は辞書検索部310に漢字検索を指示する(S101)。  The control unit 10 counts the number of characters in the reading character string transferred from the input unit 11 and stores the reading character string and the number of characters in the temporary storage unit 3. Then, the control unit 10 instructs the dictionary search unit 310 to search for Chinese characters (S101).

次に、辞書検索部310の漢字取得部311は、一時記憶部3から読み文字列と読み文字列の文字数を辞書検索部310の内部バッファ(図示せず)に読み込む。漢字取得部311は、漢字インデックス145を参照し、読み文字列の先頭文字を基に、漢字対応情報144内での検索すべき検索対象範囲の終了位置のアドレス(iNum)を求めて内部バッファに保持する(S102)。さらに、漢字対応情報144内での検索すべき検索対象範囲の開始位置のアドレス(iStart)を求めて内部バッファに保持する(S103)。  Next, the kanji acquisition unit 311 of the dictionary search unit 310 reads the read character string and the number of characters of the read character string from the temporary storage unit 3 into an internal buffer (not shown) of the dictionary search unit 310. The kanji acquisition unit 311 refers to the kanji index 145 and obtains the address (iNum) of the end position of the search target range to be searched in the kanji correspondence information 144 based on the first character of the reading character string in the internal buffer. Hold (S102). Further, the address (iStart) of the start position of the search target range to be searched in the kanji correspondence information 144 is obtained and held in the internal buffer (S103).

そして、漢字取得部311は、辞書検索部310の内部バッファに保持したアドレスを基に、漢字対応情報144を参照して漢字情報を読み込み、漢字対応情報144の読み情報と入力文字列の読みとを比較する(S104)。入力文字列の読みと、漢字対応情報144での読みが一致している場合は(S104でYES)、漢字取得部311は、読みが一致の条件を満足した漢字情報を一時記憶部3に記憶する(S105)。  The kanji acquisition unit 311 reads kanji information by referring to the kanji correspondence information 144 based on the address held in the internal buffer of the dictionary search unit 310, and reads the kanji correspondence information 144 and the input character string. Are compared (S104). When the reading of the input character string and the reading in the kanji correspondence information 144 match (YES in S104), the kanji acquisition unit 311 stores the kanji information that satisfies the matching condition in the temporary storage unit 3. (S105).

そして、iStartを更新する(S106)。その後、漢字取得部311は内部バッファに保持しているiNumとS106で更新されたiStartとを比較する(S107)。比較した結果、検索する漢字について、iStartがiNum以上になっていると(S107においてNO)、制御部10に漢字検索が終了したことを知らせる。  Then, iStart is updated (S106). Thereafter, the kanji acquisition unit 311 compares the iNum held in the internal buffer with the iStart updated in S106 (S107). As a result of the comparison, if iStart is equal to or greater than iNum for the kanji to be searched (NO in S107), the control unit 10 is informed that the kanji search has ended.

なお、漢字検索の具体的な説明は、実施例を用いて後述する。  A specific description of Kanji search will be described later using an embodiment.

制御部10は、辞書検索部310から漢字検索が終了したことの通知を受けると、一時記憶部3に記憶されている漢字検索結果を所定の順に並べ替え(S108)、表示位置の情報を付加して一時記憶部3に記憶する。加えて、表示制御部22は、表示部12に漢字検索結果の表示を行う(S109)。なお、上記所定の順に並べ替える際、補助情報の出現頻度の順に並べ替えてもよいし、上述の各実施形態で説明したとおり、候補順序決定要素(および評価値算出ルール)に基づいて、候補順序決定部32が評価値を算出し、それに基づいて並べ替えてもよい。  Upon receiving a notification from the dictionary search unit 310 that the kanji search has been completed, the control unit 10 rearranges the kanji search results stored in the temporary storage unit 3 in a predetermined order (S108) and adds display position information. And stored in the temporary storage unit 3. In addition, the display control unit 22 displays the kanji search result on the display unit 12 (S109). In addition, when rearranging in the predetermined order, it may be rearranged in the order of appearance frequency of auxiliary information, and as described in each of the above embodiments, candidates are determined based on the candidate order determining element (and the evaluation value calculation rule). The order determination unit 32 may calculate evaluation values and rearrange them based on the evaluation values.

次に、ユーザの指示入力があるかを確認する(S110)。ユーザは、表示部12に表示された漢字検索結果を目視して、所望の漢字を選択し、入力部11を用いてその漢字が表示されている位置を指示入力する。このようなユーザの指示入力があると(S110にてYES)、入力部11は指示位置の位置情報を制御部10の入力受付部21に送信する。  Next, it is confirmed whether there is a user instruction input (S110). The user visually checks the kanji search result displayed on the display unit 12, selects a desired kanji, and uses the input unit 11 to instruct and input the position where the kanji is displayed. When there is such a user instruction input (YES in S110), the input unit 11 transmits the position information of the indicated position to the input receiving unit 21 of the control unit 10.

制御部10は、入力受付部21で受け付けた位置情報と、一時記憶部3に記憶している漢字検索結果の表示位置の情報とを比較し、入力された漢字を検出する(S111)。さらに、制御部10は、ユーザにより指定された漢字を辞書検索部310に転送し、単語検索を行うことを指示する。なお、このとき、候補選択受付部23が、ユーザにより選択された漢字を検出し、学習制御手段が、それを学習漢字として、学習辞書記録部43またはペア学習辞書記録部44に記憶してもよい。  The control unit 10 compares the position information received by the input receiving unit 21 with the information on the display position of the kanji search result stored in the temporary storage unit 3, and detects the input kanji (S111). Further, the control unit 10 transfers the kanji specified by the user to the dictionary search unit 310 and instructs to perform a word search. At this time, the candidate selection receiving unit 23 detects the kanji selected by the user, and the learning control means stores it in the learning dictionary recording unit 43 or the pair learning dictionary recording unit 44 as the learning kanji. Good.

辞書検索部310の単語取得部312は、単語検索の指示を受けると、単語インデックス161を参照し、取得した漢字の識別情報(文字コード)を基に、単語対応情報162内での検索すべき検索対象範囲の終了位置のアドレス(iNum)を求めて内部バッファに保持する(S112)。さらに、単語対応情報162内で検索すべき検索対象範囲の開始位置のアドレス(iStart)を求めて内部バッファに保持する(S113)。  Upon receiving a word search instruction, the word acquisition unit 312 of the dictionary search unit 310 refers to the word index 161 and should search in the word correspondence information 162 based on the acquired kanji identification information (character code). The address (iNum) of the end position of the search target range is obtained and held in the internal buffer (S112). Further, the address (iStart) of the start position of the search target range to be searched in the word correspondence information 162 is obtained and held in the internal buffer (S113).

そして、単語取得部312は、辞書検索部310の内部バッファに保持したアドレスを基に、単語対応情報162を参照して単語情報を読み込み、所定の条件に一致する単語情報を一時記憶部3に記憶する(S114)。  Then, the word acquisition unit 312 reads the word information with reference to the word correspondence information 162 based on the address held in the internal buffer of the dictionary search unit 310, and stores the word information matching the predetermined condition in the temporary storage unit 3. Store (S114).

その後、単語取得部312は、検索対象の単語についてのiStartを更新し(S114a)、内部バッファに保持しているiNumとS114aで更新したiStartとを比較する(S115)。比較した結果、検索対象の単語について、iStartがiNum以上になっていると(S115においてNO)、制御部10に単語検索が終了したことを知らせる。  Thereafter, the word acquisition unit 312 updates the iStart for the search target word (S114a), and compares the iNum held in the internal buffer with the iStart updated in S114a (S115). As a result of the comparison, if iStart is equal to or greater than iNum for the search target word (NO in S115), the control unit 10 is informed that the word search has ended.

なお、単語検索の具体的な説明は実施例を用いて後述する。  A specific description of word search will be described later using an embodiment.

そして、制御部10は、辞書検索部310から単語検索が終了したことの通知を受けると、一時記憶部3に記憶されている単語検索結果を所定の順に並べ換え(S116)、表示位置の情報を付加して一時記憶部3に記憶する。加えて、表示制御部22は、表示部12にて表示部12に単語検索結果の表示を行う(S117)。なお、上記所定の順に並べ替える際、補助情報の出現頻度の順に並べ替えてもよいし、上述の各実施形態で説明したとおり、候補順序決定要素(および評価値算出ルール)に基づいて、候補順序決定部32が評価値を算出し、それに基づいて並べ替えてもよい。  Then, upon receiving notification from the dictionary search unit 310 that the word search has been completed, the control unit 10 rearranges the word search results stored in the temporary storage unit 3 in a predetermined order (S116), and displays the display position information. In addition, it is stored in the temporary storage unit 3. In addition, the display control unit 22 causes the display unit 12 to display the word search result on the display unit 12 (S117). In addition, when rearranging in the predetermined order, it may be rearranged in the order of appearance frequency of auxiliary information, and as described in each of the above embodiments, candidates are determined based on the candidate order determining element (and the evaluation value calculation rule). The order determination unit 32 may calculate evaluation values and rearrange them based on the evaluation values.

さらに、ユーザが表示部12に表示された単語検索結果から所望の単語を目視して、所望の単語を選択し、その単語が表示されている位置を指示入力する。指示入力があると、入力部11は入力された位置の位置情報を制御部10の入力受付部21に送信する。なお、このとき、候補選択受付部23が、ユーザにより選択された漢字を検出し、学習制御手段が、それを学習漢字として、学習辞書記録部43またはペア学習辞書記録部44に記憶してもよい。  Further, the user visually looks at a desired word from the word search result displayed on the display unit 12, selects the desired word, and inputs the position where the word is displayed. When there is an instruction input, the input unit 11 transmits the position information of the input position to the input receiving unit 21 of the control unit 10. At this time, the candidate selection receiving unit 23 detects the kanji selected by the user, and the learning control means stores it in the learning dictionary recording unit 43 or the pair learning dictionary recording unit 44 as the learning kanji. Good.

制御部10は、入力受付部21で受け付けた位置情報と、一時記憶部3に記憶している単語検索結果の表示位置の情報と比較し、ユーザにより指定された単語を検索する。そして表示制御部22は表示部12にて検索された単語を表示する。  The control unit 10 compares the position information received by the input receiving unit 21 with the information on the display position of the word search result stored in the temporary storage unit 3 and searches for the word specified by the user. Then, the display control unit 22 displays the word searched by the display unit 12.

つまり、本発明に係る文字変換装置では、漢字辞書部41及び単語辞書部42に、インデックスと漢字対応情報144及び単語対応情報162を持たせ、同一先頭漢字の単語をグループ化し、漢字対応情報及び単語対応情報に補助情報を持たせ、補助情報を基に検索対象の漢字及び単語を制限することで、検索時間の短縮を行えるようにしている。さらに、検索された候補となる漢字(単語)の表示順序は、その候補の補助情報(候補順序決定要素)に基づいて、候補順序決定部32によって、ユーザによって選択される可能性が高いものほど優先して表示されるように決定される。したがって、ユーザが所望する順序に並べ替えられた候補の漢字(単語)を、より短い時間で表示することができる。結果として、ユーザの利便性を向上させることが可能となる。  That is, in the character conversion device according to the present invention, the kanji dictionary unit 41 and the word dictionary unit 42 have the index, the kanji correspondence information 144, and the word correspondence information 162, group words of the same first kanji, By adding auxiliary information to the word correspondence information and limiting kanji and words to be searched based on the auxiliary information, the search time can be shortened. Furthermore, the display order of the kanji (words) that are searched candidates is higher the possibility that the candidate order determining unit 32 will select the kanji (words) by the user based on the candidate auxiliary information (candidate order determining element). It is determined to be displayed with priority. Therefore, candidate Chinese characters (words) rearranged in the order desired by the user can be displayed in a shorter time. As a result, user convenience can be improved.

なお、以下の実施例5−1、5−2では、上記説明した文字変換装置1を、ピンイン(表音文字)を入力して漢字(変換文字)に変換する中国語変換装置として説明する。この場合、以下で詳細に説明するが、漢字インデックス145、漢字対応情報144、単語インデックス161、単語対応情報162は、次のようになっているものとする。  In Examples 5-1 and 5-2 below, the character conversion device 1 described above will be described as a Chinese conversion device that inputs Pinyin (phonetic characters) and converts them into kanji (converted characters). In this case, as described in detail below, it is assumed that the kanji index 145, the kanji correspondence information 144, the word index 161, and the word correspondence information 162 are as follows.

漢字インデックス145は、図3に示すようになっており、ピンインの先頭文字(先頭の表音文字)と、このピンインの先頭文字を漢字のピンイン(表音情報)の先頭として持つ漢字の、漢字対応情報144での漢字アドレス(格納先情報)とが対応付けられている。図3で、漢字インデックス145の左の記載(cidx_m1、cidx_m2等)は、漢字インデックス145内でのアドレスである。具体的には、cidx_m1とは、「読みの先頭がmであり、1声」の漢字インデックス145内でのアドレスである。  The Chinese character index 145 is as shown in FIG. 3, and the Chinese character of the Chinese character having the first character of Pinyin (first phonetic character) and the first character of Pinyin as the first character of Pinyin (phonetic information) of the Chinese character. The correspondence information 144 is associated with the kanji address (storage destination information). In FIG. 3, the description (cidx_m1, cidx_m2, etc.) on the left of the kanji index 145 is an address in the kanji index 145. Specifically, cidx_m1 is an address in the kanji index 145 of “the reading starts with m and one voice”.

また、漢字対応情報144は、図4に示すように、漢字とそのピンインと、補助情報(図4では、検索条件および頻度情報)とが対応付けられている。図4の漢字対応情報144の左の記載(cp_m1、cp_m2等)は、漢字対応情報144内でのアドレスである。  In the kanji correspondence information 144, as shown in FIG. 4, a kanji, its pinyin, and auxiliary information (in FIG. 4, search conditions and frequency information) are associated with each other. The description (cp_m1, cp_m2, etc.) on the left side of the kanji correspondence information 144 in FIG. 4 is an address in the kanji correspondence information 144.

また、単語インデックス161は、図5に示す1次インデックス(単語1次インデックステーブル)161aおよび図6に示す2次インデックス(単語2次インデックステーブル)161bを有している。図5に示すように、1次インデックス161aは、漢字とそのコードと、その漢字を先頭として持つ単語の2次インデックス161bでのアドレスが対応付けられている。2次インデックス161bは、漢字と第2文字目の漢字の先頭ピンインと、その単語対応情報162でのアドレスが対応付けられている。図6の2次インデックス161bの左の記載(widx_di、widx_gi等)は、2次インデックス161b内でのアドレスである。  Further, the word index 161 has a primary index (word primary index table) 161a shown in FIG. 5 and a secondary index (word secondary index table) 161b shown in FIG. As shown in FIG. 5, in the primary index 161a, the kanji, the code thereof, and the address in the secondary index 161b of the word having the kanji as the head are associated with each other. In the secondary index 161b, the leading Pinyin of the Chinese character and the second Chinese character is associated with the address in the word correspondence information 162. The description (widx_di, widx_gi, etc.) on the left side of the secondary index 161b in FIG. 6 is an address in the secondary index 161b.

さらに、単語対応情報162は、図7に示すように、単語とその読みのピンインが対応付けられている。図7の単語対応情報162の左の記載(wp_di、wp_gi等)は、単語対応情報162内でのアドレスである。なお、漢字対応情報144にて、漢字コードとピンインとが対応している場合には、1次インデックス161aは必ずしも必要ではない。  Furthermore, as shown in FIG. 7, the word correspondence information 162 associates words with their pinyin. The description (wp_di, wp_gi, etc.) on the left of the word correspondence information 162 in FIG. 7 is an address in the word correspondence information 162. In the kanji correspondence information 144, when the kanji code corresponds to Pinyin, the primary index 161a is not necessarily required.

(実施例5−1)
本実施例では、上記説明した文字変換装置1を、ピンインを入力して漢字に変換する中国語変換装置として説明するが、これに限定されず、例えばひらがな(あるいはカタカナ)を入力して漢字を含む単語を決定する装置であってもよい。
(Example 5-1)
In the present embodiment, the above-described character conversion device 1 is described as a Chinese conversion device that inputs Pinyin and converts it into Kanji. However, the present invention is not limited to this. For example, Hiragana (or Katakana) is input to input Kanji. An apparatus for determining a word to be included may be used.

具体的に、ユーザが「外字1」を入力するために、「外字2」の中国読みであるピンインの「mei」を入力した場合について説明する。  Specifically, a case where the user inputs “Mei” of Pinyin, which is a Chinese reading of “External character 2”, in order to input “External character 1” will be described.

初めに、漢字検索の処理について説明する。なお、入力読みと漢字情報の読みとが一致する条件は、入力読みが漢字情報の読みに前方一致であることとする。  First, the kanji search process will be described. Note that the condition that the input reading matches the reading of the kanji information is that the input reading matches the reading of the kanji information forward.

(漢字検索)
辞書検索部310の漢字取得部311は、一時記憶部3から読み文字列「mei」を辞書検索部310の内部バッファに読み込む。そして、辞書検索部310は読み文字の先頭文字「m」を基に以下の式で漢字インデックス145の「m」の範囲のアドレスを求め、それらのアドレスに記述している漢字アドレスを内部バッファに記憶する。
(Kanji search)
The kanji acquisition unit 311 of the dictionary search unit 310 reads the read character string “mei” from the temporary storage unit 3 into the internal buffer of the dictionary search unit 310. Then, the dictionary search unit 310 obtains addresses in the range of “m” of the kanji index 145 based on the first character “m” of the reading character, and stores the kanji address described in those addresses in the internal buffer. Remember.

アドレスは、
(1)入力読みに四声コードがある場合
先頭アドレス=(入力読みの文字コード−ベースの読みの文字コード)
×漢字インデックスの単位サイズ×5
+(入力読みの四声コード−1)×漢字インデックスの単位サイズ
終了アドレス=(入力読みの文字コード−ベースの読みの文字コード)
×漢字インデックスの単位サイズ×5
+入力読みの四声コード×漢字インデックスの単位サイズ
(2)入力読みに四声コードが無い場合
先頭アドレス=(入力読みの文字コード−ベースの読みの文字コード)
×漢字インデックスの単位サイズ×5
終了アドレス=(入力読みの文字コード−ベースの読みの文字コード+1)
×漢字インデックスの単位サイズ×5
として決定される。
The address is
(1) When there is a four-voice code in the input reading Start address = (Character code of input reading-Character code of base reading)
× Kanji index unit size × 5
+ (Input reading four-voice code-1) x Kanji index unit size end address = (input reading character code-base reading character code)
× Kanji index unit size × 5
+ Input reading four-voice code x Kanji index unit size (2) When there is no four-voice code in the input reading Start address = (Character code of input reading-Character code of base reading)
× Kanji index unit size × 5
End address = (Character code of input reading-Character code of base reading + 1)
× Kanji index unit size × 5
As determined.

上記アドレスを決定する、「5」を掛けているのは、次の理由からである。中国語の発音は、ピンインや注音のように読みを表す部分と発声の上げ下げ(調子)を表す声調(四声)の組み合せである。声調が5種類(1〜4声と軽声)あるので、5としている。  The reason why the address is determined by “5” is as follows. Chinese pronunciation is a combination of a part that represents reading, such as Pinyin and phoning, and a tone (four voices) that represents the ups and downs (tone) of the utterance. Since there are five types of tone (1 to 4 voices and light voices), it is set to 5.

ピンインによる中国語入力では、ピンインはアルファベットで表現されるので、ベースの読みの文字コードは「a(=0x61(アスキーコード))」とし、注音による中国語入力では、ベースの読みの文字コードは「  In Chinese input by Pinyin, Pinyin is expressed in alphabet, so the character code of the base reading is “a” (= 0x61 (ASCII code)). "

Figure 0004890551
Figure 0004890551

(=0xa373)」とすればよい。(= 0xa373) ".

漢字インデックス(漢字インデックテーブル)41の単位サイズは、単語インデックス(単語インデックテーブル)51をピンインの先頭文字のアルファベット順とし、同じピンインの先頭文字は四声の1から5の順に並ぶように構成していれば、漢字アドレスのバイト長となる。例えば、本実施として動作している装置では4バイトとなっている。  The unit size of the kanji index (kanji index table) 41 is configured so that the word index (word index table) 51 is in alphabetical order of the first characters of Pinyin, and the first characters of the same Pinyin are arranged in the order of 1 to 5 of the four voices. If so, it is the byte length of the Kanji address. For example, a device operating as the present embodiment has 4 bytes.

ここでは、四声コードはないので、「m(=0x6d)」の範囲のアドレスは(2)式により、先頭アドレスが「(0x6d−0x61)×漢字インデックスの単位サイズ×5」(つまり、図3のcidx_m1)、終了アドレスが「(0x6d−0x61+1)×漢字インデックスの単位サイズ×5」(つまり、図3のcidx_n1)によって計算され、各アドレスが指し示す漢字インデックスに記述している漢字アドレス(cp_m1、及びcp_n1)を内部バッファに記憶する。図3のcidx_m1は、読みの先頭がmで1声のもの、の漢字インデックス145内でのアドレスを表している。それに対応するcp_m1は、読みの先頭がmで1声の読みの漢字対応情報144のアドレスを表している。cidx_m5、cp_m5は読みの先頭がmで軽声に対応している。  Here, since there is no four-voice code, the address in the range of “m (= 0x6d)” is represented by the formula (2), and the head address is “(0x6d-0x61) × unit size of kanji index × 5” (that is, FIG. 3), and the end address is calculated by “(0x6d-0x61 + 1) × unit size of kanji index × 5” (that is, cidx_n1 in FIG. 3), and the kanji address (cp_m1) described in the kanji index indicated by each address , And cp_n1) are stored in the internal buffer. CIDX_M1 in FIG. 3 represents an address in the Kanji index 145 of the first reading of m and one voice. The corresponding cp_m1 represents the address of the kanji correspondence information 144 for the reading of one voice with m as the beginning of reading. In cidx_m5 and cp_m5, the beginning of reading is m and corresponds to a light voice.

なお、(0x6d−0x61)=12であり、(0x6d−0x61+1)=13となる。  Note that (0x6d-0x61) = 12, and (0x6d-0x61 + 1) = 13.

辞書検索部310は、検索対象のアドレスcpiをcp_m1とする。次に辞書検索部310は、漢字対応情報144からアドレスcpiの漢字情報を読み込み、入力ピンイン数を基に検索条件を判定する。その結果、検索条件を満足していれば、入力読みと漢字情報の読みとの比較を行い、入力読みが漢字情報の読みに前方一致であれば一致したものとして一時記憶部3に該漢字情報を記憶し、cpiのみ更新する。  The dictionary search unit 310 sets the search target address cpi to cp_m1. Next, the dictionary search unit 310 reads the kanji information at the address cpi from the kanji correspondence information 144 and determines the search condition based on the number of input pinyins. As a result, if the search condition is satisfied, the input reading is compared with the reading of the kanji information. If the input reading matches the reading of the kanji information, the kanji information is stored in the temporary storage unit 3 as a match. And only cpi is updated.

図4に示す漢字対応情報144の例では、検索条件を以下のようにしている。
検索条件は、
0:無条件に検索対象とする
1:入力ピンイン数が1文字であれば、検索対象としない
2:入力ピンイン数が2文字以下であれば、検索対象としない
3:入力ピンイン数が3文字以下であれば、検索対象としない
とする。
In the example of the kanji correspondence information 144 shown in FIG. 4, the search conditions are as follows.
The search condition is
0: Unconditionally search target 1: If the number of input pinyins is 1 character, it is not searched 2: If the number of input pinyins is 2 characters or less, it is not searched 3: The number of input pinyins is 3 characters In the following cases, it is not considered as a search target.

入力ピンインが「mei」の場合、入力ピンイン数が3であるため、検索条件が0、1、2に対応している漢字が、検索処理の対象となる。  When the input pinyin is “mei”, since the number of input pinyins is 3, the Chinese characters corresponding to the search conditions 0, 1, and 2 are targeted for the search process.

上記処理は、cpiがcp_n1に等しくなるまで処理を継続し、cpiがcp_n1と等しくなれば、一時記憶部3に記憶している漢字情報を補助情報のひとつである出現頻度で並べ換えを行い、漢字検索処理を終了する。  The above process continues until cpi is equal to cp_n1, and if cpi is equal to cp_n1, the kanji information stored in temporary storage unit 3 is rearranged at the appearance frequency as one of the auxiliary information, and kanji The search process ends.

なお、上記説明では、四声コードの入力が行われない場合で説明したが、四声コード付きで「mei3」が入力された場合は、「m」の第3声のアドレスが上記(1)式により計算され、先頭アドレスが「(0x6d−0x61)×漢字インデックスの単位サイズ×5+(3−1)×漢字インデックスの単位サイズ」(つまり、図3のcidx_m3)、終了アドレスが「(0x6d−0x61)×漢字インデックスの単位サイズ×5+3×漢字インデックの単位サイズ」(つまり、図3のcidx_m4)となり、各アドレスが指し示す漢字インデックスに記述している漢字アドレス(cp_m3、及びcp_m4)を内部バッファに記憶する。  In the above description, the case where a four-voice code is not input has been described. However, when “mei3” is input with a four-voice code, the address of the third voice of “m” is the above (1). The start address is “(0x6d-0x61) × unit size of kanji index × 5 + (3-1) × unit size of kanji index” (that is, cidx_m3 in FIG. 3), and the end address is “(0x6d− 0x61) × unit size of kanji index × 5 + 3 × unit size of kanji index ”(that is, cidx_m4 in FIG. 3), and kanji addresses (cp_m3 and cp_m4) described in the kanji index indicated by each address are stored in the internal buffer. Remember.

なお、漢字アドレスを求めた後の処理は上記検索処理と同様であるため説明を省略する。  Note that the processing after obtaining the kanji address is the same as the search processing described above, and therefore the description thereof is omitted.

(単語検索)
以下に単語検索の説明を行う。具体的に、ユーザが「外字1」の中国読みであるピンインの「mei」を入力し、漢字検索結果が一時記憶部3に保持され、表示制御部22表示装置に表示した後に漢字検索結果から「外字2」を指示入力したもとのして説明を行う。
(Word search)
The word search is explained below. Specifically, the user inputs Pinyin's “mei”, which is a Chinese reading of “External character 1”, and the Chinese character search result is held in the temporary storage unit 3 and displayed on the display control unit 22 display device. The description will be made under the condition that “external character 2” is input.

単語辞書部42の1次インデックス161aは、図5に示すように、漢字コードの昇順に記憶されているものとする。  As shown in FIG. 5, the primary index 161a of the word dictionary unit 42 is stored in ascending order of kanji codes.

制御部10は、ユーザの指示位置(X1、Y1)と一時記憶部3に記憶している漢字検索結果の表示位置(xi_min、yi_min、xi_max、yi_max)(i=1〜n、nは候補数)を比較し、xi_min≦X1≦xi_maxかつyi_min≦Y1≦yi_maxが成立するときに,i番目の候補が選択されたものと判断し、対応する漢字を辞書検索部310に転送し、単語検索を行うことを指示する。  The control unit 10 displays the user's designated position (X1, Y1) and the display position (xi_min, yi_min, xi_max, yi_max) of the kanji search result stored in the temporary storage unit 3 (i = 1 to n, n is the number of candidates) ) And xi_min ≦ X1 ≦ xi_max and yi_min ≦ Y1 ≦ yi_max, it is determined that the i-th candidate is selected, the corresponding kanji is transferred to the dictionary search unit 310, and the word search is performed. Instruct to do.

辞書検索部310は、単語検索の指示を受けると、転送された漢字のコードに一致する単語インデックス161を検索し、単語対応情報162での検索対象の範囲を求める。具体的には、辞書検索部310は、転送された「外字2」について、1次インデックス161aを2分探索し、「外字2」と一致する漢字コードC3BFを取得する。そして、漢字コードC3BFに対応する2次インデックス161b内のアドレス「widx_mi」を用いて、2次インデックス161bを参照し、「外字2」が先頭の単語の単語対応情報162におけるアドレス(単語アドレス)「wp_mi」を、「外字2」が先頭の単語対応情報162での開始アドレスとして内部バッファに記憶する。さらに、辞書検索部310は、1次インデックス161aにおいてC3BFの次の漢字コードC3C0(図5中の  Upon receiving a word search instruction, the dictionary search unit 310 searches the word index 161 that matches the transferred kanji code, and obtains a search target range in the word correspondence information 162. Specifically, the dictionary search unit 310 searches the primary index 161a in half for the transferred “external character 2”, and acquires a Chinese character code C3BF that matches “external character 2”. Then, using the address “widx_mi” in the secondary index 161b corresponding to the Chinese character code C3BF, the secondary index 161b is referred to, and “external character 2” is the address (word address) “in the word correspondence information 162 of the first word. “wp_mi” is stored in the internal buffer as the start address of the word correspondence information 162 having “gaiji2” as the head. Further, the dictionary search unit 310 uses the K3 code C3C0 (in FIG. 5) next to C3BF in the primary index 161a.

Figure 0004890551
Figure 0004890551

(以下では「外字6」とする))の2次インデックスのアドレス「widx_mi+l」を用いて、2次インデックス161bを参照し、「外字6」が先頭の単語の単語対応情報162におけるアドレス(単語アドレス)「wp_mi+l」を、「外字2」が先頭の単語対応情報162での終了アドレスとして内部バッファに記憶する。The secondary index 161b is referred to using the secondary index address “widx_mi + 1” (hereinafter referred to as “external character 6”), and “external character 6” is the address (word address) in the word correspondence information 162 of the first word. ) “Wp_mi + 1” is stored in the internal buffer as the end address in the word correspondence information 162 with “External character 2” first.

その後、辞書検索部310の単語取得部312は、「wp_mi」から「wp_mi+l」までの単語情報を読み出し、単語情報の漢字列を検索結果として、一時記憶部3に記憶する。そして、候補順序決定部32が、一時記憶部3の単語情報(候補単語)の補助情報(図示せず)である出現頻度の高い順に並べ替えを行い、単語検索処理を終了する。なお、この並べ替えは単なる例示であり、他の方法で並べ替えてもよい。例えば、候補順序決定要素(要素A〜要素G)に基づいて、表示順序を決定してもよい。最後に、上記したように、検索され並べ替えられた単語を、表示部12に表示する。  Thereafter, the word acquisition unit 312 of the dictionary search unit 310 reads word information from “wp_mi” to “wp_mi + 1”, and stores the kanji string of the word information in the temporary storage unit 3 as a search result. And the candidate order determination part 32 rearranges in order with the appearance frequency which is auxiliary information (not shown) of the word information (candidate word) of the temporary storage part 3, and complete | finishes a word search process. Note that this rearrangement is merely an example, and the rearrangement may be performed by other methods. For example, the display order may be determined based on the candidate order determination elements (element A to element G). Finally, as described above, the searched and rearranged words are displayed on the display unit 12.

(実施例5−2)
本実施例5−2では、ユーザが単語を入力するために、単語の読みを入力した場合の動作を説明する。ここで、実施例5−1では、入力したい文字列の先頭文字の読みを入力するのに対して、本実施例5−2では、入力したい単語の読みを入力するとの違いがある。しかし、入力部11から入力された読み文字列を制御部10の入力受付部21が受け付ける処理は実施例5−1と同様となる。そのため、本実施例ではユーザが「外字1」を入力するために「外字1」の中国読みであるピンインの「meinian」を入力した後の処理を説明する。
(Example 5-2)
In Example 5-2, an operation when the user inputs a word reading to input a word will be described. Here, in Example 5-1, a reading of the first character of a character string to be input is input, whereas in Example 5-2, a reading of a word to be input is input. However, the process in which the input receiving unit 21 of the control unit 10 receives the reading character string input from the input unit 11 is the same as that of the embodiment 5-1. Therefore, in this embodiment, a process after the user inputs “Meinian” of Pinyin, which is a Chinese reading of “External character 1”, in order to input “External character 1” will be described.

なお、制御部10は、入力読みの文字列のピンインを分割する機能を備えているものとする。入力読み文字列のピンインの分割処理は後述する。  It is assumed that the control unit 10 has a function of dividing the pinyin of the input reading character string. The pinyin division process of the input reading character string will be described later.

制御部10は、入力部11から読み文字列を「meinian」を受けると、読み文字列をピンインに分割し、分割結果として、「mei」と「nian」とでピンインに分割されたものが2つあることを示す分割数(あるいは、分割位置が2つあることを示す分割位置数)2を一時記憶部3に記憶する。  When the control unit 10 receives the “mainian” reading character string from the input unit 11, the control unit 10 divides the reading character string into pinyin. As a result of the division, two divided into “pinyin” by “mei” and “nian” are obtained. The number of divisions indicating that there are two (or the number of division positions indicating that there are two division positions) 2 is stored in the temporary storage unit 3.

辞書検索部310の漢字取得部311は、一時記憶部3から読み文字列「mei」を読み込み、辞書検索部310の内部バッファに記憶する。漢字取得部311は、「mei」の先頭文字「m」を基に前記(2)式を用いて、漢字インデックス145を参照して、「m」の範囲のアドレスを求め、それらのアドレスに記述している漢字アドレスを内部バッファに記憶する。  The kanji acquisition unit 311 of the dictionary search unit 310 reads the read character string “mei” from the temporary storage unit 3 and stores it in the internal buffer of the dictionary search unit 310. The kanji acquisition unit 311 obtains addresses in the range of “m” by referring to the kanji index 145 using the above equation (2) based on the first character “m” of “mei”, and describes these addresses. Stores the kanji address being stored in the internal buffer.

ここでも四声コードがないので、先頭アドレスが「(0x6d−0x61)×漢字インデックスの単位サイズ×5」(つまり、図3のcidx_m1)、終了アドレスが「(0x6d−0x61+1)×漢字インデックスの単位サイズ×5」(つまり、図3のcidx_n1)によって計算され、漢字辞書部41の漢字インデックス145を参照し、各アドレスが指し示す漢字アドレス(cp_m1、及びcp_n1)を内部バッファに記憶する。  Here, since there is no four-voice code, the start address is “(0x6d-0x61) × unit size of kanji index × 5” (that is, cidx_m1 in FIG. 3), and the end address is “(0x6d-0x61 + 1) × unit of kanji index. The kanji address (cp_m1 and cp_n1) indicated by each address is stored in the internal buffer by referring to the kanji index 145 of the kanji dictionary unit 41, calculated by “size × 5” (that is, cidx_n1 in FIG. 3).

辞書検索部310の漢字取得部311は、検索対象のアドレスcpiをcp_m1とする。次に漢字取得部311は、アドレスcpiの漢字情報を読み込み、漢字対応情報144を参照し、入力ピンイン数を元に検索条件を判定する。その結果、検索条件を満足していれば、入力読みと漢字情報の読みとを比較する。  The kanji acquisition unit 311 of the dictionary search unit 310 sets the search target address cpi to cp_m1. Next, the Chinese character acquisition unit 311 reads the Chinese character information at the address cpi, refers to the Chinese character correspondence information 144, and determines the search condition based on the number of input pinyins. As a result, if the search condition is satisfied, the input reading is compared with the reading of kanji information.

入力読みが漢字情報の読みと完全一致であれば、一時記憶部3に該漢字情報と完全一致であること(例えば、1)を対応付けて記憶して、cpiを更新する。  If the input reading is completely coincident with the reading of the kanji information, the temporary storage unit 3 stores the fact that it is completely coincident with the kanji information (for example, 1), and updates cpi.

入力読みが漢字情報の読みに前方一致であれば一致したものとして一時記憶部3に該漢字情報と前方一致であること(例えば、0)を対応付けて記憶して、cpiを更新する。  If the input reading matches the reading of the kanji information, the temporary storage unit 3 stores that the kanji information and the front matching (for example, 0) in association with each other, and updates cpi.

完全一致あるいは前方一致でなければ、cpiのみ更新する。  If it is not an exact match or a forward match, only cpi is updated.

そして、cpiがcp_n1と等しくなれば、候補順序決定部32が、一時記憶部3に記憶している漢字情報のうち、完全一致の漢字情報を出現頻度で並べ換えを行い、さらに、前方一致の漢字情報を完全一致の漢字情報より候補順位が下位となるように出現頻度で並べ替えを行い、漢字検索処理を終了する。候補順序決定部32は、さらに、他の補助情報(例えば、候補順序決定要素(要素A〜要素G))に基づいて、表示順序を決定してもよい。  If cpi is equal to cp_n1, the candidate order determination unit 32 rearranges the completely matched kanji information among the kanji information stored in the temporary storage unit 3 according to the appearance frequency, and further, the kanji that matches the front. The information is rearranged at the appearance frequency so that the candidate rank is lower than the completely matched kanji information, and the kanji search process is terminated. The candidate order determination unit 32 may further determine the display order based on other auxiliary information (for example, candidate order determination elements (element A to element G)).

上記処理にて、読み文字列「mei」に対して、「mei」に完全一致の漢字情報として「外字2」の漢字情報が検索結果として一時記憶部3に記憶されている。  In the above processing, for the reading character string “mei”, the kanji information of “external character 2” is stored in the temporary storage unit 3 as the search result as kanji information completely matching “mei”.

次に単語検索処理の説明を行う。  Next, the word search process will be described.

上記の漢字検索後に表示された漢字検索候補からユーザが「外字2」を指示したものとして説明する。なお、ユーザが「外字2」の指示に対する候補選択の処理は、実施例5−1に記載の処理と同様であるため説明を省略する。  A description will be made assuming that the user has designated “external character 2” from the kanji search candidates displayed after the kanji search. Note that the candidate selection process for the instruction “external character 2” by the user is the same as the process described in Example 5-1, and thus the description thereof is omitted.

また、1次インデックス161a、2次インデックス161b、及び単語対応情報162は、漢字コードの昇順に並んでいるものとする。  In addition, the primary index 161a, the secondary index 161b, and the word correspondence information 162 are arranged in ascending order of kanji codes.

辞書検索部310の単語取得部312は、単語検索の指示を受けると、単語インデックス161の1次インデックスを参照して、転送された漢字のコードに一致する第1のインデックス情報を取得する。例えば、1次インデックスでは、単語の先頭漢字の漢字コード順に並んでおり、単語取得部312は、2分探索により転送された漢字のコードと一致する第1のインデックス情報を検索して、転送された漢字コードに一致する第1のインデックス情報と、1次インデックス内で並べられている次の漢字コードの第1のインデックス情報と、を内部バッファに記憶する。  When receiving a word search instruction, the word acquisition unit 312 of the dictionary search unit 310 refers to the primary index of the word index 161 and acquires first index information that matches the transferred kanji code. For example, in the primary index, the words are arranged in the order of the kanji code of the first kanji of the word, and the word acquisition unit 312 searches for the first index information that matches the kanji code transferred by the binary search and is transferred. The first index information that matches the kanji code and the first index information of the next kanji code arranged in the primary index are stored in the internal buffer.

ここでは、ユーザは「外字2」を指示しているので、1次インデックス161aにおいて、漢字コードに一致する2次インデックスアドレスはwidx_mi、次の漢字コードの2次インデックスアドレスはwidx_mi+lであり、これらが内部バッファに記憶される。  Here, since the user designates “external character 2”, in the primary index 161a, the secondary index address matching the kanji code is widx_mi, and the secondary index address of the next kanji code is widx_mi + 1. Stored in internal buffer.

辞書検索部310の単語取得部312は、一時記憶部3から分割した読み文字列の2番目以降の文字列を内部バッファに読み込む。辞書検索部310は、1番目の分割した読みで検索された漢字(先頭漢字、1文字目漢字)と、2番目の分割された読みの先頭ピンイン文字とで単語対応情報162の検索範囲を絞るために、1次インデックス161aに付加されている2次インデックス161bのアドレスを基に、2番目の分割された読みの先頭文字「n」と一致するものを、2次インデックス161bにて検索し、内部バッファに検索された2次インデックス161bと、2次インデックス161b内で並べられている次の第2のインデックス情報を記憶する。ここでは、1文字目の漢字「外字2」と2番目の分割読みの先頭文字「n」とに一致する2次インデックス情報wp_mi、および、2次インデックス内で並べられている次の2次インデックス情報wp_mi+k、が内部バッファに記憶される。  The word acquisition unit 312 of the dictionary search unit 310 reads the second and subsequent character strings of the read character string divided from the temporary storage unit 3 into the internal buffer. The dictionary search unit 310 narrows the search range of the word correspondence information 162 by using the kanji (first kanji, first kanji) searched by the first divided reading and the first pinyin character of the second divided reading. Therefore, based on the address of the secondary index 161b added to the primary index 161a, the secondary index 161b is searched for a match with the first character “n” of the second divided reading, The secondary index 161b searched for in the internal buffer and the next second index information arranged in the secondary index 161b are stored. Here, secondary index information wp_mi that matches the first Kanji character “gaiji 2” and the first character “n” of the second divided reading, and the next secondary index arranged in the secondary index Information wp_mi + k is stored in the internal buffer.

辞書検索部310の単語取得部312は、検索対象のアドレスwpiを第2インデックス情報に付加されている単語情報のアドレスwp_miとする。「wp_mi」から「wp_mi+k」までの単語情報を読み出しここで、単語対応情報162での単語情報の読みは、単語の各漢字とを対応付けるため、例えば、「外字1」の読みを「MeiNian」のように単語の各漢字に対応する読みの先頭部分を大文字表記されているものとする。  The word acquisition unit 312 of the dictionary search unit 310 sets the search target address wpi as the address wp_mi of the word information added to the second index information. The word information from “wp_mi” to “wp_mi + k” is read out. Here, the reading of the word information in the word correspondence information 162 is associated with each kanji of the word, for example, the reading of “External character 1” is changed to “MeiNian”. Thus, it is assumed that the first part of the reading corresponding to each kanji of the word is capitalized.

次に辞書検索部310の単語取得部312は、アドレスwpiの単語情報を読み込み、単語対応情報162を参照して、単語対応情報162の漢字の個数と入力読みの分割数を比較する。単語情報の漢字の個数が入力読みの分割数以下であれば、単語情報の各漢字に対応する読みと分割読みを先頭から比較し、読みが完全一致の漢字数と読みが前方一致の漢字数をカウントする。  Next, the word acquisition unit 312 of the dictionary search unit 310 reads the word information at the address wpi, refers to the word correspondence information 162, and compares the number of Chinese characters in the word correspondence information 162 with the number of input reading divisions. If the number of kanji in the word information is less than or equal to the number of divisions in the input reading, the reading corresponding to each kanji in the word information and the divided readings are compared from the top, and the number of kanji with the exact match and the number of kanji with the reading forward match Count.

「単語情報の漢字の個数」と「読みが完全一致の漢字数+読みが前方一致の漢字数」が一致すれば、一時記憶部3に単語情報と読みが完全一致の漢字数と読みが前方一致の漢字数を記憶し、wpiを更新する。「単語情報の漢字の個数」と「読みが完全一致の漢字数+読みが前方一致の漢字数」が一致しなければ、wpiを更新する。  If the “number of kanji characters in word information” and “number of kanji characters whose readings are completely matched + the number of kanji characters whose readings are forward matching” match, the number of kanji characters whose readings are completely matched with the word information in the temporary storage unit 3 and the readings are forwarded. Store the number of matching kanji and update wpi. If “the number of kanji characters in word information” and “the number of kanji characters whose reading is completely matched + the number of kanji characters whose reading matches the front” do not match, wpi is updated.

そして、wpi<wp_mi+kであれば処理を継続し、wpi=wp_mi+kとなれば、処理を終了する。  If wpi <wp_mi + k, the process is continued. If wpi = wp_mi + k, the process ends.

辞書検索部310は、一時記憶部3に記憶している単語情報において、以下の条件で順位付けを行う。
(i)読みの分割数と「読みが完全一致の漢字数+読みが前方一致の漢字数」とが等しい単語情報
・「読みが完全一致の漢字数」が多いほど上位候補とする
・「読みが完全一致の漢字数」が同じものは、出現頻度で順位付ける
(ii)読みの分割数と「読みが完全一致の漢字数+読みが前方一致の漢字数」とが等しくない単語情報
・「読みが完全一致の漢字数」が多いほど上位候補とする
・「読みが完全一致の漢字数」が同じものは、出現頻度で順位付ける
最終的にユーザが表示された検索結果から所望の文字列を選択することで、入力が行われるが、上記(i)の条件に対応する検索結果を選択すると、新たに読み文字列の入力を行うことになるが、(ii)の条件に対応する検索結果を選択した場合は、入力した読み文字列の一部に対応するため、選択した文字列に対応する読み文字列を除く読み文字列を制御部10の入力読みとして上記処理を繰り返すことができる。
The dictionary search unit 310 ranks the word information stored in the temporary storage unit 3 under the following conditions.
(I) Word information in which the number of reading divisions is equal to “the number of Kanji characters whose readings are completely matched + the number of Kanji characters whose readings are the same as the preceding characters” (Ii) Word information where the number of reading divisions is not equal to the number of Kanji characters whose readings are exact matches + the number of Kanji characters whose readings are front-matched. The higher the number of “Kanji with perfect matching”, the higher the candidate. ・ If the “Number of Kanji with perfect reading” is the same, rank them by frequency of appearance. However, if a search result corresponding to the above condition (i) is selected, a new reading character string is input, but a search corresponding to the condition (ii) is performed. If you select a result, it will be part of the entered reading string. To respond, it is possible to repeat the above processing read character string except the read character string corresponding to the selected character string as input to read in the control unit 10.

上記説明では、単語検索で単語情報の漢字の個数と「読みが完全一致の漢字数+読みが前方一致の漢字数」が一致したときのみ単語検索結果としている。しかし、単語情報の漢字の個数が「読みが完全一致の漢字数+読みが前方一致の漢字数」より多い場合も単語検索結果としてもよい。このような構成にすることで、所望の単語の先頭から数文字分の読みだけで入力することが可能となる。  In the above description, the word search result is obtained only when the number of kanji in the word information matches “the number of kanji whose reading is completely matched + the number of kanji whose reading matches the front” in the word search. However, the word search result may also be used when the number of kanji in the word information is larger than “the number of kanji whose readings are completely matched + the number of kanji whose readings are forward matching”. With such a configuration, it is possible to input by reading only a few characters from the beginning of a desired word.

また、上記説明では、表示された漢字検索結果から所望の漢字をユーザが選択することで単語検索を開始している。しかし、漢字検索が終了した後で、漢字検索結果を表示せずに候補順位1位の漢字について単語検索を開始し、単語検索が完了したときに検索結果を表示してもよい。あるいは、漢字検索が終了した後で、漢字検索結果を表示せずに候補の一部もしくは全部について単語検索を開始し、単語検索が完了したときに検索結果を表示してもよい。  In the above description, the word search is started by the user selecting a desired kanji from the displayed kanji search result. However, after completing the kanji search, the word search may be started for the kanji ranked first in the candidate ranking without displaying the kanji search result, and the search result may be displayed when the word search is completed. Alternatively, after completing the kanji search, the word search may be started for some or all of the candidates without displaying the kanji search result, and the search result may be displayed when the word search is completed.

次に、入力読みのピンイン(n文字)の分割処理について説明する。ここで分割の単位を音節と呼ぶ。  Next, an input reading pinyin (n character) dividing process will be described. Here, the unit of division is called a syllable.

分割処理は、以下のように行う。
(a)分割位置iを1にする
(b)先頭文字からi文字目を第1音節とし、i+1文字目から韻母、声母、声母+韻母として成立する最長のピンインを求め、第2音節とする
(c)i文字目の分割位置の評価値(以下、位置評価値と称する)として、第1音節長+第2音節長を保持する
(d)分割位置iに1を加算し(i=i+1)、i>nであれば(e)、そうでなければ(b)へ処理を移す
(e)最大位置評価値を有するものとして処理された分割位置の個数により、最終的な分割位置を確定する
(e−1)最大位置評価値を有するものとして処理された分割位置の個数が1の場合
最大位置評価値を有するものとして処理された分割位置を最終的な分割位置とする
(e−2)最大位置評価値を有するものとして処理された分割位置が複数個ある場合
(1)1音節だけで構成されている
(2)第1音節、第2音節とも2文字以上
(3)第1音節の文字数が第2音節よりも多い
の順に、上位の条件を有する分割位置を最終的な分割位置とする
具体例として、「meinian」の分割処理について説明する。入力ピンインの一部或いは全部がピンインとして成立するか否かは、ピンイン辞書に登録されているピンインと比較し、一致するピンインがあればピンインとして成立する可能性があるとする。ピンイン辞書は、図9に示すように、ピンインとして成立する可能性のある長さ1から7のピンインが登録されている。
The division process is performed as follows.
(A) The division position i is set to 1. (b) The i-th character from the first character is set as the first syllable, and the longest pinyin that is established as the final, final, and initial + final from the i + 1th character is obtained, and the second syllable is obtained. (C) The first syllable length + the second syllable length is held as the evaluation value (hereinafter referred to as the position evaluation value) of the i-th character division position. (D) 1 is added to the division position i (i = i + 1). ), If i> n (e), otherwise move to (b) (e) determine the final division position based on the number of division positions processed as having the maximum position evaluation value (E-1) When the number of division positions processed as having the maximum position evaluation value is 1 The division position processed as having the maximum position evaluation value is set as the final division position (e-2 ) Multiple split positions processed as having the maximum position evaluation value (1) It consists of only one syllable (2) Two or more characters in both the first and second syllables (3) The first syllable has more characters than the second syllable As a specific example, the division process of “mainian” is described as the final division position. Whether or not part or all of the input pinyin is established as a pinyin is compared with the pinyin registered in the pinyin dictionary, and if there is a matching pinyin, there is a possibility that it is established as a pinyin. In the pinyin dictionary, as shown in FIG. 9, pinyins having a length of 1 to 7 that may be established as pinyin are registered.

ここで、入力ピンインとは、ピンインとして入力された文字列であり、
(1)ピンインとして登録されている文字あるいは文字列そのもの
(2)ピンインとして登録されている文字あるいは文字列が組み合わされた文字列
(3)(1)(2)以外の文字列(間違い入力の場合)
の3種類がある。
Here, the input pinyin is a character string input as pinyin,
(1) Character or character string registered as Pinyin itself (2) Character string or character string registered as Pinyin (3) Character string other than (1) (2) If)
There are three types.

なお、本実施形態5において、分割処理時に算出される位置評価値は、入力ピンインを2音節に区切るための区切り位置を決定する場合に、その位置で音節が区切られる尤もらしさを数値化したものである。この位置評価値は、音節区切り位置ごとに算出される。したがって、上述の実施形態1〜4で用いられた、候補漢字/候補単語ごとに算出される評価値(候補漢字/候補単語がユーザに選択される可能性の大きさを示す評価値)とは区別される。  In the fifth embodiment, the position evaluation value calculated at the time of the division process is obtained by quantifying the likelihood that the syllable is divided at that position when the separation position for dividing the input Pinyin into two syllables is determined. It is. This position evaluation value is calculated for each syllable break position. Therefore, the evaluation value (evaluation value indicating the possibility that the candidate kanji / candidate word is selected by the user) calculated for each candidate kanji / candidate word used in the first to fourth embodiments described above. Differentiated.

入力ピンイン「meinian」の分割位置iを1とする。先頭文字「m」を用いて、図8で示すピンイン辞書インデックス(ピンイン辞書インデックステーブル)を参照し、先頭文字が「m」で1文字のピンイン辞書アドレスpr_m1及び2文字のピンイン辞書アドレスpr_m2を読み込む。そして、ピンイン辞書のpr_m1からpr_m2までに記憶されているピンインと比較する。この場合、「m」は存在するので、ピンインとして成立する。  The division position i of the input pinyin “mainian” is set to 1. With reference to the Pinyin dictionary index (pinyin dictionary index table) shown in FIG. 8 using the first character “m”, the first character “m” and the one character Pinyin dictionary address pr_m1 and the two character Pinyin dictionary address pr_m2 are read. . And it compares with the pinyin memorize | stored from pr_m1 to pr_m2 of a pinyin dictionary. In this case, since “m” exists, it is established as pinyin.

次に、「m」を除く「einian」を第2音節とし、先頭文字が「e」で6文字のピンイン辞書アドレスpr_e6及び7文字のピンイン辞書アドレスpr_e7を読み込み、pr_e6からpr_e7までに記憶されているピンインと比較する。一致するピンインがあれば、1文字目の位置評価値が7となるが、一致するピンインが無い場合は、第2音節の最終文字から1文字減らして新しい第2音節とし、同様にピンイン辞書と比較し、一致するピンインがあれば、そのときの第2音節の長さ+第1音節の長さ(ここでは1)を分割位置1の位置評価値とする。一致するピンインが無い場合には、さらに、第2音節の最終文字から1文字減らして、ピンイン辞書と比較するという処理を行い、これを、位置評価値が出るまで繰り返す。  Next, “einian” excluding “m” is set as the second syllable, the first character is “e”, the six-character Pinyin dictionary address pr_e6 and the seven-character Pinyin dictionary address pr_e7 are read and stored from pr_e6 to pr_e7. Compare with Pinyin. If there is a matching pinyin, the position evaluation value of the first character is 7. However, if there is no matching pinyin, one character is reduced from the last character of the second syllable to form a new second syllable, and similarly the Pinyin dictionary and If there is a matching Pinyin, the length of the second syllable + the length of the first syllable (here, 1) is set as the position evaluation value of the division position 1. If there is no matching pinyin, a process of further reducing one character from the last character of the second syllable and comparing it with the pinyin dictionary is repeated until a position evaluation value is obtained.

上記処理が終わると、入力ピンイン「meinian」の分割位置iをi=i+1(=2)とする。そこで、先頭文字から2文字「me」を元にピンイン辞書インデックステーブルから「m」が先頭の2文字のピンイン辞書アドレスpr_m2からpr_m3までに記憶されているピンインと比較する。「me」が存在すれば、第1音節を「me」とする。次に「me」を除く「inian」を第2音節とし、同様にピンイン辞書に一致するピンインがあるかを検索する。先頭から切り出し位置7までの処理を行い、最大位置評価値の分割位置の評価を行う。図10では、最大位置評価値が7であり、最大位置評価値が7となる分割位置の個数が1なので、最終分割位置を3と確定する。なお、図10では、分割位置が3のものについての、「分割位置数2」とは、「mainian」は、第3文字iと第4文字nの間に1つの目の分割位置があり、第7文字nとその後(文字はなし)の間に2つ目の分割位置があるとここでは判断されているので、よって、分割位置が2つあるいうことを示している。  When the above process is completed, the division position i of the input pinyin “mainian” is set to i = i + 1 (= 2). Therefore, based on the two characters “me” from the first character, “m” from the Pinyin dictionary index table is compared with the Pinyin stored from the Pinyin dictionary addresses pr_m2 to pr_m3 of the first two characters. If “me” exists, the first syllable is set to “me”. Next, “inian” excluding “me” is set as the second syllable, and similarly, it is searched whether there is a pinyin that matches the pinyin dictionary. Processing from the beginning to the cutout position 7 is performed, and the division position of the maximum position evaluation value is evaluated. In FIG. 10, since the maximum position evaluation value is 7, and the number of division positions at which the maximum position evaluation value is 7 is 1, the final division position is determined to be 3. In FIG. 10, “division position number 2” for a division position of 3 means that “mainian” has a first division position between the third character i and the fourth character n, Since it is determined here that there is a second division position between the seventh character n and the following (no character), it indicates that there are two division positions.

次に、分割位置までのピンインを除く「nian」について、上記と同様の処理を繰り返し、入力ピンインの分割位置を求める。「nian」では、図11に示すように、分割位置が求まり、位置評価値4の分割位置は2個あるので、1音節で構成されている「nian」が選択され、分割位置4が求まる。  Next, the same processing as described above is repeated for “nian” excluding pinyin up to the dividing position, and the dividing position of the input pinyin is obtained. In “nian”, as shown in FIG. 11, the division position is obtained, and there are two division positions of the position evaluation value 4. Therefore, “nian” composed of one syllable is selected, and the division position 4 is obtained.

分割位置までのピンインを除くと、残りのピンインが無いので、入力ピンインの先頭位置からの位置に補正(分割位置3、7)し、処理を終了する。  If the pinyin up to the division position is excluded, there is no remaining pinyin, so the input pinyin is corrected to the position from the head position (division positions 3 and 7), and the process ends.

なお、以上では、ピンインに対する分割処理について説明したが、注音についても同様に注音テーブルを構成することで、上記処理にて分割を行うことができる。ピンイン辞書のインデックステーブルは、ピンインの最大長が7であるため、各ピンインの先頭文字について、長さ1から7までの7個単位で構成している。他方で、注音の最大長は、4であるため、各注音の先頭文字について、長さ1から4までの4個単位で構成すればよい。  In addition, although the division | segmentation process with respect to Pinyin was demonstrated above, it can divide | segment by the said process by comprising a sound-injection table similarly about sound-injection. The index table of the Pinyin dictionary has a maximum Pinyin length of 7, so the first character of each Pinyin is composed of 7 units of length 1-7. On the other hand, since the maximum length of the sound injection is 4, the first character of each sound injection may be configured in units of 4 from length 1 to 4.

以上で説明したように本願発明では、同一先頭漢字の単語をグループ化し、漢字辞書及び単語辞書に入力ピンインに応じて検索対象を制限するための情報を持っている。具体的には、漢字辞書は、ピンインの長さに応じた検索対象か否かの情報を持っている。単語辞書は、インデックス情報に2文字目漢字の読みの先頭文字を持っており、ピンイン列(漢字n文字分)を分割し、漢字検索された1文字目漢字と2文字目の先頭読みから単語検索対象を制限できる。このような構成であるため、検索条件に一致するものを検索するので、語彙数を増加しても、入力文字列と読みの情報の比較を行う回数が制限され、応答速度の速い文字列入力装置を提供することができる。読みの入力が入力したい漢字の2文字目以降の読みを入力すると、さらに単語の検索対象を絞ることができるので、検索処理の速い文字変換装置を提供することができる。  As described above, in the present invention, words having the same leading kanji are grouped, and the kanji dictionary and the word dictionary have information for limiting the search target according to the input pinyin. Specifically, the Chinese character dictionary has information on whether or not it is a search target corresponding to the length of Pinyin. The word dictionary has the first character of the reading of the second character in the index information, divides the Pinyin sequence (n characters of kanji), and the word from the first character and the second character of the first character searched Search target can be limited. Because of this structure, search for items that match the search conditions, so even if the number of vocabulary is increased, the number of comparisons between the input character string and reading information is limited, and character string input with a fast response speed An apparatus can be provided. When the reading of the second and subsequent characters of the kanji to be input is input, the word search target can be further narrowed down, so that a character conversion device with a fast search process can be provided.

さらに、上述の検索処理によって求まった漢字(単語)の候補は、候補ごとに対応付けられている補助情報(あるいは、候補順序決定要素)に基づいて、ユーザによって選択される可能性が高いものほど優先して表示されるような順序に並べ替えて表示するので、候補を表示するまでの応答時間を短縮できる上に、ユーザが所望する順序で候補を表示することができるので、ユーザの利便性をさらに向上させることが可能となる。  Furthermore, candidates for kanji (words) obtained by the above-described search process are more likely to be selected by the user based on auxiliary information (or candidate order determination elements) associated with each candidate. Since the images are rearranged in the order in which they are displayed with priority, the response time until the candidates are displayed can be reduced, and the candidates can be displayed in the order desired by the user. Can be further improved.

最後に、文字変換装置1の各ブロック、特に候補順序決定部32、辞書検索部310、表示制御部22、および制御部10は、ハードウェアロジックによって構成してもよいし、次のようにCPUを用いてソフトウェアによって実現してもよい。具体的には、記録部40、漢字辞書部41、単語辞書部42、一時記憶部3はメモリ、ハードディスクなどの記憶装置によって実現され、候補順序決定部32、辞書検索部310、表示制御部22、制御部10はコンピュータの中央演算装置(CPU)及びCPUに実行されるソフトウェアにより実現される。このソフトウェアも記憶装置に格納され、メモリに読み出されてCPUにより実行される。  Finally, each block of the character conversion device 1, particularly the candidate order determination unit 32, the dictionary search unit 310, the display control unit 22, and the control unit 10 may be configured by hardware logic, or as described below. It may be realized by software using Specifically, the recording unit 40, the kanji dictionary unit 41, the word dictionary unit 42, and the temporary storage unit 3 are realized by a storage device such as a memory or a hard disk, and the candidate order determination unit 32, dictionary search unit 310, display control unit 22. The control unit 10 is realized by a central processing unit (CPU) of a computer and software executed on the CPU. This software is also stored in the storage device, read into the memory, and executed by the CPU.

つまり、文字変換装置1は、各機能を実現する制御プログラムの命令を実行するCPU(central processing unit)、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである文字変換装置1の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記文字変換装置1に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。  That is, the character conversion device 1 includes a CPU (central processing unit) that executes instructions of a control program that realizes each function, a ROM (read only memory) that stores the program, and a RAM (random access memory) that expands the program. And a storage device (recording medium) such as a memory for storing the program and various data. An object of the present invention is a recording medium on which a program code (execution format program, intermediate code program, source program) of a control program of the character conversion device 1 which is software for realizing the functions described above is recorded so as to be readable by a computer. This can also be achieved by supplying the character conversion apparatus 1 and reading and executing the program code recorded on the recording medium by the computer (or CPU or MPU).

上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ系、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM/EPROM/EEPROM/フラッシュROM等の半導体メモリ系などを用いることができる。  Examples of the recording medium include a tape system such as a magnetic tape and a cassette tape, a magnetic disk such as a floppy (registered trademark) disk / hard disk, and an optical disk such as a CD-ROM / MO / MD / DVD / CD-R. Card system such as IC card, IC card (including memory card) / optical card, or semiconductor memory system such as mask ROM / EPROM / EEPROM / flash ROM.

また、文字変換装置1を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークとしては、特に限定されず、例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、通信ネットワークを構成する伝送媒体としては、特に限定されず、例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、802.11無線、HDR、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。  Further, the character conversion device 1 may be configured to be connectable to a communication network, and the program code may be supplied via the communication network. The communication network is not particularly limited. For example, the Internet, intranet, extranet, LAN, ISDN, VAN, CATV communication network, virtual private network, telephone line network, mobile communication network, satellite communication. A net or the like is available. Further, the transmission medium constituting the communication network is not particularly limited. For example, even in the case of wired such as IEEE 1394, USB, power line carrier, cable TV line, telephone line, ADSL line, etc., infrared rays such as IrDA and remote control, Bluetooth ( (Registered trademark), 802.11 wireless, HDR, mobile phone network, satellite line, terrestrial digital network, and the like can also be used. The present invention can also be realized in the form of a computer data signal embedded in a carrier wave in which the program code is embodied by electronic transmission.

以上のように、本発明に係る文字変換装置は、入力された1以上の表音文字よりなる入力文字列を変換文字に変換し、当該変換文字からなる単語を決定できる文字変換装置において、
(a−1)変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報および、(a−2)入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、
(b−1)単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報および、(b−2)単語の先頭となる先頭変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す先頭変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、
(c)入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得手段と、
(d)取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得手段と、
を備えている。
As described above, the character conversion device according to the present invention is a character conversion device that converts an input character string composed of one or more input phonograms into a converted character and can determine a word composed of the converted character.
(A-1) conversion character identification information for identifying a conversion character and conversion character correspondence information in which conversion character phonetic information indicating the phonetic of the conversion character is associated, and (a-2) input And the converted character storage location information indicating the storage location in the converted character correspondence information of the converted character identification information having the phonetic character as the head of the converted character phonetic information. A converted character dictionary having a converted character index;
(B-1) word correspondence information in which word identification information for identifying a word and word phonetic information indicating the phonetic expression of the word are associated with each other, and (b-2) head conversion that becomes the head of the word First conversion character identification information for identifying a character is associated with word storage destination information indicating the storage destination of the word having the first conversion character indicated by the first conversion character identification information in the word correspondence information. A word dictionary having a word index,
(C) Conversion with reference to the converted character dictionary based on the first phonogram of the input character string that is input, and having the first phonogram of the input character string as the head of the converted character phonogram information First conversion character acquisition means for acquiring character identification information;
(D) a word acquisition unit that refers to the word dictionary based on the acquired head conversion character identification information and acquires a word having a conversion character at the head indicated by the head conversion character identification information;
It has.

また、本発明に係る文字変換装置は、上記構成に加え、上記先頭変換文字取得手段が取得した先頭変換文字識別情報が示す先頭変換文字を、ユーザが選択可能に表示部に表示する表示制御手段と、上記ユーザにより選択された先頭変換文字を受け付ける受付手段と、を備え、上記単語取得手段は、上記選択された先頭変換文字の先頭変換文字識別情報に基づいて、単語を取得する処理を行ってもよい。  In addition to the above configuration, the character conversion device according to the present invention includes a display control unit that displays the first conversion character indicated by the first conversion character identification information acquired by the first conversion character acquisition unit on the display unit in a selectable manner by the user. And receiving means for receiving the first conversion character selected by the user, wherein the word acquisition means performs processing for acquiring a word based on the first conversion character identification information of the selected first conversion character. May be.

上記構成によると、ユーザが選択した先頭変換文字に基づいて、つまり、先頭変換文字を絞って、単語を取得することができる。  According to the above configuration, a word can be acquired based on the first conversion character selected by the user, that is, by narrowing down the first conversion character.

また、本発明に係る文字変換装置は、上記構成に加え、上記変換文字対応情報では、さらに、上記変換文字識別情報に、該変換文字識別情報が示す変換文字についての表示補助情報が対応付けられており、上記表示制御手段は、上記表示補助情報に基づき、先頭変換文字を並べ替えて、ユーザが選択可能に表示部に表示してもよい。  In addition to the above configuration, the character conversion device according to the present invention further includes display auxiliary information associated with the converted character indicated by the converted character identification information in the converted character correspondence information. The display control means may rearrange the head conversion characters on the basis of the display auxiliary information and display them on the display unit so that the user can select them.

上記構成によると、表示補助情報に基づき、先頭変換文字を並べ替えて、ユーザが選択可能に表示部に表示することができる。表示補助情報とは、例えば、その漢字の出現頻度の情報であってもよい。表示補助情報はこれ以外の情報であってもよく、表示制御手段が、先頭変換文字を並べ替えることができる情報であればよい。  According to the said structure, based on display auxiliary information, a head conversion character can be rearranged and it can display on a display part so that a user can select. The display auxiliary information may be information on the appearance frequency of the Chinese character, for example. The display auxiliary information may be other information, and may be any information as long as the display control means can rearrange the head conversion characters.

また、本発明に係る文字変換装置は、上記構成に加え、上記単語辞書の単語インデックスは、単語の先頭となる先頭変換文字毎に、上記先頭変換文字識別情報と、単語の2文字目の先頭の表音文字である2文字目先頭表音文字との組み合わせに対して、上記単語対応情報における格納先が割り振られていてもよい。  Further, in addition to the above configuration, the character conversion device according to the present invention includes a word index of the word dictionary in which the first conversion character identification information and the first character of the second character The storage location in the word correspondence information may be allocated to the combination with the second first phonogram that is the phonogram.

上記構成によると、単語取得手段は、先頭変換文字識別情報と、単語の2文字目の先頭の表音文字である2文字目先頭表音文字との組み合わせから、単語を検索することができる。よって、検索範囲をより絞ることができ、より素早い応答が可能となる。  According to the above configuration, the word acquisition unit can search for a word from the combination of the first converted character identification information and the second first phonogram which is the first phonogram of the second character of the word. Therefore, the search range can be narrowed down more quickly.

また、本発明に係る文字変換装置は、上記構成に加え、上記変換文字対応情報では、さらに、上記変換文字識別情報に、該変換文字識別情報が示す変換文字についての取得補助情報が対応付けられており、上記先頭変換文字取得手段は、上記取得補助情報を基に上記変換文字識別情報を取得してもよい。  Further, in the character conversion device according to the present invention, in addition to the above configuration, in the conversion character correspondence information, acquisition auxiliary information about the conversion character indicated by the conversion character identification information is further associated with the conversion character identification information. The head conversion character acquisition means may acquire the conversion character identification information based on the acquisition auxiliary information.

上記構成によると、先頭変換文字取得手段は、変換文字識別情報が示す変換文字についての取得補助情報を基に、変換文字識別情報を取得することができる。取得補助情報とは、先頭変換文字取得手段の変換文字辞書を用いた検索を補助する情報であればよく、例えば先頭変換文字の表音文字の長さ等である。  According to the above configuration, the head conversion character acquisition unit can acquire the conversion character identification information based on the acquisition auxiliary information about the conversion character indicated by the conversion character identification information. The acquisition auxiliary information may be information that assists the search using the conversion character dictionary of the head conversion character acquisition means, and is, for example, the length of the phonetic character of the head conversion character.

また、本発明に係る文字変換装置は、上記構成に加え、上記取得補助情報は、以下の4つの情報に分類されていてもよい。
(1)変換文字識別情報が示す変換文字が、上記入力文字列に対して、無条件に取得対象となるという情報。
(2)変換文字識別情報が示す変換文字が、上記入力文字列が1文字では、取得対象外になるという情報。
(3)変換文字識別情報が示す変換文字が、上記入力文字列が2文字以下では、取得対象外になるという情報。
(4)変換文字識別情報が示す変換文字が、上記入力文字列が3文字以下では、取得対象外になるとういう情報。
In the character conversion device according to the present invention, in addition to the above configuration, the acquisition auxiliary information may be classified into the following four pieces of information.
(1) Information that the converted character indicated by the converted character identification information is unconditionally acquired with respect to the input character string.
(2) Information that the conversion character indicated by the conversion character identification information is excluded from acquisition if the input character string is one character.
(3) Information that the conversion character indicated by the conversion character identification information is excluded from acquisition if the input character string is two characters or less.
(4) Information that the conversion character indicated by the conversion character identification information is not subject to acquisition if the input character string is three characters or less.

上記構成によると、先頭変換文字取得手段が、すばやく、効果的に先頭変換文字を取得することができる。  According to the above configuration, the leading conversion character acquisition means can acquire the leading conversion character quickly and effectively.

また、本発明に係る文字変換装置は、上記構成に加え、上記単語対応情報では、単語の先頭の変換文字が同一のものが1グループとしてまとめられていてもよい。  In addition to the above configuration, the character conversion device according to the present invention may be arranged as a group of words having the same conversion character at the beginning of the word in the word correspondence information.

上記構成によると、単語取得手段は、グループとしてまとめられた単語について検索できるので、すばやく、効果的に単語を取得することができる。  According to the above configuration, the word acquisition unit can search for words grouped as a group, and thus can acquire words quickly and effectively.

さらに、各上記グループ内で、単語は、単語の先頭の表音文字の所定の配列順に並べられていてもよい。  Further, in each of the above groups, the words may be arranged in a predetermined arrangement order of the first phonetic characters of the words.

上記構成によると、単語取得手段は、単語の先頭の表音文字の所定の配列順に並べられてグループ内で単語を検索できるので、よりすばやく、単語を取得することができる。ここで、単語の先頭の表音文字の所定の配列順とは、例えば、単語の読みがピンインであればアルファベット順、ひらがなであれば50音順、等である。  According to the above configuration, the word acquisition unit can search for a word in the group arranged in the predetermined arrangement order of the phonograms at the beginning of the word, so that the word can be acquired more quickly. Here, the predetermined arrangement order of the phonograms at the beginning of the word is, for example, alphabetical order when the word reading is Pinyin, or alphabetical order when hiragana is used.

また、本発明に係る文字変換装置は、上記構成に加え、上記変換文字は漢字であり、上記変換文字対応情報では、漢字の先頭の表音文字が同一、かつ、声調コードが同一の、上記変換文字識別情報である漢字識別情報がグループとしてまとめられていてもよい。  In addition to the above configuration, the character conversion device according to the present invention is such that the conversion character is a kanji character, and the conversion character correspondence information includes the same phonetic code and the same phonetic code in the kanji character. Kanji identification information that is converted character identification information may be grouped together.

上記構成によると、先頭変換文字取得手段は、グループ内で求めたい先頭変換文字について検索すればよいので、応答速度が速くなる。  According to the above configuration, the head conversion character acquisition unit only needs to search for the head conversion character to be obtained in the group, so that the response speed is increased.

また、中国語変換装置として用いられる上記文字変換装置の、上記変換文字対応情報では、各上記グループで、上記漢字識別情報が、漢字の先頭の表音文字の所定の配列順に並べてられていてもよい。  Further, in the converted character correspondence information of the character conversion device used as a Chinese conversion device, the kanji identification information may be arranged in a predetermined arrangement order of the first phonetic characters of the kanji in each group. Good.

漢字の先頭の表音文字の所定の配列順に並べてあるので、先頭変換文字取得手段は、より素早く先頭変換文字を取得することができる。  Since the first phonetic characters of the Chinese characters are arranged in a predetermined arrangement order, the first converted character acquisition means can acquire the first converted character more quickly.

また、中国語変換装置として用いられる上記いずれかの文字変換装置の、前記変換文字インデックスでは、上記漢字の先頭の表音文字が所定の配列順となっており、各上記グループの上記変換文字対応情報での格納先を示す情報を上記変換文字格納情報として、上記漢字の先頭の表音文字に対応付けられていてもよい。  Further, in the conversion character index of any one of the character conversion devices used as a Chinese conversion device, the first phonetic characters of the Chinese characters are in a predetermined arrangement order, and the conversion character corresponding to each group is supported. Information indicating the storage location in the information may be associated with the first phonetic character of the Chinese character as the converted character storage information.

上記構成によると、変換文字インデックスでは、漢字の先頭の表音文字が所定の配列順となっており、各上記グループの変換文字対応情報での格納先を示す情報を上記変換文字格納情報として、漢字の先頭の表音文字に対応付けられている。よって、先頭変換文字取得手段は、グループの変換文字対応情報での格納先から、グループを絞って、より応答速度を速めて、検索することができる。  According to the above configuration, in the conversion character index, the first phonetic characters of the kanji are in a predetermined arrangement order, and information indicating the storage destination in the conversion character correspondence information of each group is used as the conversion character storage information. It is associated with the first phonetic character of the kanji. Therefore, the head conversion character acquisition means can search by narrowing down the group from the storage destination in the conversion character correspondence information of the group and increasing the response speed.

ここで、中国語変換装置として用いられる上記何れかの文字変換装置では、上記漢字は簡体字であり、かつ、上記表音はピンインで表現されていてもよい。  Here, in any one of the character conversion devices used as the Chinese conversion device, the kanji may be simplified and the phonetic may be expressed in pinyin.

上記構成によると、ユーザが1文字以上のピンイン列を入力すると、ピンイン列の先頭文字から先頭漢字の候補を絞り込み、先頭漢字の候補を基に検索対象の単語を制限できるので、辞書検索処理にかかる時間を短縮できる。それゆえ、応答速度の速い中国語入力装置を提供できる。また、入力したい文字列の先頭文字のピンインだけを入力しても連続して2文字目以降のピンインを入力しても所望の文字列を入力することができる文字変換装置を提供できる。また一方では、入力したい文字列の先頭文字のピンインが不完全であり、2文字目以降のピンインを入力しても所望の文字列を入力することができる中国語入力装置を提供できる
あるいは、中国語変換装置として用いられる上記何れかの文字変換装置では、上記漢字は繁体字であり、かつ、上記表音は注音で表現されていてもよい。
According to the above configuration, when a user inputs a pinyin string of one or more characters, the first kanji candidates are narrowed down from the first character in the pinyin string, and the search target words can be limited based on the first kanji candidates. This time can be shortened. Therefore, a Chinese input device with a high response speed can be provided. In addition, it is possible to provide a character conversion device that can input a desired character string even if only the first character Pinyin of the character string to be input is input or if the second and subsequent characters are input continuously. On the other hand, the pinyin of the first character of the character string to be input is incomplete, and a Chinese input device can be provided that can input a desired character string even if the pinyin after the second character is input. In any one of the character conversion devices used as the word conversion device, the kanji may be a traditional character, and the phonetic may be expressed by a note.

上記構成によると、ユーザが1文字以上の注音文字列を入力すると、注音文字列の先頭文字から先頭漢字の候補を絞り込み、先頭漢字の候補を基に検索対象の単語を制限できるので、辞書検索処理にかかる時間を短縮できる。それゆえ、応答速度の速い中国語入力装置を提供できる。また、入力したい文字列の先頭文字の注音文字だけを入力しても、連続して2文字目以降の注音文字を入力しても、所望の文字列を入力することができる中国語入力装置を提供することができる。他方で、入力したい文字列の先頭文字の注音が不完全であり、2文字目以降の注音を入力しても所望の文字列を入力することができる中国語入力装置を提供できる。  According to the above configuration, when the user inputs one or more sung character strings, the first kanji candidates are narrowed down from the first character of the sung character string, and the search target words can be limited based on the first kanji candidates. Processing time can be shortened. Therefore, a Chinese input device with a high response speed can be provided. Also, a Chinese input device that can input a desired character string even when only the first sung character of the character string to be input is input or when the second and subsequent sung characters are continuously input. Can be provided. On the other hand, it is possible to provide a Chinese input device capable of inputting a desired character string even when a second or subsequent character is input because the first character of the character string to be input is incomplete.

また、本発明に係る文字変換装置の制御方法は、入力された1以上の表音文字よりなる入力文字列を変換文字に変換し、当該変換文字からなる単語を決定することができる文字変換装置の制御方法において、(a−1)変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報および、(a−2)入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、(b−1)単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報および、(b−2)単語の先頭となる変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、を用いて、
入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得ステップと、
取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得ステップと、
を含む処理を行う。
Moreover, the control method of the character conversion apparatus according to the present invention converts the input character string composed of one or more input phonograms into a converted character, and can determine a word composed of the converted character. (A-1) conversion character correspondence information in which conversion character identification information for identifying conversion characters and conversion character phonetic information indicating the phonetics of the conversion characters are associated with each other, and (a -2) Conversion character storage location information indicating a storage location in the conversion character correspondence information of the input phonetic character and the conversion character identification information having the phonetic character as the head of the conversion character phonetic information; A conversion character dictionary having a conversion character index associated with the word, (b-1) word identification information for identifying the word, and word correspondence information indicating the phonetic expression of the word Correspondence information and (b-2) First conversion character identification information for identifying a conversion character at the beginning of a word, and word storage destination information indicating a storage destination in the word correspondence information of a word having the conversion character indicated by the first conversion character identification information at the head And a word dictionary having a word index associated with
Conversion character identification information that refers to the conversion character dictionary based on the input phonetic character of the input character string and has the head phonetic character of the input character string as the head of the conversion character phonetic information A first conversion character acquisition step for acquiring
Based on the acquired head conversion character identification information, referring to the word dictionary, a word acquisition step of acquiring a word having a conversion character at the head indicated by the head conversion character identification information;
Processing including

上記方法によると、上記文字変換装置と同様に、単語の検索処理に係る時間を短縮することができる。  According to the above method, as in the character conversion device, it is possible to reduce the time required for word search processing.

また、本発明に係る文字変換装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記何れかの文字変換装置における上記各手段として動作させることにより上記文字変換装置をコンピュータにて実現させる文字変換プログラム、及びその文字変換プログラムを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。  The character conversion device according to the present invention may be realized by a computer. In this case, the character conversion device is operated by the computer by causing the computer to operate as each of the above-described means in any of the character conversion devices. A character conversion program to be realized and a computer-readable recording medium on which the character conversion program is recorded also fall within the scope of the present invention.

これらの構成によれば、文字変換プログラムを、コンピュータに読み取り実行させることによって、上記文字変換装置と同一の作用効果を実現することができる。  According to these structures, the same effect as the said character conversion apparatus is realizable by making a computer read and execute a character conversion program.

〔補足事項〕
本発明に係る文字変換装置は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字または表意文字列を入力する文字変換装置において、上記表音文字と、該表音文字を含む表音文字列に対応する表意文字とを関連付けて記録する文字記録部と、ユーザにより入力された表音文字を受け付けて、該表音文字に関連付けられた表意文字を、表意文字の候補として上記文字記録部から抽出する文字候補抽出手段と、上記候補抽出手段が抽出した候補の表示順序を、所定の条件に基づき決定する候補順序決定手段と、上記候補順序決定手段が決定した表示順序に基づいて候補を表示するようデータを出力する表示制御手段とを備えていることを特徴としている。
[Additional notes]
The character conversion device according to the present invention is a character conversion device that converts an input phonetic character or phonetic character string into a corresponding ideogram and inputs the ideogram or ideogram string selected by the user. A character recording unit that records a phonetic character and an ideogram corresponding to the phonetic character string including the phonetic character in association with each other, and accepts a phonetic character input by the user and associates the phonetic character with the phonetic character. Character candidate extraction means for extracting ideographic characters from the character recording unit as ideographic character candidates, candidate order determination means for determining the display order of candidates extracted by the candidate extraction means based on predetermined conditions, and the candidates Display control means for outputting data so as to display candidates based on the display order determined by the order determination means is provided.

上記構成によれば、文字候補抽出手段は、ユーザが入力した表音文字を受け付けて、その表音文字を含む、表音文字列を特定する。表音文字列は、表意文字と対応している。表音文字と表音文字列との対応関係、および、表音文字列と表意文字との対応関係は、文字記録部に記録されている。したがって、文字候補抽出手段は、ユーザから入力を受け付けた表音文字に基づいて、ユーザが入力したいと所望する表意文字の候補を上記文字記録部から抽出することができる。  According to the said structure, a character candidate extraction means receives the phonetic character which the user input, and specifies the phonetic character string containing the phonetic character. The phonetic character string corresponds to the ideogram. The correspondence relationship between the phonetic character and the phonetic character string and the correspondence relationship between the phonetic character string and the ideographic character are recorded in the character recording unit. Therefore, the character candidate extraction unit can extract from the character recording unit candidates of ideographic characters that the user desires to input based on the phonetic characters received from the user.

続いて、候補順序決定手段は、上記文字候補抽出手段が抽出した表意文字の候補を所定の条件に基づいて並べ替え、候補の表示順序を決定する。表示制御手段は、表意文字の候補が、上記候補順序決定手段が決定した表示順序で表示されるよう候補のデータを出力する。  Subsequently, the candidate order determination means rearranges the ideographic character candidates extracted by the character candidate extraction means based on a predetermined condition, and determines the candidate display order. The display control means outputs candidate data so that the ideographic character candidates are displayed in the display order determined by the candidate order determination means.

これにより、ユーザは、表示された候補の中から所望の表意文字を指定するのみで、該表意文字を入力することができる。  Thus, the user can input the ideogram only by designating the desired ideogram from the displayed candidates.

以上のことから、ユーザは、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。  From the above, the user can obtain the input of a desired ideogram with a smaller number of operations related to the input of phonogram characters.

より具体的には、例えば、表音文字がアルファベットであり、表意文字が中国語の漢字であるとする。すなわち、アルファベット文字列は、ピンインであり、1つのピンインには1または複数の漢字が対応している。上記文字記録部には、アルファベット−ピンイン、ピンイン−漢字の対応関係が記録されている。  More specifically, for example, it is assumed that the phonogram is an alphabet and the ideogram is a Chinese kanji. That is, the alphabet character string is Pinyin, and one Pinyin corresponds to one or a plurality of Chinese characters. In the character recording portion, alphabet-pinyin and pinyin-kanji correspondences are recorded.

したがって、アルファベットが1文字入力されると、文字候補抽出手段は、文字記録部を参照して、当該アルファベットから始まるピンインを特定し、特定したピンインに対応する1または複数の漢字を候補として抽出する。  Therefore, when one alphabetic character is input, the character candidate extraction unit refers to the character recording unit, identifies pinyin starting from the alphabet, and extracts one or more kanji characters corresponding to the identified pinyin as candidates. .

上記候補として抽出された漢字は、ユーザに提示される。ユーザは、提示された候補から所望の漢字を指定するたけでよい。つまり、アルファベットを入力したのち、それに対応するピンインを選択する操作を必要とすることなく、所望の漢字を指定して得ることが可能となる。  The kanji extracted as the candidate is presented to the user. The user only has to specify a desired kanji from the presented candidates. That is, after inputting the alphabet, it is possible to designate and obtain a desired kanji without requiring an operation of selecting the corresponding pinyin.

以上のことから、所望の表意文字(漢字)を得るための、表音文字(ピンイン)の入力操作を簡素化することが可能な文字変換装置を提供することができる。  From the above, it is possible to provide a character conversion device that can simplify the input operation of phonetic characters (pinyin) to obtain a desired ideogram (kanji).

なお、中国語の発音には四声があるために、1つのピンイン表記に対して4種類の発音が存在する。この四声を区別する情報を加えて、対応する漢字を記録してもよい。例えば、上記文字記録部に、四声の区別を格納するためのフィールドを用意し、ユーザが入力する四声の区別に基づいて、対応する漢字をさらに絞り込めば、上記文字候補抽出手段の抽出処理を効率よく行うことができる。  Since there are four voices in Chinese pronunciation, there are four types of pronunciation for one Pinyin notation. The information for distinguishing these four voices may be added to record the corresponding kanji. For example, if the field for storing the distinction of the four voices is prepared in the character recording unit, and the corresponding kanji is further narrowed down based on the distinction of the four voices input by the user, the extraction of the character candidate extraction means Processing can be performed efficiently.

あるいは、例えば、表音文字が注音の字母であり、表意文字が繁体字であってもよい。すなわち、表音文字列は注音であり、1つの注音には1または複数の繁体字が対応している。上記文字記録部には、注音の字母−注音、注音−繁体字の対応関係が記録されていればよい。  Alternatively, for example, the phonetic character may be a letter of the syllabary and the ideogram may be a traditional character. In other words, the phonetic character string is a note, and one or more traditional characters correspond to one note. In the character recording unit, it is only necessary to record the correspondence between the note-moji-to-note and the note-to-traditional character.

上記文字変換装置は、さらに、上記表意文字と、該表意文字を含む表意文字列とを関連付けて記録する文字列記録部と、ユーザにより選択された表意文字を受け付けて、該表意文字に関連付けられた表意文字列を、表意文字列の候補として上記文字列記録部から抽出する文字列候補抽出手段とを備えていてもよい。  The character conversion device further accepts an ideogram selected by the user by associating the ideogram with a character string recording unit that records the ideogram and an ideogram including the ideogram, and is associated with the ideogram. There may be provided character string candidate extracting means for extracting the ideographic character string from the character string recording unit as an ideographic character string candidate.

あるいは、本発明の文字変換装置は、入力された表音文字または表音文字列を、対応する表意文字に変換して、ユーザが選択する表意文字を入力する文字変換装置において、上記表意文字と、該表意文字を含む表意文字列とを関連付けて記録する文字列記録部と、ユーザにより選択された表意文字を受け付けて、該表意文字に関連付けられている表意文字列を、表意文字列の候補として上記文字列記録部から抽出する文字列候補抽出手段と、上記文字列候補抽出手段が抽出した候補の表示順序を、所定の条件に基づき決定する候補順序決定手段と、上記候補順序決定手段が決定した表示順序に基づいて候補を表示するようデータを出力する表示制御手段とを備えていることを特徴としている。  Alternatively, the character conversion device of the present invention converts the input phonetic character or phonetic character string into a corresponding ideographic character and inputs the ideographic character selected by the user. A character string recording unit that records the ideographic character string including the ideographic character in association with each other, accepts the ideographic character selected by the user, and converts the ideographic character string associated with the ideographic character into candidate ideographic character strings. The character string candidate extracting means for extracting from the character string recording unit, the candidate order determining means for determining the display order of the candidates extracted by the character string candidate extracting means based on a predetermined condition, and the candidate order determining means Display control means for outputting data so as to display candidates based on the determined display order is provided.

上記構成によれば、文字列記録部には、表意文字(例えば、漢字)と該表意文字を含む表意文字列(例えば、当該漢字を先頭にした熟語、など)との対応関係が記録されている。したがって、上記文字列候補抽出手段は、表意文字がユーザにより選択されたのに応じて、該表意文字に関連付けられた表意文字列を、候補として上記文字列記録部から抽出する。  According to the above configuration, the correspondence between the ideographic characters (for example, kanji) and the ideographic character strings including the ideographic characters (for example, idioms starting with the kanji) is recorded in the character string recording unit. Yes. Therefore, the character string candidate extraction unit extracts an ideographic character string associated with the ideographic character from the character string recording unit as a candidate in response to selection of the ideographic character by the user.

例えば、中国語の例を用いて説明する。ある漢字が入力されると、その漢字の次に続く文字(ユーザが所望する漢字)は、何の脈絡もない漢字よりも、その漢字から始まる熟語を構成する漢字である可能性が高い。したがって、入力が確定された漢字から始まる熟語を候補として表示すれば、ユーザは、その熟語の候補の中から所望の熟語を選択するのみで、別途ピンインを入力することなく、中国語を入力することが可能となる。  For example, explanation will be given using an example of Chinese. When a certain Chinese character is input, the character following the Chinese character (the Chinese character desired by the user) is more likely to be a Chinese character that constitutes an idiom starting from the Chinese character than a Chinese character without any context. Therefore, if a idiom that starts with a kanji that has been confirmed to be input is displayed as a candidate, the user can select the desired idiom from the idiom candidates and input Chinese without inputting pinyin separately. It becomes possible.

これにより、ユーザは、表音文字の入力に係る操作数について、さらに少ない操作数で、所望の表意文字の入力を得ることが可能となる。  As a result, the user can obtain a desired ideogram input with a smaller number of operations related to the input of phonogram characters.

さらに、上記文字変換装置は、ユーザにより筆記された表意文字を入力する筆記文字入力部をさらに備え、上記筆記文字入力部に入力された表意文字を認識し、該表意文字の情報を上記文字列候補抽出手段に供給する文字認識手段を備えていることが好ましい。  The character conversion device further includes a written character input unit for inputting an ideogram written by a user, recognizes the ideographic character input to the written character input unit, and converts the information of the ideographic character into the character string. It is preferable that character recognition means to be supplied to the candidate extraction means is provided.

これにより、所望の表意文字に対応する表音文字(列)が明瞭でない場合でも、所望の表意文字の入力を得ることが可能となる。  Thereby, even when the phonetic character (sequence) corresponding to the desired ideographic character is not clear, it is possible to obtain the input of the desired ideographic character.

さらに、上記文字変換装置の文字候補抽出手段は、ユーザにより入力された表音文字を受け付けると、連続して受け付けた表音文字列に対応する表意文字を、候補として抽出することが好ましい。  Furthermore, it is preferable that the character candidate extraction unit of the character conversion device extracts, as candidates, ideographic characters corresponding to the phonetic character strings received continuously when the phonetic characters input by the user are received.

上記構成によれば、表音文字がユーザによって入力されるたびに、特定するべき表音文字列の候補数が絞られる。よって、文字候補抽出手段は、対応する表意文字の候補数を大幅に絞り込んで抽出することができ、表示制御手段はその絞り込まれた表意文字の候補を出力することができる。  According to the above configuration, each time a phonetic character is input by the user, the number of candidates for the phonetic character string to be specified is reduced. Therefore, the character candidate extraction means can significantly narrow down and extract the number of corresponding ideographic character candidates, and the display control means can output the narrowed ideographic character candidates.

以上のことから、表音文字がユーザによって入力されるごとに、表示された表意文字の候補が、ユーザが所望する表意文字を含んでいる確率が上がるよう、文字変換装置を構成することができる。結果として、所望の表意文字を得るための、表音文字の入力操作を簡素化することが可能な文字変換装置を提供することができる。  From the above, the character conversion device can be configured so that the probability that the displayed ideographic character candidate includes the ideographic character desired by the user increases each time the phonic character is input by the user. . As a result, it is possible to provide a character conversion device capable of simplifying a phonetic character input operation for obtaining a desired ideogram.

さらに、上記文字変換装置の上記候補順序決定手段は、上記文字列候補抽出手段により抽出された表意文字列の候補が、上記文字候補抽出手段により抽出された表意文字の候補よりも優先して表示されるよう表示順序を決定することが好ましい。  Further, the candidate order determination means of the character conversion device displays the ideographic character string candidates extracted by the character string candidate extraction means in preference to the ideographic character candidates extracted by the character candidate extraction means. It is preferable to determine the display order.

上記構成によれば、文字候補抽出手段が文字記録部より抽出した表意文字の候補より、文字列候補抽出手段が文字列記録部より抽出した表意文字列の候補の方が先に表示されるよう、候補順序決定手段が候補の表示順序を決定する。  According to the above configuration, the ideographic character string candidate extracted by the character string candidate extraction unit from the character string recording unit is displayed first than the ideographic character candidate extracted by the character candidate extraction unit from the character recording unit. The candidate order determining means determines the candidate display order.

例えば、日本語や中国語の漢字入力において、何の脈絡もない漢字よりも、すでに入力されている漢字に続いて熟語(表意文字列)を構成するような漢字が続く(ユーザが所望する)可能性が高い。したがって、例えば、入力が確定された漢字から始まる熟語を候補として表示すれば、ユーザは、漢字(表意文字)の候補から表示された場合に比べて、より早く、少ない操作数で所望の漢字を入力することが可能となる。  For example, in Japanese or Chinese kanji input, a kanji that forms an idiom (ideographic character string) follows an already input kanji, rather than a kanji without any context (desired by the user). Probability is high. Therefore, for example, if an idiom starting from a kanji that has been confirmed to be input is displayed as a candidate, the user can select a desired kanji faster and with a smaller number of operations than when displayed from a candidate for a kanji (ideographic character). It becomes possible to input.

上記文字変換装置は、さらに、ユーザにより選択された表意文字を学習文字として学習語記録部に記録する学習制御手段を備え、上記候補順序決定手段は、上記文字候補抽出手段が抽出した候補が上記学習語記録部に記録された学習文字である場合に、該候補が優先して表示されるよう表示順序を決定してもよい。  The character conversion device further includes learning control means for recording an ideographic character selected by the user as a learning character in a learning word recording unit, and the candidate order determination means includes the candidate extracted by the character candidate extraction means as the candidate When the learning characters are recorded in the learning word recording unit, the display order may be determined so that the candidates are displayed with priority.

あるいは、ユーザにより選択された表意文字列を学習文字列として学習語記録部に記録する学習制御手段を備え、上記候補順序決定手段は、上記文字列候補抽出手段が抽出した候補が上記学習語記録部に記録された学習文字列である場合に、該候補が優先して表示されるよう表示順序を決定してもよい。  Alternatively, it comprises learning control means for recording an ideographic character string selected by the user as a learned character string in a learned word recording unit, and the candidate order determining means is configured such that the candidate extracted by the character string candidate extracting means is recorded as the learned word record. In the case of the learned character string recorded in the part, the display order may be determined so that the candidate is displayed with priority.

上記構成によれば、学習制御手段は、文字変換装置において入力が確定された(ユーザが所望した)表意文字または表意文字列を学習文字(列)として学習語記録部に記録させる。  According to the above configuration, the learning control unit causes the learning word recording unit to record the ideographic character or the ideographic character string whose input is confirmed (desired by the user) in the character conversion device as the learning character (string).

そして、上記候補抽出手段が候補を文字(列)記録部より抽出したのち、候補順序決定手段は、その抽出された候補のうち、上記学習語記録部に記録されているものを学習文字として判定することができる。候補が学習文字であるということは、すなわち、ユーザが過去に所望した表意文字(列)であって、学習文字でない候補よりも、ユーザに再び所望される可能性が高いことを意味する。  And after the said candidate extraction means extracts a candidate from a character (sequence) recording part, a candidate order determination means determines what was recorded on the said learning word recording part among the extracted candidates as a learning character. can do. That the candidate is a learning character means that the user is more likely to be desired again than a candidate that is an ideographic character (sequence) that the user has desired in the past and is not a learning character.

以上のことから、学習文字である候補の表示順序を上位にすることにより、ユーザがより早く、少ない操作数で所望の漢字を入力することが可能な文字変換装置を実現することができる。  From the above, it is possible to realize a character conversion device that allows a user to input a desired kanji faster and with a smaller number of operations by raising the display order of candidates that are learning characters.

あるいは、上記文字変換装置は、さらに、ユーザにより選択された表意文字を、該表意文字の直前に入力されている直前文字または直前文字列と関連付けて、ペア学習文字として学習語記録部に記録する学習制御手段を備え、上記候補順序決定手段は、上記文字候補抽出手段が抽出した候補が、直前文字または直前文字列と関連付けられて上記学習語記録部に記録されたペア学習文字である場合に、該候補が優先して表示されるよう表示順序を決定してもよい。  Alternatively, the character conversion device further records the ideographic character selected by the user in the learning word recording unit as a pair learning character in association with the immediately preceding character or the immediately preceding character string input immediately before the ideographic character. A learning control unit, wherein the candidate order determination unit is a pair learning character recorded in the learning word recording unit in association with the immediately preceding character or the immediately preceding character string. The display order may be determined so that the candidates are displayed with priority.

もしくは、ユーザにより選択された表意文字列を、該表意文字列の直前に入力されている直前文字または直前文字列と関連付けて、ペア学習文字列として学習語記録部に記録する学習制御手段を備え、上記候補順序決定手段は、上記文字列候補抽出手段が抽出した候補が、直前文字または直前文字列と関連付けられて上記学習語記録部に記録されたペア学習文字列である場合に、該候補が優先して表示されるよう表示順序を決定してもよい。  Alternatively, a learning control unit is provided that records the ideographic character string selected by the user in the learning word recording unit as a pair learning character string in association with the immediately preceding character or the immediately preceding character string input immediately before the ideographic character string. The candidate order determining means, when the candidate extracted by the character string candidate extracting means is a pair learning character string recorded in the learning word recording unit in association with the immediately preceding character or the immediately preceding character string, the candidate The display order may be determined so that is displayed with priority.

上記構成によれば、学習制御手段は、文字変換装置において入力が確定された(ユーザが所望した)表意文字または表意文字列を学習文字(列)として学習語記録部に記録させる際、その学習文字(列)の直前にすでに入力が確定している文字(列)(以下、直前文字(列)と称す)と関連付けて、ペア学習文字(列)として記録させる。  According to the above configuration, when the learning control unit records the ideographic character or the ideographic character string whose input is confirmed (desired by the user) in the character conversion device as the learning character (string) in the learning word recording unit, It is recorded as a pair learning character (string) in association with a character (string) whose input has already been confirmed immediately before the character (string) (hereinafter referred to as the immediately preceding character (string)).

上記ペア学習文字(列)は、上記関連付けられた直前文字(列)に続いて、ユーザに所望された履歴があるということになる。したがって、上記直前文字(列)が入力された場合には、上記ペア学習文字(列)がユーザに所望される可能性が高い。  The pair learning character (sequence) has a history desired by the user following the associated immediately preceding character (sequence). Therefore, when the immediately preceding character (string) is input, the pair learning character (string) is highly likely to be desired by the user.

上記候補順序決定手段は、候補抽出手段が抽出した候補が、ペア学習文字(列)である場合には、その候補の表示順序を上位に変更する。  When the candidate extracted by the candidate extraction unit is a pair learning character (string), the candidate order determination unit changes the display order of the candidates to the top.

これにより、ユーザがより早く、少ない操作数で所望の漢字を入力することが可能な文字変換装置を実現することができる。  Thereby, it is possible to realize a character conversion device that allows a user to input a desired kanji character earlier and with a smaller number of operations.

さらに、上記文字変換装置の上記学習制御手段は、学習語としての、上記学習文字または学習文字列、もしくは、上記ペア学習文字またはペア学習文字列を分類するためのグループ識別子を生成し、該グループ識別子を各学習語に関連付けて上記学習語記録部に記録し、上記グループ識別子は、上記学習語を構成する表意文字にあらかじめ割り当てられた、所定の長さの文字コードに基づいて生成されることが好ましい。  Furthermore, the learning control means of the character conversion device generates a group identifier for classifying the learning character or learning character string or the pair learning character or pair learning character string as a learning word, An identifier is associated with each learning word and recorded in the learning word recording unit, and the group identifier is generated based on a character code having a predetermined length assigned in advance to ideographic characters constituting the learning word. Is preferred.

上記構成によれば、学習制御手段は、学習語記録部に記録される学習語(学習文字または学習文字列、もしくは、ペア学習文字またはペア学習文字列)に対して、それを複数のグループに分類するためのグループ識別子を生成して割り当てる。学習制御手段は、上記学習語を構成する各表意文字にあらかじめ割り当てられた、文字コードを基に求められる数値を用いて上記グループ識別子を生成する。  According to the above configuration, the learning control means divides the learning word (learning character or learning character string, or pair learning character or pair learning character string) recorded in the learning word recording unit into a plurality of groups. Generate and assign group identifiers for classification. The learning control means generates the group identifier using a numerical value that is assigned in advance to each ideographic character constituting the learning word and that is obtained based on the character code.

このようにして生成されたグループ識別子は、どのような学習語に割り当てるものであっても固定長となる。すなわち、具体例を挙げると、2文字の熟語からなる学習語であっても、6文字の熟語からなる学習語であっても、それらには同サイズのグループ識別子が割り当てられる。  The group identifier generated in this way has a fixed length regardless of what learning word is assigned. That is, to give a specific example, a group identifier of the same size is assigned to a learning word consisting of a two-character idiom or a learning word consisting of a six-character idiom.

上記学習語記録部に記録される学習語の数が、膨大な量になればなるほど、また、それが熟語の場合、文字数が多くなればなるほど、データサイズが大きくなる。つまり、候補が学習語であるか否かを判定するために上記学習語記録部から合致する学習語を検索するのに膨大な時間がかかり、文字入力の処理効率が低下するという問題が発生する。  As the number of learning words recorded in the learning word recording unit becomes enormous, or when it is a idiom, the data size increases as the number of characters increases. That is, it takes a long time to search for a matching learning word from the learning word recording unit in order to determine whether or not the candidate is a learning word, resulting in a problem that the processing efficiency of character input decreases. .

しかし、上述したとおり、各学習文字に固定長のグループ識別子を割り当てれば、検索において、入力文字(列)と学習語が一致あるいは同一グループの文字(列)であるかを判定する時間は、学習語がどのような文字数からなっていようと関係なく一律となる。以上のことから、学習語の増加に対して検索にかかる時間が比例的に増加することを抑制することができ、処理効率の低下への影響が小さくすることができる。  However, as described above, if a fixed-length group identifier is assigned to each learning character, the time for determining whether the input character (string) matches the learning word or the character (string) in the same group in the search is as follows. Regardless of the number of characters in the learning word, it is uniform. As described above, it is possible to suppress a proportional increase in the time required for the search with respect to the increase in learning words, and to reduce the influence on the decrease in processing efficiency.

上記文字変換装置は、さらに、ユーザにより選択された表意文字または表意文字列と、該表意文字または表意文字列より前に入力が確定している前方文字または前方文字列との関連度合いを記録する関連度記録部を備え、上記候補順序決定手段は、上記候補が、上記前方文字または前方文字列との関連度が高いものほど優先して表示されるよう表示順序を決定してもよい。  The character conversion device further records the degree of association between the ideogram or ideogram string selected by the user and the forward character or the forward character string whose input is confirmed before the ideogram or ideogram string. The candidate order determination unit may include a relevance degree recording unit, and the candidate order determination unit may determine the display order such that the candidates are displayed with higher priority as the degree of relevance with the front character or the front character string is higher.

上記構成によれば、候補順序決定手段は、前方文字(列)との関連度合いに基づいて、候補の表示順序を決定する。上記関連度合いとは、上記文字入力確定手段が入力を確定した表意文字または表意文字列と、該表意文字または表意文字列より前に入力が確定されている前方文字または前方文字列との関連性のことである。  According to the above configuration, the candidate order determining means determines the candidate display order based on the degree of association with the forward character (string). The degree of relevance is the relationship between the ideogram or ideographic character string whose input has been confirmed by the character input confirmation means and the front character or the front character string whose input has been confirmed before the ideogram or ideographic character string. That is.

より具体的には、例えば、「上海交通大学」という熟語が頻繁に入力される場合について説明する。「交通」に続いて「規則」などの別の熟語が連続して入力される可能性が高い場合であっても、それよりも前方に「上海」がある場合は、候補順序決定手段は、「上海」と「大学」との関連性を考慮して、「大学」を候補の上位に変更する。  More specifically, for example, a case where the phrase “Shanghai Jiaotong University” is frequently input will be described. Even if there is a high probability that another phrase such as “rule” will be input in succession after “traffic”, if “Shanghai” precedes it, the candidate order determining means Considering the relationship between “Shanghai” and “University”, “University” is changed to a higher rank candidate.

これにより、候補順序決定手段は、直前の文字(列)との連続性のみならず、それよりも前方の文字(列)との関連性を考慮して、候補となる表意文字(列)の表示順序を決定するので、よりユーザの希望を反映した順序で候補を提示することが可能となる。  Thereby, the candidate order determining means considers not only the continuity with the immediately preceding character (sequence) but also the relationship with the preceding character (sequence), and the candidate ideographic characters (sequence). Since the display order is determined, the candidates can be presented in an order more reflecting the user's wishes.

結果として、ユーザは、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。  As a result, the user can obtain the input of a desired ideographic character with a smaller number of operations with respect to the number of operations related to the input of phonetic characters.

さらに、上記文字変換装置は、上記候補順序決定手段が候補の表示順序を決定する際に参照する所定の条件であって、ユーザにより指定された条件を設定する候補順序決定要素設定手段を備え、上記候補順序決定手段は、上記候補順序決定要素設定手段が設定した条件に基づき、候補の表示順序を決定することが好ましい。  Furthermore, the character conversion device includes a candidate order determination element setting unit that sets a predetermined condition that is specified by the user as a predetermined condition to be referred to when the candidate order determination unit determines the display order of candidates. Preferably, the candidate order determining means determines a candidate display order based on the conditions set by the candidate order determining element setting means.

上記構成によれば、上記候補順序決定手段が候補の表示順序を決定する際に参照する所定の条件が複数ある場合に、どのような条件に基づいて表示順序を決定するのかを、ユーザの指示に応じて、候補順序決定要素設定手段が設定する。  According to the above configuration, when there are a plurality of predetermined conditions to be referred to when the candidate order determination unit determines the display order of candidates, the user's instruction is used to determine the display order based on what conditions The candidate order determination element setting unit sets the response according to the above.

上記所定の条件の例としてはいくつか考えられる。例えば、上述したとおり、
(1)候補が文字(漢字)であるか、文字列(熟語)であるか、(2)候補が学習文字であるか否か、(3)候補がペア学習文字であるか否か、(4)いつの時期に学習されたのか、(5)一般的にどのくらい頻繁に使用されるのか、(6)現在読みとして入力された表音文字長は、候補の表音文字長と一致しているか否か(例えば、「技術」を入力したい場合に、「ぎじ(2文字)」と「ぎじゅつ(4文字)」とは表音文字長が不一致である)、(7)直前文字列との連続性はあるか、(8)前方文字列との関連性はあるか、(9)当該ユーザによってどのくらいの頻度で使用されているのか、など、さまざまな条件が考えられる。
Several examples of the predetermined condition are conceivable. For example, as mentioned above,
(1) whether the candidate is a character (kanji), a character string (jukugo), (2) whether the candidate is a learning character, (3) whether the candidate is a pair learning character, 4) When was it learned, (5) How often it is generally used, (6) Is the phonetic character length currently input as reading consistent with the candidate phonetic character length? No (for example, when “technical” is desired to be input, “giji (2 characters)” and “gijutsu (4 characters)” are inconsistent in phonetic character length), (7) continuous with previous character string There are various conditions such as (8) whether there is a relationship with the forward character string, (9) how often it is used by the user.

ここで、どのような条件に基づいて(あるいは、どのような条件を重要視して)候補の表示順序を決定するのかということを、ユーザが任意に設定できれば、候補順序決定手段が決定する候補の表示順序は、ユーザの希望をより正確に反映したものとなる。  Here, if the user can arbitrarily set the display order of the candidates based on what conditions (or what conditions are emphasized), the candidates determined by the candidate order determination means The display order reflects the user's wish more accurately.

結果として、ユーザは、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。  As a result, the user can obtain the input of a desired ideographic character with a smaller number of operations with respect to the number of operations related to the input of phonetic characters.

本発明に係る複写機は、上述の文字変換装置と、各表音文字に対応するキーを備えてユーザにより押下されたキーに対応する表音文字を上記文字変換装置に供給する第1入力部と、ユーザが選択した候補を上記文字変換装置に入力する第2入力部と、上記文字候補抽出手段または上記文字列候補抽出手段が抽出する候補を、上記候補順序決定手段が定めた表示順序にしたがって表示する表示部とを備え、上記第1入力部および第2入力部と、上記表示部とは、互いに一体に形成されたタッチパネルまたはタブレットであることを特徴としている。  A copying machine according to the present invention includes the above-described character conversion device and a first input unit that includes a key corresponding to each phonetic character and supplies the phonetic character corresponding to the key pressed by the user to the character conversion device. And the second input unit for inputting the candidate selected by the user to the character conversion device and the candidates extracted by the character candidate extraction unit or the character string candidate extraction unit in the display order determined by the candidate order determination unit. Accordingly, the display unit includes a display unit, and the first input unit, the second input unit, and the display unit are touch panels or tablets formed integrally with each other.

これにより、ユーザにより選択された表音文字や表意文字を上記文字変換装置に入力するための第1および第2入力部と、候補としての表意文字(列)をユーザに提示するための表示部とを一体に備えたタブレットを有する複写機において、ユーザは、表音文字の入力に係る操作数について、より少ない操作数で、所望の表意文字の入力を得ることが可能となる。  Thus, the first and second input units for inputting the phonetic characters and ideograms selected by the user to the character conversion device, and the display unit for presenting the ideographic characters (sequences) as candidates to the user In a copier having a tablet integrated with the above, the user can obtain a desired ideogram input with a smaller number of operations related to the input of phonogram characters.

上記複写機は、ユーザにより筆記された表意文字を入力する筆記文字入力部をさらに備え、上記筆記文字入力部に入力された表意文字を認識し、該表意文字の情報を上記文字変換装置に供給する文字認識手段を備えていることが好ましい。  The copying machine further includes a written character input unit for inputting an ideographic character written by a user, recognizes the ideographic character input to the written character input unit, and supplies information of the ideographic character to the character conversion device. It is preferable to include a character recognition means.

これにより、所望の表意文字に対応する表音文字(列)が明瞭でない場合でも、所望の表意文字の入力を得ることが可能な複写機を実現することが可能となる。  As a result, it is possible to realize a copier that can obtain the input of a desired ideogram even when the phonogram (column) corresponding to the desired ideogram is not clear.

本発明に係る文字入力方法は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字または表意文字列を入力する文字変換装置における文字入力方法において、ユーザにより入力された表音文字を受け付けて、該表音文字に関連付けられている表意文字を、上記表音文字と、該表音文字を含む表音文字列に対応する表意文字とを関連付けて記録する文字記録部から、表意文字の候補として抽出する第1ステップと、上記第1ステップにて抽出した候補の表示順序を、所定の条件に基づき決定する第2ステップと、上記第2ステップにて決定した表示順序に基づいて候補を表示するようデータを出力するする第3ステップとを含むことを特徴としている。  A character input method according to the present invention is a character input method in a character conversion device that converts an input phonetic character or phonetic character string into a corresponding ideographic character and inputs an ideographic character or ideographic character string selected by the user. The phonetic character input by the user is received, and the ideogram associated with the phonetic character is the phonogram and the ideogram corresponding to the phonetic character string including the phonetic character. A first step of extracting as an ideographic character candidate from a character recording unit to be recorded in association; a second step of determining a display order of candidates extracted in the first step based on a predetermined condition; And a third step of outputting data so as to display candidates based on the display order determined in the steps.

上記方法によれば、第1ステップにて、ユーザ入力した表音文字を含む表音文字列と対応する表意文字の候補が抽出され、第2ステップにて、抽出された候補の表示順序が決定される。このとき、表示順序は、例えば、上述したような所定の条件に基づいて決定されればよい。そして、第3ステップにて、決定された表示順序に基づいて表意文字の候補が出力される。  According to the above method, in the first step, candidates for ideographic characters corresponding to the phonetic character string including the phonetic character input by the user are extracted, and in the second step, the display order of the extracted candidates is determined. Is done. At this time, the display order may be determined based on the predetermined condition as described above, for example. In a third step, ideographic character candidates are output based on the determined display order.

これにより、ユーザにより上記候補の中から所望の表意文字が指定されると、その指定された表意文字の入力が確定される。  Thus, when a desired ideogram is designated from the candidates by the user, the input of the designated ideogram is confirmed.

以上のことから、所望の表意文字(漢字)を得るための、表音文字(ピンイン)の入力操作を簡素化することが可能な文字変換装置を提供することができる。  From the above, it is possible to provide a character conversion device that can simplify the input operation of phonetic characters (pinyin) to obtain a desired ideogram (kanji).

なお、上記文字変換装置および複写機は、コンピュータによって実現してもよく、この場合には、コンピュータを上記各手段として動作させることにより上記文字変換装置または複写機をコンピュータにて実現させる制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。  The character conversion device and the copying machine may be realized by a computer. In this case, a control program for causing the character conversion device or the copying machine to be realized by the computer by causing the computer to operate as each of the above means, A computer-readable recording medium on which it is recorded also falls within the scope of the present invention.

〔補足事項2〕
本発明に係る文字変換装置は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字または表意文字列を入力する文字変換装置において、上記表音文字と、該表音文字を含む表音文字列に対応する表意文字とを関連付けて記録する文字記録部と、ユーザにより入力された表音文字を受け付けて、該表音文字に関連付けられた表意文字を、表意文字の候補として上記文字記録部から抽出する文字候補抽出手段と、上記候補抽出手段が抽出した候補の表示順序を決定する候補順序決定手段と、上記候補順序決定手段が決定した表示順序に基づいて候補を表示するようデータを出力する表示制御手段とを備え、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前よりさらに前方に入力された前方文字または前方文字列とを対応付けて、上記前方文字または前方文字列の後方に該表意文字または表意文字列が入力される可能性の高さを示す関連度が関連度記録部に記憶されており、上記候補順序決定手段は、上記関連度記録部から、上記候補の前方に入力されている前方文字または前方文字列と、各候補との関連度を検出し、該関連度が高い候補ほど優先して表示されるよう表示順序を決定することを特徴としている。
[Supplement 2]
The character conversion device according to the present invention is a character conversion device that converts an input phonetic character or phonetic character string into a corresponding ideogram and inputs the ideogram or ideogram string selected by the user. A character recording unit that records a phonetic character and an ideogram corresponding to the phonetic character string including the phonetic character in association with each other, and accepts a phonetic character input by the user and associates the phonetic character with the phonetic character. Character candidate extraction means for extracting ideographic characters from the character recording unit as ideographic character candidates, candidate order determination means for determining the display order of candidates extracted by the candidate extraction means, and the candidate order determination means Display control means for outputting data so as to display candidates based on the display order, and an ideographic character or ideographic character string input in the past; The relevance degree is a degree of relevance indicating a high possibility that the ideogram or the ideographic character string is input behind the front character or the front character string in association with the front character or the front character string inputted in front. Stored in the recording unit, the candidate order determining means detects a degree of association between each candidate and a forward character or a forward character string input in front of the candidate from the association degree recording unit, The display order is determined so that candidates with higher relevance are displayed with higher priority.

あるいは、本発明の文字変換装置は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字を入力する文字変換装置において、上記表意文字と、該表意文字を含む表意文字列とを関連付けて記録する文字列記録部と、ユーザにより選択された表意文字を受け付けて、該表意文字に関連付けられている表意文字列を、表意文字列の候補として上記文字列記録部から抽出する文字列候補抽出手段と、上記文字列候補抽出手段が抽出した候補の表示順序を決定する候補順序決定手段と、上記候補順序決定手段が決定した表示順序に基づいて候補を表示するようデータを出力する表示制御手段とを備え、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前よりさらに前方に入力された前方文字または前方文字列とを対応付けて、上記前方文字または前方文字列の後方に該表意文字または表意文字列が入力される可能性の高さを示す関連度が関連度記録部に記憶されており、上記候補順序決定手段は、上記関連度記録部から、上記候補の前方に入力されている前方文字または前方文字列と、各候補との関連度を検出し、該関連度が高い候補ほど優先して表示されるよう表示順序を決定することを特徴としている。  Alternatively, the character conversion device of the present invention converts the input phonetic character or phonetic character string into a corresponding ideogram, and inputs the ideogram selected by the user. A character string recording unit that records the ideographic character string including the ideographic character in association with each other, accepts the ideographic character selected by the user, and uses the ideographic character string associated with the ideographic character as a candidate for the ideographic character string. Based on the character string candidate extracting means extracted from the character string recording unit, the candidate order determining means for determining the display order of the candidates extracted by the character string candidate extracting means, and the display order determined by the candidate order determining means Display control means for outputting data so as to display candidates, and an ideographic character or ideographic character string input in the past, and further forward from immediately before the ideographic character or ideographic character string The relevance degree recording unit associates the inputted front character or the front character string with each other and indicates the degree of possibility that the ideographic character or the ideographic character string is input behind the front character or the front character string. And the candidate order determination means detects the degree of association between each candidate and the forward character or the forward character string input in front of the candidate from the association degree recording unit. The display order is determined so that the higher the candidate is, the higher the priority is displayed.

これにより、ユーザは、表音文字の入力に係る操作数について、さらに少ない操作数で、所望の表意文字の入力を得ることが可能となる。  As a result, the user can obtain a desired ideogram input with a smaller number of operations related to the input of phonogram characters.

さらに、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前に入力された直前文字または直前文字列とを対応付けて、上記直前文字または直前文字列の直後に該表意文字または表意文字列が入力される可能性の高さを示す連続度が連続度記録部に記憶されており、上記候補順序決定手段は、上記前方文字または前方文字列との関連度、および、上記直前文字または直前文字列との連続度が高い候補ほど優先して表示されるよう表示順序を決定することが好ましい。  Further, an ideographic character or ideographic character string input in the past is associated with the immediately preceding character or immediately preceding character string input immediately before the ideographic character or ideographic character string, and immediately after the immediately preceding character or immediately preceding character string. The continuity indicating the high possibility that the ideogram or the ideogram is input is stored in the continuity recording unit, and the candidate order determining means includes the relevance with the forward character or the forward character string, In addition, it is preferable to determine the display order so that candidates with higher continuity with the immediately preceding character or the immediately preceding character string are displayed with higher priority.

さらに、上記文字変換装置の文字候補抽出手段は、ユーザにより入力された表音文字を受け付ける度に、該表音文字をすでに受け付けた表音文字列の末尾に連結し、該連結によって得られた表音文字列に対応する表意文字を候補として抽出することが好ましい。  Further, the character candidate extraction unit of the character conversion device connects the phonetic character to the end of the received phonetic character string every time it receives a phonetic character input by the user, and is obtained by the connection. It is preferable to extract ideographic characters corresponding to the phonetic character string as candidates.

さらに、上記文字変換装置の上記学習制御手段は、上記学習語記録部に記録する対象となる学習語としての、上記学習文字または学習文字列、もしくは、上記ペア学習文字またはペア学習文字列を分類するためのグループ識別子を生成し、該グループ識別子を各学習語に関連付けて上記学習語記録部に記録し、上記グループ識別子は、上記学習語を構成する表意文字にあらかじめ割り当てられた、所定の長さの文字コードに基づいて生成されることが好ましい。  Further, the learning control means of the character conversion device classifies the learning character or learning character string, or the pair learning character or pair learning character string as a learning word to be recorded in the learning word recording unit. A group identifier is generated, and the group identifier is recorded in the learning word recording unit in association with each learning word. The group identifier is a predetermined length assigned in advance to ideographic characters constituting the learning word. Preferably, it is generated based on the character code.

さらに、上記文字変換装置は、上記候補順序決定手段が候補の表示順序を決定する際に参照する所定の条件である、上記候補がユーザに選択される可能性の大きさを示す評価値の算出に使用可能な複数種類の要素から、ユーザにより指定された要素を設定する候補順序決定要素設定手段を備え、上記各候補に対応付けて上記関連度とは異なる要素が要素記録部に記憶されており、上記候補順序決定手段は、上記関連度と、上記候補順序決定要素設定手段によって設定された上記要素記録部に記憶されている要素とに基づき、候補の表示順序を決定することが好ましい。  Furthermore, the character conversion device calculates an evaluation value indicating a degree of possibility that the candidate is selected by the user, which is a predetermined condition to be referred to when the candidate order determination unit determines the display order of the candidates. A candidate order determination element setting means for setting an element designated by the user from a plurality of types of elements that can be used for the element, and an element different from the relevance level is stored in the element recording unit in association with each candidate The candidate order determining means preferably determines the display order of candidates based on the relevance and the elements stored in the element recording unit set by the candidate order determining element setting means.

本発明に係る文字入力方法は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字または表意文字列を入力する文字変換装置における文字入力方法において、上記文字変換装置は、文字候補抽出手段と、候補順序決定手段と、表示制御手段とを備えており、上記文字候補抽出手段が、ユーザにより入力された表音文字を受け付けて、該表音文字に関連付けられている表意文字を、上記表音文字と、該表音文字を含む表音文字列に対応する表意文字とを関連付けて記録する文字記録部から、表意文字の候補として抽出する第1ステップと、上記候補順序決定手段が、上記第1ステップにて抽出した候補の表示順序を決定する第2ステップと、上記表示制御手段が、上記第2ステップにて決定した表示順序に基づいて候補を表示するようデータを出力する第3ステップとを含み、上記第2ステップは、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前よりさらに前方に入力された前方文字または前方文字列とを対応付けて、上記前方文字または前方文字列の後方に該表意文字または表意文字列が入力される可能性の高さを示す関連度を記憶する関連度記録部から、上記候補の前方に入力されている前方文字または前方文字列と、各候補との関連度を検出し、該関連度が高い候補ほど優先して表示されるよう表示順序を決定するステップを含むことを特徴としている。  A character input method according to the present invention is a character input method in a character conversion device that converts an input phonetic character or phonetic character string into a corresponding ideographic character and inputs an ideographic character or ideographic character string selected by the user. The character conversion device includes character candidate extraction means, candidate order determination means, and display control means. The character candidate extraction means accepts a phonetic character input by a user, The ideogram associated with the phonetic character is extracted as an ideographic character candidate from a character recording unit that records the phonogram and the ideogram corresponding to the phonogram string including the phonogram in association with each other. A first step, a second step in which the candidate order determining means determines the display order of the candidates extracted in the first step, and a table determined by the display control means in the second step. A third step of outputting data so as to display candidates based on the order, wherein the second step further includes an ideographic character or ideographic character string input in the past, and immediately before the ideographic character or ideographic character string. Associating with the forward character or the forward character string inputted in front, the degree of relevance indicating the possibility that the ideographic character or the ideographic character string is inputted behind the forward character or the forward character string is stored. From the relevance level recording unit, the degree of relevance between the front character or the front character string input in front of the candidate and each candidate is detected, and the display order is set so that the candidate having the higher relevance degree is displayed with priority. It is characterized by including the step to determine.

以上のことから、所望の表意文字(漢字)を得るための、表音文字(ピンイン)の入力操作を簡素化することが可能な文字変換装置を提供することができる。  From the above, it is possible to provide a character conversion device that can simplify the input operation of phonetic characters (pinyin) to obtain a desired ideogram (kanji).

本発明に係る文字入力方法は、入力された表音文字または表音文字列を対応する表意文字に変換して、ユーザが選択する表意文字を入力する文字変換装置における文字入力方法において、上記文字変換装置は、文字候補抽出手段と、候補順序決定手段と、表示制御手段とを備えており、上記文字候補抽出手段が、ユーザにより選択された表意文字を受け付けて、該表意文字に関連付けられている表意文字列を、上記表意文字と該表意文字を含む表意文字列とを関連付けて記録する文字列記録部から、表意文字列の候補として抽出する第1ステップと、上記候補順序決定手段が、上記第1ステップにて抽出した候補の表示順序を決定する第2ステップと、上記表示制御手段が、上記第2ステップにて決定した表示順序に基づいて候補を表示するようデータを出力する第3ステップとを含み、上記第2ステップは、過去に入力された表意文字または表意文字列と、該表意文字または表意文字列の直前よりさらに前方に入力された前方文字または前方文字列とを対応付けて、上記前方文字または前方文字列の後方に該表意文字または表意文字列が入力される可能性の高さを示す関連度を記憶する関連度記録部から、上記候補の前方に入力されている前方文字または前方文字列と、各候補との関連度を検出し、該関連度が高い候補ほど優先して表示されるよう表示順序を決定するステップを含むことを特徴としている。  The character input method according to the present invention is a character input method in a character conversion device for converting an input phonetic character or a phonetic character string into a corresponding ideogram and inputting an ideogram selected by a user. The conversion device includes character candidate extraction means, candidate order determination means, and display control means. The character candidate extraction means accepts an ideographic character selected by a user and associates it with the ideographic character. A first step of extracting the ideographic character string as a candidate for the ideographic character string from a character string recording unit for recording the ideographic character string in association with the ideographic character string including the ideographic character, and the candidate order determining means, A second step of determining the display order of the candidates extracted in the first step, and the display control means displays the candidates based on the display order determined in the second step A third step of outputting the data, wherein the second step includes an ideographic character or ideographic character string input in the past, and a forward character or a forward character input in front of the ideographic character or ideographic character string. From the relevance level recording unit that stores a relevance level that indicates a high possibility that the ideographic character or the ideographic character string is input behind the front character or the front character string in association with the front character string. Detecting a degree of association between the forward character or the forward character string input in front of each candidate and each candidate, and determining a display order so that a candidate having a higher degree of association is displayed with priority. It is said.

本発明は上述した各実施形態、各実施例に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。  The present invention is not limited to the above-described embodiments and examples, and various modifications can be made within the scope of the claims. That is, embodiments obtained by combining technical means appropriately modified within the scope of the claims are also included in the technical scope of the present invention.

本発明は、読み(表音文字)を変換する、特に読みを漢字に変換する各種装置に適用することができる。  The present invention can be applied to various devices that convert readings (phonetic characters), and in particular, convert readings to kanji.

Claims (22)

入力された1以上の表音文字よりなる入力文字列を変換文字に変換し、当該変換文字からなる単語を決定できる文字変換装置において、
変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報、および、入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、
単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報、および、単語の先頭となる変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、
入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得手段と、
取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得手段と、
を備えていることを特徴とする、文字変換装置。
In a character conversion device capable of converting an input character string made up of one or more input phonograms into converted characters and determining a word made up of the converted characters,
Conversion character correspondence information in which conversion character identification information for identifying a conversion character and conversion character phonetic information indicating a phonetic of the conversion character are associated with each other, an input phonetic character, and the phonetic A conversion character dictionary having a conversion character index in which the conversion character identification information having a character as the head of the conversion character phonetic information is associated with conversion character storage destination information indicating a storage destination in the conversion character correspondence information. When,
Word identification information for identifying a word, word correspondence information in which word phonetic information indicating the phonetic expression of the word is associated, and head conversion character identification for identifying a conversion character that is the head of the word A word dictionary having information and a word index in which word storage destination information indicating a storage destination in the word correspondence information of a word having a conversion character indicated by the head conversion character identification information at the head is associated with each other;
Conversion character identification information that refers to the conversion character dictionary based on the input phonetic character of the input character string and has the head phonetic character of the input character string as the head of the conversion character phonetic information First conversion character acquisition means for acquiring
Based on the acquired head conversion character identification information, referring to the word dictionary, a word acquisition means for acquiring a word having a conversion character at the head indicated by the head conversion character identification information;
A character conversion device comprising:
上記先頭変換文字取得手段が取得した先頭変換文字識別情報が示す先頭変換文字を、ユーザが選択可能に表示部に表示する表示制御手段と、
上記ユーザにより選択された先頭変換文字を受け付ける受付手段と、を備え、
上記単語取得手段は、上記選択された先頭変換文字の先頭変換文字識別情報に基づいて、単語を取得する処理を行うことを特徴とする請求項1に記載の文字変換装置。
Display control means for displaying on the display unit the head conversion character indicated by the head conversion character identification information acquired by the head conversion character acquisition means so that the user can select it;
Receiving means for receiving the first conversion character selected by the user,
The character conversion apparatus according to claim 1, wherein the word acquisition unit performs a process of acquiring a word based on the first conversion character identification information of the selected first conversion character.
上記変換文字対応情報では、さらに、上記変換文字識別情報に、該変換文字識別情報が示す変換文字についての表示補助情報が対応付けられており、
上記表示制御手段は、上記表示補助情報に基づき、先頭変換文字を並べ替えて、ユーザが選択可能に表示部に表示することを特徴とする請求項2に記載の文字変換装置。
In the converted character correspondence information, display auxiliary information about the converted character indicated by the converted character identification information is further associated with the converted character identification information,
3. The character conversion apparatus according to claim 2, wherein the display control means rearranges the head conversion characters based on the display auxiliary information, and displays them on the display unit so that the user can select them.
上記単語辞書の単語インデックスは、
単語の先頭となる先頭変換文字毎に、上記先頭変換文字識別情報と、単語の2文字目の先頭の表音文字である2文字目先頭表音文字との組み合わせに対して、上記単語対応情報における格納先が割り振られていることを特徴とする請求項1〜3の何れか1項に記載の文字変換装置。
The word index of the above word dictionary is
For each head conversion character that is the head of a word, the above word correspondence information for the combination of the head conversion character identification information and the second head phonetic character that is the first phonetic character of the second character of the word The character conversion device according to any one of claims 1 to 3, wherein a storage location is assigned.
上記変換文字対応情報では、さらに、上記変換文字識別情報に、該変換文字識別情報が示す変換文字についての取得補助情報が対応付けられており、
上記先頭変換文字取得手段は、上記取得補助情報を基に上記変換文字識別情報を取得することを特徴とする請求項1〜4の何れか1項に記載の文字変換装置。
In the conversion character correspondence information, acquisition auxiliary information about the conversion character indicated by the conversion character identification information is further associated with the conversion character identification information,
The character conversion device according to claim 1, wherein the head conversion character acquisition unit acquires the conversion character identification information based on the acquisition auxiliary information.
上記取得補助情報は、以下の4つの情報に分類されることを特徴とする請求項5に記載の文字変換装置。
(1)変換文字識別情報が示す変換文字が、上記入力文字列に対して、無条件に取得対象となるという情報
(2)変換文字識別情報が示す変換文字が、上記入力文字列が1文字では、取得対象外になるという情報
(3)変換文字識別情報が示す変換文字が、上記入力文字列が2文字以下では、取得対象外になるという情報
(4)変換文字識別情報が示す変換文字が、上記入力文字列が3文字以下では、取得対象外になるとういう情報
6. The character conversion apparatus according to claim 5, wherein the acquisition auxiliary information is classified into the following four pieces of information.
(1) Information that the conversion character indicated by the conversion character identification information is unconditionally acquired with respect to the input character string. (2) The conversion character indicated by the conversion character identification information is one character of the input character string. (3) Information that the converted character indicated by the converted character identification information is not acquired if the input character string is 2 characters or less (4) The converted character indicated by the converted character identification information However, if the input string is 3 characters or less
上記単語対応情報では、単語の先頭の変換文字が同一のものが1グループとしてまとめられていることを特徴とする請求項1〜6の何れか1項に記載の文字変換装置。  7. The character conversion apparatus according to claim 1, wherein the word correspondence information includes a group of characters having the same conversion character at the beginning of the word. さらに、各上記グループ内で、単語は、単語の先頭の表音文字の所定の配列順に並べられていることを特徴とする請求項7に記載の文字変換装置。  Furthermore, in each said group, the word is arranged in the predetermined arrangement | sequence order of the phonogram of the head of a word, The character conversion apparatus of Claim 7 characterized by the above-mentioned. 上記変換文字は漢字であり、
上記変換文字対応情報では、漢字の先頭の表音文字が同一、かつ、声調コードが同一の、上記変換文字識別情報である漢字識別情報がグループとしてまとめられており、
中国語変換装置として用いられることを特徴とする請求項1〜8の何れか1項に記載の文字変換装置。
The conversion character is Kanji,
In the conversion character correspondence information, the kanji identification information which is the conversion character identification information having the same phonogram at the beginning of the kanji and the same tone code is grouped together.
It is used as a Chinese conversion apparatus, The character conversion apparatus of any one of Claims 1-8 characterized by the above-mentioned.
上記変換文字対応情報では、各上記グループで、上記漢字識別情報が、漢字の先頭の表音文字の所定の配列順に並べてられていることを特徴とする請求項9に記載の文字変換装置。  10. The character conversion apparatus according to claim 9, wherein in the converted character correspondence information, the kanji identification information is arranged in a predetermined arrangement order of the first phonetic characters of the kanji in each of the groups. 前記変換文字インデックスでは、上記漢字の先頭の表音文字が所定の配列順となっており、各上記グループの上記変換文字対応情報での格納先を示す情報を上記変換文字格納情報として、上記漢字の先頭の表音文字に対応付けられていることを特徴とする請求項9または10に記載の文字変換装置。  In the conversion character index, the first phonetic characters of the kanji are in a predetermined arrangement order, and information indicating the storage destination in the conversion character correspondence information of each group is used as the conversion character storage information, and the kanji The character conversion device according to claim 9, wherein the character conversion device is associated with the first phonogram of the character. 上記漢字は簡体字であり、かつ、上記表音はピンインで表現される、中国語変換装置として用いられることを特徴とする請求項9〜11の何れか1項に記載の文字変換装置。  The character conversion device according to any one of claims 9 to 11, wherein the character conversion device is used as a Chinese conversion device in which the kanji is simplified and the phonetic is expressed in pinyin. 上記漢字は繁体字であり、かつ、上記表音は注音で表現される、中国語変換装置として用いられることを特徴とする請求項9〜11の何れか1項に記載の文字変換装置。  The character conversion device according to any one of claims 9 to 11, wherein the character conversion device is used as a Chinese conversion device in which the Chinese character is a traditional character and the phonetic sound is expressed by a note. 入力された1以上の表音文字よりなる入力文字列を変換文字に変換し、当該変換文字からなる単語を決定することができる文字変換装置の制御方法において、
変換文字を識別するための変換文字識別情報と、該変換文字の表音を示す変換文字表音情報とが対応付けられた変換文字対応情報、および、入力される表音文字と、該表音文字を上記変換文字表音情報の先頭として持つ上記変換文字識別情報の、上記変換文字対応情報での格納先を示す変換文字格納先情報とが対応付けられた変換文字インデックス、を有する変換文字辞書と、
単語を識別するための単語識別情報と、該単語の表音を示す単語表音情報とが対応付けられた単語対応情報、および、単語の先頭となる変換文字を識別するための先頭変換文字識別情報と、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語の、上記単語対応情報での格納先を示す単語格納先情報とが対応付けられた単語インデックス、を有する単語辞書と、
を用いて、
入力された上記入力文字列の先頭の表音文字を基に、上記変換文字辞書を参照し、該入力文字列の先頭の表音文字を上記変換文字表音情報の先頭として持つ変換文字識別情報を取得する先頭変換文字取得ステップと、
取得された上記先頭変換文字識別情報を基に、上記単語辞書を参照し、該先頭変換文字識別情報が示す変換文字を先頭に持つ単語を取得する単語取得ステップと、
を含む処理を行うことを特徴とする、文字変換装置の制御方法。
In a control method of a character conversion device capable of converting an input character string composed of one or more input phonograms into converted characters and determining a word composed of the converted characters,
Conversion character correspondence information in which conversion character identification information for identifying a conversion character and conversion character phonetic information indicating a phonetic of the conversion character are associated with each other, an input phonetic character, and the phonetic A conversion character dictionary having a conversion character index in which the conversion character identification information having a character as the head of the conversion character phonetic information is associated with conversion character storage destination information indicating a storage destination in the conversion character correspondence information. When,
Word identification information for identifying a word, word correspondence information in which word phonetic information indicating the phonetic expression of the word is associated, and head conversion character identification for identifying a conversion character that is the head of the word A word dictionary having information and a word index in which word storage destination information indicating a storage destination in the word correspondence information of a word having a conversion character indicated by the head conversion character identification information at the head is associated with each other;
Using,
Conversion character identification information that refers to the conversion character dictionary based on the input phonetic character of the input character string and has the head phonetic character of the input character string as the head of the conversion character phonetic information A first conversion character acquisition step for acquiring
A word acquisition step of referring to the word dictionary based on the acquired head conversion character identification information and acquiring a word having a conversion character at the head indicated by the head conversion character identification information;
A method for controlling a character conversion device, comprising performing processing including:
請求項1〜13および17〜22のいずれか1項に記載の文字変換装置の各手段としてコンピュータを機能させるための文字変換プログラム。  The character conversion program for functioning a computer as each means of the character conversion apparatus of any one of Claims 1-13 and 17-22. 請求項15に記載の制御プログラムを記録した、コンピュータ読取可能な記録媒体。  A computer-readable recording medium on which the control program according to claim 15 is recorded. 上記変換文字識別情報には、該変換文字識別情報が示す変換文字についての表示補助情報が対応付けられており、
上記先頭変換文字取得手段が取得した先頭変換文字識別情報が示す先頭変換文字の表示順序を、上記表示補助情報に基づき決定する順序決定手段と、
上記順序決定手段が決定した表示順序に基づいて上記先頭変換文字をユーザが選択可能に表示部に表示する表示制御手段とを備えていることを特徴とする請求項1に記載の文字変換装置。
The conversion character identification information is associated with display auxiliary information about the conversion character indicated by the conversion character identification information,
Order determining means for determining the display order of the head conversion characters indicated by the head conversion character identification information acquired by the head conversion character acquisition means based on the display auxiliary information;
2. The character conversion apparatus according to claim 1, further comprising display control means for displaying the first converted character on the display unit so that the user can select the first converted character based on the display order determined by the order determining means.
ユーザにより選択された上記先頭変換文字を学習文字として学習語記録部に記録する学習制御手段を備え、
上記順序決定手段は、先頭変換文字が上記学習語記録部に記録された学習文字であるか否かを示す表示補助情報に基づいて、上記先頭変換文字取得手段が取得した先頭変換文字が学習文字であるか否かを判断して、学習文字である上記先頭変換文字が他の先頭変換文字に優先して表示されるように表示順序を決定することを特徴とする請求項17に記載の文字変換装置。
Learning control means for recording the first conversion character selected by the user as a learning character in a learning word recording unit,
The order determination means determines whether the first conversion character acquired by the first conversion character acquisition means is a learning character based on display auxiliary information indicating whether the first conversion character is a learning character recorded in the learning word recording unit. 18. The character according to claim 17, wherein the display order is determined so that the first conversion character as a learning character is displayed with priority over other first conversion characters. Conversion device.
上記学習語記録部には、上記先頭変換文字が学習文字として上記学習制御手段によって記録された時期を示す学習時期が、上記表示補助情報として各先頭変換文字に対応付けて記憶されており、
上記順序決定手段は、上記学習時期が新しい先頭変換文字ほど優先して表示されるように表示順序を決定することを特徴とする請求項18に記載の文字変換装置。
In the learning word recording unit, a learning time indicating a time when the first conversion character is recorded as a learning character by the learning control unit is stored in association with each first conversion character as the display auxiliary information,
19. The character conversion apparatus according to claim 18, wherein the order determination means determines the display order so that the first conversion character with the new learning time is displayed with priority.
上記単語識別情報には、該単語識別情報が示す単語についての表示補助情報が対応付けられており、
上記単語取得手段が取得した単語の表示順序を、上記表示補助情報に基づき決定する順序決定手段と、
上記順序決定手段が決定した表示順序に基づいて上記単語をユーザが選択可能に表示部に表示する表示制御手段とを備えていることを特徴とする請求項1に記載の文字変換装置。
The word identification information is associated with display auxiliary information about the word indicated by the word identification information,
Order determination means for determining the display order of the words acquired by the word acquisition means based on the display auxiliary information;
2. The character conversion device according to claim 1, further comprising display control means for displaying the word on the display unit so that the user can select the word based on the display order determined by the order determination means.
ユーザにより選択された上記単語を学習単語として学習語記録部に記録する学習制御手段を備え、
上記順序決定手段は、単語が上記学習語記録部に記録された学習単語であるか否かを示す表示補助情報に基づいて、上記単語取得手段が取得した単語が学習単語であるか否かを判断して、学習単語である上記単語が他の単語に優先して表示されるように表示順序を決定することを特徴とする請求項20に記載の文字変換装置。
Learning control means for recording the word selected by the user as a learning word in a learning word recording unit;
The order determination means determines whether the word acquired by the word acquisition means is a learning word based on display auxiliary information indicating whether the word is a learning word recorded in the learning word recording unit. 21. The character conversion device according to claim 20, wherein the display order is determined so that the learning word is displayed with priority over other words.
上記学習語記録部には、上記単語が学習単語として上記学習制御手段によって記録された時期を示す学習時期が、上記表示補助情報として各単語に対応付けて記憶されており、
上記順序決定手段は、上記学習時期が新しい単語ほど優先して表示されるように表示順序を決定することを特徴とする請求項21に記載の文字変換装置。
The learning word recording unit stores a learning time indicating the time when the word was recorded as a learning word by the learning control unit in association with each word as the display auxiliary information,
The character conversion apparatus according to claim 21, wherein the order determination means determines a display order so that a word with a newer learning time is displayed with higher priority.
JP2008528762A 2006-08-10 2007-07-18 Character conversion device and method for controlling character conversion device Active JP4890551B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008528762A JP4890551B2 (en) 2006-08-10 2007-07-18 Character conversion device and method for controlling character conversion device

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006218970 2006-08-10
JP2006218970 2006-08-10
JP2008528762A JP4890551B2 (en) 2006-08-10 2007-07-18 Character conversion device and method for controlling character conversion device
PCT/JP2007/064209 WO2008018274A1 (en) 2006-08-10 2007-07-18 Character converting device and character converting device control method

Publications (2)

Publication Number Publication Date
JPWO2008018274A1 JPWO2008018274A1 (en) 2009-12-24
JP4890551B2 true JP4890551B2 (en) 2012-03-07

Family

ID=39032808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008528762A Active JP4890551B2 (en) 2006-08-10 2007-07-18 Character conversion device and method for controlling character conversion device

Country Status (3)

Country Link
JP (1) JP4890551B2 (en)
CN (1) CN101553810A (en)
WO (1) WO2008018274A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9195645B2 (en) * 2012-07-30 2015-11-24 Microsoft Technology Licensing, Llc Generating string predictions using contexts
JP6491438B2 (en) * 2014-08-29 2019-03-27 株式会社日立社会情報サービス Migration support device
CN105404677B (en) * 2015-11-20 2018-12-18 四川神琥科技有限公司 A kind of search method based on tree structure
CN105426490B (en) * 2015-11-20 2019-03-26 四川神琥科技有限公司 A kind of indexing means based on tree structure
JP7446943B2 (en) 2020-08-18 2024-03-11 株式会社日立製作所 Information representation creation support device, information representation creation support method, and computer program
JP7543788B2 (en) * 2020-08-31 2024-09-03 株式会社リコー Display device, input method, and program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0388662A (en) * 1989-08-31 1991-04-15 Toshiba Seiki Kk form connection device
JPH04225415A (en) * 1990-12-26 1992-08-14 Mitsubishi Electric Corp Pinyin kanji input system
JP2004005379A (en) * 2002-04-16 2004-01-08 Fujitsu Ltd Information processing apparatus, information processing method, information processing program, and recording medium
JP2006050160A (en) * 2004-08-03 2006-02-16 Sharp Corp Chinese input device, Chinese input program, and Chinese input recording medium
JP2006155322A (en) * 2004-11-30 2006-06-15 Nec Fielding Ltd Input prediction dictionary system and input prediction method
JP2007188449A (en) * 2006-01-16 2007-07-26 Sharp Corp Character input device, copier equipped with character input device, character input method, control program, and recording medium

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0540946U (en) * 1991-10-29 1993-06-01 カシオ計算機株式会社 Word processor

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0388662A (en) * 1989-08-31 1991-04-15 Toshiba Seiki Kk form connection device
JPH04225415A (en) * 1990-12-26 1992-08-14 Mitsubishi Electric Corp Pinyin kanji input system
JP2004005379A (en) * 2002-04-16 2004-01-08 Fujitsu Ltd Information processing apparatus, information processing method, information processing program, and recording medium
JP2006050160A (en) * 2004-08-03 2006-02-16 Sharp Corp Chinese input device, Chinese input program, and Chinese input recording medium
JP2006155322A (en) * 2004-11-30 2006-06-15 Nec Fielding Ltd Input prediction dictionary system and input prediction method
JP2007188449A (en) * 2006-01-16 2007-07-26 Sharp Corp Character input device, copier equipped with character input device, character input method, control program, and recording medium

Also Published As

Publication number Publication date
JPWO2008018274A1 (en) 2009-12-24
CN101553810A (en) 2009-10-07
WO2008018274A1 (en) 2008-02-14

Similar Documents

Publication Publication Date Title
CN101004738B (en) Character input device and method, copy machine possessing character input device
US7061403B2 (en) Apparatus and method for input of ideographic Korean syllables from reduced keyboard
CN101292214B (en) Improved text entry in the shorthand interface on the keyboard
CN101067780B (en) Character inputting system and method for intelligent equipment
CN1154912C (en) Method and apparatus for entering text messages from a keypad
JP4829901B2 (en) Method and apparatus for confirming manually entered indeterminate text input using speech input
CN101681198A (en) Providing relevant text auto-completions
JP2006216044A (en) Dictionary learning method, apparatus used therefor, and input method and user terminal unit using the same method
JP4890551B2 (en) Character conversion device and method for controlling character conversion device
KR102182672B1 (en) The method for searching integrated multilingual consonant pattern and apparatus thereof
EP2994841A1 (en) Information processing apparatus, information processing method, and program
CN104635949A (en) Chinese character input device and method
CN1862472B (en) System and method for abbreviated handwriting input of ideographic language phrases by submitting partial words and/or partial strokes of any given word
US8296679B2 (en) Method of learning character segments from received text, and associated handheld electronic device
JP2013214187A (en) Character input device, method for controlling character input device, control program and recording medium
CN111857362A (en) Character input method and character input device
KR20200132070A (en) Apparatus and method for inputting chinese characters
KR20020021182A (en) Method and apparatus for inputting Chinese characters using information of tone
JP3376808B2 (en) Word input device and word input method
EP1665009A2 (en) Apparatus and method for input of ideographic korean syllables from reduced keyboard
HK1105314B (en) Character input device and its method with copying machine including the same
CN1991743A (en) Method and device for voice input method
CN110658923A (en) Method and device for quickly inputting pinyin and Chinese characters
CA2658586C (en) Learning character segments from received text
JP6507482B2 (en) Character input device, character input method, and character input program

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111122

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111214

R150 Certificate of patent or registration of utility model

Ref document number: 4890551

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3