JP4192142B2 - Dictionary registration device, dictionary registration method, and dictionary registration program - Google Patents
Dictionary registration device, dictionary registration method, and dictionary registration program Download PDFInfo
- Publication number
- JP4192142B2 JP4192142B2 JP2004349050A JP2004349050A JP4192142B2 JP 4192142 B2 JP4192142 B2 JP 4192142B2 JP 2004349050 A JP2004349050 A JP 2004349050A JP 2004349050 A JP2004349050 A JP 2004349050A JP 4192142 B2 JP4192142 B2 JP 4192142B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- notation
- dictionary
- conversion
- registration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
この発明は、辞書に登録されていない単語を辞書へ登録する辞書登録装置、辞書登録方法および辞書登録プログラムに関するものである。 The present invention relates to a dictionary registration device, a dictionary registration method, and a dictionary registration program for registering words that are not registered in a dictionary.
近年、パソコンや携帯電話等において日本語の文章を入力する手段として、一般にかな漢字変換システムが使用されている。また、最近では音声で文字を入力できる音声認識システムも使用され始めている。これらのシステムでは、ひらがなの入力文字を漢字仮名混じり文に変換する際、システムの辞書に登録されている単語の組合せの中で最適な表記列に変換する。従って、ユーザが希望する表記の単語が辞書に登録されていない場合には正しく変換されず、システムの辞書に登録されている単語の表記を適当に並べた誤った表記列に誤変換されてしまう。 In recent years, a kana-kanji conversion system is generally used as a means for inputting Japanese sentences on a personal computer or a mobile phone. Recently, voice recognition systems that can input characters by voice have begun to be used. In these systems, when hiragana input characters are converted into kanji-kana mixed sentences, they are converted into an optimal notation string among word combinations registered in the system dictionary. Therefore, if the word of the notation desired by the user is not registered in the dictionary, it is not correctly converted, and is erroneously converted into an incorrect notation string in which the notation of the word registered in the system dictionary is appropriately arranged. .
辞書登録装置は、このような不都合を解消するために、システムの辞書に登録されていない単語を辞書へ追加登録する装置である。しかし、ユーザが使用する単語のうち、どの単語がシステムの辞書に登録されていないかを事前にすべて調べることは困難である。通常は、ユーザが文章を入力中に誤変換が発生した時に、初めてその単語が辞書に登録されていないことを知ることになる。従って誤変換を減らすためには、ユーザが未登録単語の存在に気付くたびに随時その単語を辞書に追加登録しなければならない。 The dictionary registration apparatus is an apparatus that additionally registers words that are not registered in the system dictionary in order to eliminate such inconvenience. However, it is difficult to check in advance which words used by the user are not registered in the system dictionary. Normally, when an erroneous conversion occurs while the user is inputting a sentence, the user knows that the word is not registered in the dictionary for the first time. Therefore, in order to reduce erroneous conversion, every time the user notices the presence of an unregistered word, the word must be additionally registered in the dictionary as needed.
このようなユーザによる単語登録の手間を軽減させるため、ユーザが過去に作成した文書ファイルからシステムの辞書に登録されていない単語を抽出し、辞書に一括登録する機能が開発されている(例えば、特許文献1)。 In order to reduce the trouble of registering words by such a user, a function has been developed that extracts words that are not registered in the system dictionary from a document file created by the user in the past and collectively registers them in the dictionary (for example, Patent Document 1).
しかしながら、辞書に一括登録する機能を使用した場合においても、今後使用する可能性があるが今まで入力したことがないため文書ファイル中に存在しない単語は辞書に追加登録されないという問題があった。例えば、過去に作成した文書では「右肺上葉」という単語は使用していたが、「左肺上葉」という単語は使用していなかった場合、文書中からは「右肺上葉」という単語しか検出されないため、「左肺上葉」という単語は辞書に登録されない。そのため、後日ユーザが「左肺上葉」と入力した時には、誤変換が発生してしまう。 However, even when the function of batch registration in the dictionary is used, there is a problem that a word that does not exist in the document file is not additionally registered in the dictionary because it may be used in the future, but has not been input so far. For example, if the word “upper lobe of the right lung” was used in a document created in the past, but the word “upper lobe of the left lung” was not used, the word “upper lobe of the right lung” was used from the document. Since only the word is detected, the word “left upper lobe” is not registered in the dictionary. Therefore, when the user inputs “left upper lobe” at a later date, erroneous conversion occurs.
本発明は、上記に鑑みてなされたものであって、ユーザが入力した単語または文書から検出された未知語だけでなく、入力した単語の表記または検出された未知語の表記を、関連する単語の表記に変換するための表記変換規則に従って変換し、変換後の表記の単語も同時に辞書に追加登録することにより、今後入力する可能性のある単語の登録洩れをなくし、ユーザの単語登録の負荷を軽減するとともに文書入力時の誤変換を減少させる辞書登録装置、辞書登録方法および辞書登録プログラムを提供することを目的とする。 The present invention has been made in view of the above, and not only the word input by the user or the unknown word detected from the document, but also the related word notation of the input word or the detected unknown word By converting according to the notation conversion rules for converting to notation, and additionally registering the converted notation word in the dictionary at the same time, it eliminates the omission of registration of words that may be input in the future, and the load of user word registration An object of the present invention is to provide a dictionary registration device, a dictionary registration method, and a dictionary registration program that reduce the number of erroneous conversions during document input.
上述した課題を解決し、目的を達成するために、本発明は、単語と単語の属性情報とを対応づけた辞書を記憶する辞書記憶手段と、前記辞書に登録されていない未知語の入力を受付ける入力受付手段と、前記未知語の表記の一部または全部と同一の属性情報を持つ少なくとも1つの単語を前記辞書記憶手段から検索し、検索した単語と同一の属性情報を持つ前記未知語の表記の一部または全部を、検索した単語の表記に変換した少なくとも1つの変換単語を生成する表記変換手段と、前記変換単語および前記未知語を前記辞書に登録する単語登録手段と、を備えたことを特徴とする。 In order to solve the above-described problems and achieve the object, the present invention provides dictionary storage means for storing a dictionary in which words and word attribute information are associated with each other, and input of unknown words that are not registered in the dictionary. An input receiving means for receiving, and searching the dictionary storage means for at least one word having the same attribute information as a part or all of the notation of the unknown word; the unknown word having the same attribute information as the searched word; Notation conversion means for generating at least one conversion word obtained by converting a part or all of the notation into a search word expression; and word registration means for registering the conversion word and the unknown word in the dictionary It is characterized by that.
また、本発明は、上記装置を実行することができる辞書登録方法および辞書登録プログラムである。 The present invention also provides a dictionary registration method and a dictionary registration program that can execute the above-described apparatus.
本発明によれば、辞書に登録されていない単語を辞書に登録するとき、登録のために入力した単語の表記だけでなく、入力した単語の表記と関連する単語の表記についても同時に登録することができる。このため、誤変換が発生するたびに未登録の単語を辞書に登録する手間を軽減し、誤変換の発生を減少させることができるという効果を奏する。 According to the present invention, when a word not registered in the dictionary is registered in the dictionary, not only the notation of the word input for registration, but also the notation of the word related to the input word notation is registered at the same time. Can do. For this reason, it is possible to reduce the trouble of registering an unregistered word in the dictionary every time erroneous conversion occurs, and to reduce the occurrence of erroneous conversion.
以下に添付図面を参照して、この発明にかかる辞書登録装置、辞書登録方法および辞書登録プログラムの最良な実施の形態を詳細に説明する。 Exemplary embodiments of a dictionary registration device, a dictionary registration method, and a dictionary registration program according to the present invention will be explained below in detail with reference to the accompanying drawings.
(第1の実施の形態)
第1の実施の形態にかかる辞書登録装置は、ユーザが入力した新語の表記を当該新語と関連する表記に変換し、変換した表記の単語も一括して辞書に登録するものである。
(First embodiment)
The dictionary registration apparatus according to the first embodiment converts the notation of a new word input by a user into a notation associated with the new word, and registers the converted notation words together in the dictionary.
図1は、第1の実施の形態にかかる辞書登録装置100の構成を示すブロック図である。同図に示すように、辞書登録装置100は、入力受付部101と、表記変換部102と、単語登録部103と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置100は、ハードディスクドライブ装置(HDD:Hard Disk Drive)に表記変換規則表120と、辞書121とを保存している。HDDは、本発明における表記変換規則記憶手段および辞書記憶手段に相当する。
FIG. 1 is a block diagram illustrating a configuration of the
入力受付部101は、ユーザが入力した新語または文書ファイルから検出された未知語の入力を受付けるものである。ここで、新語とは、辞書に未登録であると認識してユーザが入力した単語のことをいう。また、未知語とは、辞書に登録されていない単語のことをいい、新語も未知語に含まれる。
The
表記変換部102は、表記変換規則表120に従って入力受付部101が受付けた単語の表記の変換を行うものである。表記変換規則表120の詳細については後述する。
The
単語登録部103は、表記変換部102が変換した単語を変換表記確認画面に表示するためにユーザI/F110に渡すとともに、変換表記確認画面で登録を指定された単語を辞書121に登録するものである。変換表記確認画面の詳細については後述する。
The
ユーザI/F110は、ディスプレイ装置等の表示装置と、キーボードやマウスなどの入力装置であり、入力画面、変換表記確認画面、登録結果確認画面の表示を行うとともに、これらの画面からの入力操作を受付ける。
The user I / F 110 is a display device such as a display device and an input device such as a keyboard and a mouse. The user I /
表記変換規則表120は、単語の表記の変換規則を格納したものであり、表記変換部102によって参照される。図2は、表記変換規則表120の構造の一例を示す説明図である。同図の例に示すように、表記変換規則表120は、ある単語の表記に対する変換表記を格納している。例えば、表記“上”に対する変換表記として“下”が格納されている。変換表記は複数指定することができ、同図に示す例では、表記“1”に対しては“1”以外の1桁数字を示す2から9の数字を変換表記として指定している。
The notation conversion rule table 120 stores conversion rules for word notation, and is referred to by the
辞書121は、単語を保持する辞書であり、一般的なかな漢字変換システムや音声認識システムなどで使用される辞書である。図3は、辞書121の構造の一例を示す説明図である。同図に示すように、辞書121は、単語の表記と読みを格納している。辞書121には、これ以外の項目、例えば、品詞などを格納するように構成してもよい。
The
次に、このように構成された第1の実施の形態にかかる辞書登録装置100による未知語登録処理について説明する。図4は、第1の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。
Next, an unknown word registration process performed by the
まず、ユーザI/F110が、新語の入力画面を表示する(ステップS401)。図5は、入力画面の内容を示す模式図である。同図に示すように、入力画面には、読み入力フィールド501、表記入力フィールド502、品詞入力フィールド503、登録ボタン504、キャンセルボタン505が表示されている。各入力フィールドに入力後、登録ボタン504が押下されると入力した単語が受付けられる。キャンセルボタン505が押下された場合は、未知語登録処理を中止する。
First, the user I / F 110 displays a new word input screen (step S401). FIG. 5 is a schematic diagram showing the contents of the input screen. As shown in the figure, a
入力画面が表示されると、入力受付部101がユーザによる新語の入力を受付ける(ステップS402)。次に、表記変換部102が、入力を受付けた新語の中に表記変換規則表120の“表記”欄と一致する部分が含まれているか否かについて判断する(ステップS403)。入力を受付けた新語の表記と表記変換規則表120の表記との照合は、文字単位の最長一致文字列マッチングで行ってもよいし、新語の表記を形態素解析し、形態素に分割してから照合を行ってもよい。このように、新語の表記に含まれる部分文字列と表記変換規則表120の表記との一致判定は一般的なマッチング手法のいずれによって構成してもよい。
When the input screen is displayed, the
表記変換規則表120の“表記”欄と一致する部分が含まれていない場合は(ステップS403:NO)、単語登録部103は、受付けた新語を辞書121へ登録する(ステップS404)。一致する部分が含まれている場合は、(ステップS403:YES)表記変換部102は、該当する部分の表記に対応する変換表記を表記変換規則表120から取得し、入力を受付けた新語の該当部分の表記を取得した変換表記に変換する(ステップS405)。
When the portion that matches the “notation” column of the notation conversion rule table 120 is not included (step S403: NO), the
一致する部分文字列が複数ある場合は、その組み合わせの数に相当する個数の単語が、表記を変換した単語として生成される。例えば、入力を受付けた新語が“右肺上葉”であった場合、部分文字列“右”、“上”が表記変換規則表120の表記と一致する。従って、“右肺下葉”、“左肺上葉”、“左肺下葉”の3つの単語が表記を変換した単語として生成される。 When there are a plurality of matching partial character strings, the number of words corresponding to the number of combinations is generated as a converted word. For example, when the input new word is “upper right lobe”, the partial character strings “right” and “up” match the notation in the notation conversion rule table 120. Accordingly, the three words “lower right lobe”, “upper left lobe”, and “lower left lobe” are generated as converted words.
また、該当する部分の表記に対応する変換表記が複数指定されているときは、変換表記の数に相当する個数の単語が、表記を変換した単語として生成される。例えば、該当する部分の表記が数字の“1”であった場合、表記変換規則表120には対応する変換表記として数字の“2”から“9”までの8つの変換表記が指定されているため、“1”をそれぞれの数字に変換した8つの単語が表記を変換した単語として生成される。 When a plurality of conversion notations corresponding to the notation of the corresponding part are designated, the number of words corresponding to the number of conversion notations is generated as words obtained by converting the notation. For example, when the notation of the corresponding part is the number “1”, the notation conversion rule table 120 designates eight conversion notations from the numbers “2” to “9” as the corresponding conversion notations. Therefore, eight words obtained by converting “1” into respective numbers are generated as words obtained by converting the notation.
次に、ユーザI/F110が、変換した表記の単語を変換表記確認画面に表示する(ステップS406)。図6は、変換表記確認画面の内容を示す模式図である。同図に示すように、変換表記確認画面には、変換した単語の表記、読み、品詞が一覧表示され、個々の単語の左側にチェックボックス601が表示されている。また、変換表記確認画面の下部には、登録ボタン602、キャンセルボタン603が表示されている。
Next, the user I /
チェックボックス601をチェックすることにより、その右側に表示されている変換した表記の単語を辞書121に登録することが指定される。登録ボタン602が押下されると、指定された単語を辞書121に登録する。キャンセルボタン603が押下された場合は、未知語登録処理を中止する。
By checking the
なお、図6では、登録するか否かをチェックボックス601により指定することができるだけであるが、読みや品詞の修正も可能となるように変換表記確認画面を構成してもよい。
In FIG. 6, whether or not to register can only be specified by a
変換表記確認画面で登録ボタン602が押下されると、単語登録部103はチェックボックス601をチェックすることにより辞書121への登録が指定された表記が存在するか否かを判断する(ステップS407)。登録が指定された表記が存在しない場合は(ステップS407:NO)、単語登録部103は受付けた新語のみを辞書121へ登録する(ステップS404)。登録が指定された表記が存在する場合は(ステップS407:YES)、単語登録部103は、受付けた新語と登録が指定された表記を辞書121へ登録する(ステップS408)。
When the
次に、ユーザI/F110が、辞書121に登録した単語を登録結果確認画面に表示する(ステップS409)。図7は、登録結果確認画面の内容を示す模式図である。同図に示すように、登録結果確認画面には、辞書121に登録した単語の表記、読み、品詞が一覧表示され、画面の下部には、閉じるボタン701が表示されている。閉じるボタン701を押下すると、未知語登録処理が終了する。
Next, the user I /
図8は、第1の実施の形態にかかる辞書登録装置100において、上述した未知語登録処理に従って、ユーザにより入力された新語と表記を変換した単語を辞書121に登録する処理の例を示した説明図である。
FIG. 8 shows an example of processing for registering a new word input by the user and a word converted from the notation into the
図8に示す例では、ユーザが“右肺上葉”を新語として入力した場合が示されている。この場合、表記変換規則表120との照合により、入力された新語の中の“右”、“上”の部分文字列が表記変換規則表120の表記と一致するため、それぞれ変換表記“左”、“下”が表記変換規則表120から取得される。そして、取得した2つの変換表記を1つずつまたは2つ同時に置き換えた単語3つが生成され、入力された新語を加えた合計4つの単語(“右肺上葉”、“右肺下葉”、“左肺上葉”、“左肺下葉”)が辞書121に追加登録される。
In the example shown in FIG. 8, the case where the user inputs “upper right lobe” as a new word is shown. In this case, the collation with the notation conversion rule table 120 matches the “right” and “upper” partial character strings in the input new word with the notation of the notation conversion rule table 120. , “Below” is acquired from the notation conversion rule table 120. Then, three words are generated by replacing the obtained two conversion expressions one by one or two at the same time, and a total of four words (“upper right lobe”, “lower right lobe”, "Left upper lobe" and "Left lower lobe") are additionally registered in the
なお、第1の実施の形態にかかる辞書登録装置100においては、変換した表記や登録結果を画面に表示してユーザが確認できるように構成しているが、確認画面の表示やユーザによる単語の選別をせずに、変換した表記をそのまま自動登録するように構成してもよい。
Note that the
このように、第1の実施の形態にかかる辞書登録装置100では、ユーザが入力した新語だけでなく、予め定められた表記変換規則に従って、入力された新語の表記を変換した表記の単語も同時に登録することができ、ユーザが辞書121に登録されていない単語を登録する負担を軽減することができる。また、一度の登録処理で複数の単語を登録することができるため、その後の誤変換の発生を減少させることができる。
As described above, in the
(第2の実施の形態)
第2の実施の形態にかかる辞書登録装置は、ユーザが指定した文書ファイルから、辞書に登録されていない未知語を検出し、検出した未知語の表記を関連する表記に変換し、変換した表記の単語も一括して辞書に登録するものである。
(Second Embodiment)
The dictionary registration device according to the second embodiment detects an unknown word that is not registered in the dictionary from a document file specified by the user, converts the detected unknown word notation into a related notation, and converts the notation Are also registered in the dictionary.
すなわち、第2の実施の形態にかかる辞書登録装置900は、ユーザが入力した新語を受付ける代わりに、ユーザが指定した文書ファイルから未知語を検出し、検出した未知語を入力する単語として受付ける点が、第1の実施の形態にかかる辞書登録装置100と相違している。
That is, the
図9は、第2の実施の形態にかかる辞書登録装置900の構成を示すブロック図である。同図に示すように、辞書登録装置900は、未知語検出部901と、入力受付部101と、表記変換部102と、単語登録部103と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置900は、HDDに表記変換規則表120と、辞書121とを保存している。
FIG. 9 is a block diagram illustrating a configuration of a
第2の実施の形態においては、未知語検出部901を追加したことが第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる辞書登録装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。
The second embodiment is different from the first embodiment in that an
未知語検出部901は、ユーザが指定した文書ファイルから辞書121に登録されていないすべての未知語を検出し、検出した未知語を入力受付部101に渡す処理を行う。
The unknown
次に、このように構成された第2の実施の形態にかかる辞書登録装置900による未知語登録処理について説明する。図10は、第2の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。
Next, an unknown word registration process performed by the
まず、未知語検出部901が、ユーザが指定した文書ファイルから未知語を検出する(ステップS1001)。次に、入力受付部101が、未知語検出部901が検出した未知語の入力を受付け(ステップS1002)、表記変換部102が、入力を受付けた未知語の中に、表記変換規則表120の“表記”欄と一致する部分が含まれているか否かについて判断する(ステップS1003)。
First, the unknown
一致する部分が含まれていない場合は(ステップS1003:NO)、単語登録部103が検出した未知語を辞書121へ登録する(ステップS1004)。一致する部分が含まれている場合は(ステップS1003:YES)、表記変換部102は、当該部分の表記を、表記変換規則表120の“変換表記”欄に格納されている表記に変換する(ステップS1005)。
If the matching part is not included (step S1003: NO), the unknown word detected by the
次に、単語登録部103は、検出した未知語と、上述の処理で変換された表記の単語を辞書121へ登録する(ステップS1006)。その後、未知語検出部901は、ユーザにより指定された文書ファイル内のすべての未知語が処理されたか否かを判断し(ステップS1007)、すべての未知語が処理されていない場合は(ステップS1007:NO)、次の未知語の検出処理に遷移する(ステップS1001)。
Next, the
すべての未知語が処理された場合は(ステップS1007:YES)、未知語登録処理を終了する。 If all unknown words have been processed (step S1007: YES), the unknown word registration process ends.
図11は、第2の実施の形態にかかる辞書登録装置900において、上述した未知語登録処理に従って、ユーザが指定した文書ファイルから未知語を検出して辞書121に登録する処理の例を示した説明図である。
FIG. 11 shows an example of processing for detecting an unknown word from a document file designated by the user and registering it in the
図11に示す例では、ユーザにより“所見ファイル001”が入力する文書ファイルとして指定された場合が示されている。当該文書ファイルから、同図に示すように、辞書121に登録されていない単語“右肺上葉”が未知語として検出される。検出された未知語と表記変換規則表120との照合により、検出された未知語の中の“右”、“上”の部分文字列が表記変換規則表120の表記と一致するため、それぞれ変換表記“左”、“下”が表記変換規則表120から取得される。そして、取得した2つの変換表記を1つずつまたは2つ同時に置き換えた単語3つが生成され、検出された未知語を加えた合計4つの単語(“右肺上葉”、“右肺下葉”、“左肺上葉”、“左肺下葉”)が辞書121に追加登録される。
In the example shown in FIG. 11, a case where “finding file 001” is designated as an input document file by the user is shown. From the document file, as shown in the figure, the word “upper right lobe” that is not registered in the
この後、同図には示していないが、指定された文書ファイルから次の未知語を検出し、表記変換処理、辞書登録処理が繰り返される。 Thereafter, although not shown in the figure, the next unknown word is detected from the designated document file, and the notation conversion process and the dictionary registration process are repeated.
なお、第2の実施の形態ではユーザI/F110上に画面を表示していないが、変換した表記を確認する変換表記確認画面や、辞書121に登録した結果を確認する登録結果確認画面を表示するように構成してもよい。
Although the screen is not displayed on the user I /
このように、第2の実施の形態にかかる辞書登録装置900では、ユーザが指定した文書ファイルから未知語を検出し、検出した未知語とともに、予め定められた表記変換規則に従って、検出した未知語の表記を変換した表記の単語も同時に登録することができるため、ユーザが辞書に登録されていない単語を登録する負担を軽減することができる。また、一度の登録処理で複数の単語を登録することができるため、その後の誤変換の発生を減少させることができる。
As described above, in the
(第3の実施の形態)
第3の実施の形態にかかる辞書登録装置は、ユーザが入力した新語の表記を当該新語と関連する表記に変換し、変換した表記が予め定められた辞書登録の登録条件を満たさない場合には、変換した表記を構成要素に分割して、分割した構成要素の中で辞書に未登録の構成要素をユーザが入力した新語とともに辞書に登録するものである。
(Third embodiment)
The dictionary registration device according to the third embodiment converts the notation of a new word input by the user into a notation associated with the new word, and the converted notation does not satisfy a predetermined registration condition for dictionary registration. Then, the converted notation is divided into constituent elements, and among the divided constituent elements, constituent elements not registered in the dictionary are registered in the dictionary together with new words input by the user.
図12は、第3の実施の形態にかかる辞書登録装置1200の構成を示すブロック図である。同図に示すように、辞書登録装置1200は、入力受付部101と、表記変換部102と、単語登録部103と、変換表記判定部1201と、変換表記分割部1202と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置1200は、HDDに表記変換規則表120と、辞書121とを保存している。
FIG. 12 is a block diagram illustrating a configuration of a
第3の実施の形態においては、変換表記判定部1201と、変換表記分割部1202とを追加したことが第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる辞書登録装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。
The third embodiment is different from the first embodiment in that a conversion
変換表記判定部1201は、表記変換部102が変換した表記が、予め定められた辞書登録のための登録条件を満たすか否かを判定する。変換表記分割部1202は、変換表記判定部1201により登録条件を満たさないと判定された表記を構成要素に分割し、辞書121に未登録の構成要素を選別する処理を行う。
The conversion
次に、このように構成された第3の実施の形態にかかる辞書登録装置1200による未知語登録処理について説明する。図13は、第3の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。
Next, an unknown word registration process performed by the
ステップS1301からステップS1305までの、入力画面表示処理、新語入力受付処理、表記変換処理は、第1の実施の形態にかかる辞書登録装置100におけるステップS401からステップS405までと同様の処理なので、その説明を省略する。
The input screen display process, new word input reception process, and notation conversion process from step S1301 to step S1305 are the same as the process from step S401 to step S405 in the
表記変換部102が入力された新語の表記を変換した後、変換表記判定部1201が、変換した表記が登録条件を満たすか否かを判断する(ステップS1306)。この場合、表記の変換により生成された単語の個数や文字列長が予め定められた上限値を超えないことなどを登録条件とするように構成することができる。このように構成することにより、例えば変換により生成した単語の個数が非常に多いため、すべて登録するとその後追加登録できる単語数が制限されてしまうといった不都合を回避することができる。
After the
登録条件を満たさない場合は(ステップS1306:NO)、変換表記分割部1202が、入力された新語の表記を構成要素に分割する(ステップS1307)。分割の方法としては、新語の表記のうち表記が変換された部分とそれ以外の部分に分割するように構成してもよいし、新語の表記に対して形態素解析を行って、形態素単位に分割するように構成してもよい。次に、変換表記分割部1202は、分割した構成要素から、辞書121に未登録の構成要素を選別する(ステップS1308)。辞書121に既に登録されている構成要素をさらに登録する必要がないためである。
If the registration condition is not satisfied (step S1306: NO), the conversion
登録条件を満たす場合(ステップS1306:YES)、および、辞書121に未登録の構成要素が選別された後、ユーザI/F110が変換表記確認画面を表示する(ステップS1309)。ステップS1310からステップS1312までの、登録指定の判定処理、辞書121への登録処理、登録結果確認画面表示処理は、第1の実施の形態にかかる辞書登録装置100におけるステップS407からステップS409までと同様の処理なので、その説明を省略する。
When the registration condition is satisfied (step S1306: YES), and after unregistered components are selected in the
図14は、第3の実施の形態にかかる辞書登録装置1200において、上述した未知語登録処理に従って、ユーザが入力した新語の登録条件を判定し、新語を分割した構成要素を辞書121に登録する処理の例を示した説明図である。この例では、変換した表記の数が上限値10を超えないことが登録条件として指定されていることを前提とする。
FIG. 14 is a diagram illustrating a
図14に示す例では、ユーザが“T2強調像”を新語として入力した場合が示されている。この場合、表記変換規則表120との照合により、入力された新語の中の“T”、“2”の部分文字列が表記変換規則表120の表記と一致するため、それぞれ変換表記“A”〜“S”および“U”〜“Z”(アルファベット25種)、“1”および“3”〜“9”(数字8種)が表記変換規則表120から取得される。 In the example illustrated in FIG. 14, a case where the user inputs “T2-weighted image” as a new word is illustrated. In this case, since the partial character strings “T” and “2” in the input new word match the notation of the notation conversion rule table 120 by collation with the notation conversion rule table 120, the conversion notation “A” respectively. “S” and “U” to “Z” (25 alphabets), “1” and “3” to “9” (8 numbers) are acquired from the notation conversion rule table 120.
この結果、入力された新語を加えると、合計で26×9=234個の単語が生成される。これは、変換した表記の数が10を超えないこととした登録条件を満たさないため、入力された新語の表記の分割が行われる。この例では、新語の表記のうち表記が変換された部分とそれ以外の部分に分割する方法により、入力された新語“T2強調像”は“T”、“2”、“強調像”の3つの構成要素に分割される。さらに、“T”、“2”は通常、辞書121に登録されているため、辞書121に登録されていない“強調像”のみが選別され、辞書121に追加登録される。これにより、その後、例えば“T1強調像”と入力された場合でも、“T”、“1”、“強調像”の3つの単語列として正しく変換することができるようになる。
As a result, when the input new word is added, a total of 26 × 9 = 234 words are generated. Since this does not satisfy the registration condition that the number of converted expressions does not exceed 10, the input new word expressions are divided. In this example, the input new word “T2 weighted image” is divided into three parts “T”, “2”, and “highlighted image” by dividing the new word notation into a part where the notation is converted and a part other than that. Divided into two components. Furthermore, since “T” and “2” are normally registered in the
なお、第3の実施の形態にかかる辞書登録装置1200においては、変換した表記や登録結果を画面に表示してユーザが確認できるように構成しているが、確認画面の表示やユーザによる単語の選別をせずに、変換した表記をそのまま自動登録するように構成してもよい。
Note that the
このように、第3の実施の形態にかかる辞書登録装置1200では、変換した表記が予め定められた登録条件を満たす場合にだけ変換した表記を辞書に登録することで、不必要な変換表記の登録を回避することができる。また、登録条件を満たさない場合には、入力された新語を構成する構成要素の中で辞書に未登録の構成要素だけを登録することで、その後の誤変換を回避することができる。
As described above, in the
(第4の実施の形態)
第4の実施の形態にかかる辞書登録装置は、ユーザが指定した文書ファイルから、辞書に登録されていない未知語を検出し、検出した未知語の表記を関連する表記に変換し、変換した表記が予め定められた辞書登録の登録条件を満たさない場合には、変換した表記を構成要素に分割して、分割した構成要素の中で辞書に未登録の構成要素をユーザが入力した新語とともに辞書に登録するものである。
(Fourth embodiment)
The dictionary registration device according to the fourth exemplary embodiment detects an unknown word that is not registered in the dictionary from a document file specified by the user, converts the detected unknown word notation into a related notation, and converts the notation If the registration condition does not satisfy a predetermined dictionary registration condition, the converted notation is divided into components, and among the divided components, the dictionary together with new words that the user has entered unregistered components in the dictionary To register.
図15は、第4の実施の形態にかかる辞書登録装置1500の構成を示すブロック図である。同図に示すように、辞書登録装置1500は、未知語検出部901と、入力受付部101と、表記変換部102と、単語登録部103と、変換表記判定部1201と、変換表記分割部1202と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置1500は、HDDに表記変換規則表120と、辞書121とを保存している。
FIG. 15 is a block diagram illustrating a configuration of a
第4の実施の形態においては、未知語検出部901を追加したことが第3の実施の形態と異なっている。その他の構成および機能は、第3の実施の形態にかかる辞書登録装置1200の構成を表すブロック図である図12と同様であるので、同一符号を付し、ここでの説明は省略する。また、未知語検出部901は、第2の実施の形態にかかる辞書登録装置900における未知語検出部901と同様であるので説明を省略する。
The fourth embodiment is different from the third embodiment in that an
第4の実施の形態は、ユーザが入力した新語を受付ける代わりに、ユーザが指定した文書ファイルから未知語を検出し、検出した未知語を入力する単語として受付ける点が、第3の実施の形態と相違している。また、この相違点は第1の実施の形態と第2の実施の形態の相違点と同じである。すなわち、第4の実施の形態は、第2の実施の形態と第3の実施の形態を組み合わせた実施の形態である。 In the fourth embodiment, instead of accepting a new word input by the user, an unknown word is detected from a document file designated by the user, and the detected unknown word is accepted as an input word. Is different. This difference is the same as the difference between the first embodiment and the second embodiment. That is, the fourth embodiment is an embodiment in which the second embodiment and the third embodiment are combined.
次に、このように構成された第4の実施の形態にかかる辞書登録装置1500による未知語登録処理について説明する。図16は、第3の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。
Next, an unknown word registration process by the
ステップS1601からステップS1605までの、未知語検出処理、未知語入力受付処理、表記変換処理は、第2の実施の形態にかかる辞書登録装置1500におけるステップS1001からステップS1005までと同様の処理なので、その説明を省略する。また、ステップS1606からステップS1608までの変換表記判定処理、変換表記分割処理は、第3の実施の形態にかかる辞書登録装置1200におけるステップS1306からステップS1308までと同様の処理なので、その説明を省略する。
The unknown word detection processing, unknown word input reception processing, and notation conversion processing from step S1601 to step S1605 are the same as the processing from step S1001 to step S1005 in the
変換した表記が登録条件を満たす場合(ステップS1606:YES)、または、辞書121に未登録の構成要素が選別された場合(ステップS1608)、単語登録部103は、検出した未知語と変換した表記または選別した構成要素を辞書121へ登録する(ステップS1609)。
When the converted notation satisfies the registration condition (step S1606: YES), or when an unregistered component is selected in the dictionary 121 (step S1608), the
次に、未知語検出部901は、ユーザにより指定された文書ファイル内のすべての未知語が処理されたか否かを判断し(ステップS1610)、すべての未知語が処理されていない場合は(ステップS1610:NO)、次の未知語の検出処理に遷移する(ステップS1601)。
Next, the unknown
すべての未知語が処理された場合は(ステップS1610:YES)、未知語登録処理を終了する。 If all unknown words have been processed (step S1610: YES), the unknown word registration process ends.
なお、第4の実施の形態ではユーザI/F110上に画面を表示していないが、変換した表記を確認する変換表記確認画面や、辞書121に登録した結果を確認する登録結果確認画面を表示するように構成してもよい。
Although the screen is not displayed on the user I /
このように、第4の実施の形態にかかる辞書登録装置1500では、ユーザが指定した文書ファイルから未知語を検出し、検出した未知語とともに、予め定められた表記変換規則に従って、検出した未知語の表記を変換した表記の単語も同時に登録することができる。さらに、変換した表記が予め定められた登録条件を満たす場合にだけ変換した表記を辞書に登録することで、不必要な変換表記の登録を回避することができる。また、登録条件を満たさない場合には、入力された新語を構成する構成要素の中で辞書に未登録の構成要素だけを登録することで、その後の誤変換を回避することができる。
As described above, in the
(第5の実施の形態)
第5の実施の形態にかかる辞書登録装置は、ユーザが入力した新語の表記を、表記変換規則表120ではなく、単語の属性情報が格納された辞書を参照して当該新語と関連する表記に変換し、変換した表記の単語も一括して辞書に登録するものである。
(Fifth embodiment)
In the dictionary registration device according to the fifth embodiment, the notation of the new word input by the user is referred to not the notation conversion rule table 120 but the dictionary in which the attribute information of the word is stored. The converted words are also registered in the dictionary in a lump.
図17は、第5の実施の形態にかかる辞書登録装置1700の構成を示すブロック図である。同図に示すように、辞書登録装置1700は、入力受付部101と、表記変換部102と、単語登録部103と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置1700は、HDDに辞書121を保存している。
FIG. 17 is a block diagram illustrating a configuration of a
第5の実施の形態においては、HDDに表記変換規則表120を保存していないこと、および、辞書121の内容が第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる辞書登録装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。
In the fifth embodiment, the notation conversion rule table 120 is not stored in the HDD, and the contents of the
図18は、本実施の形態における辞書121の構造の一例を示す説明図である。同図に示すように、本実施の形態における辞書121は、単語の表記と読みの他に属性情報を格納していることが、図3に示した第1の実施の形態における辞書121と異なっている。属性情報としては、位置関係を表す単語であること、程度を表す単語であること、臓器名を表す単語であること、数字であることおよびその桁数、英字であることおよびその桁数、大文字/小文字の区別、などが指定できる。
FIG. 18 is an explanatory diagram showing an example of the structure of the
なお、属性情報はこれらに限られるものではなく、単語の意味や品詞、桁数などを基に単語の分類に使用できるあらゆる属性を属性情報として指定することができる。 The attribute information is not limited to these, and any attribute that can be used for classifying words can be designated as attribute information based on the meaning, part of speech, number of digits, and the like of the word.
次に、このように構成された第5の実施の形態にかかる辞書登録装置1700による未知語登録処理について説明する。図19は、第5の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。
Next, an unknown word registration process performed by the
ステップS1901からステップS1902までの、入力画面表示処理、新語入力受付処理は、第1の実施の形態にかかる辞書登録装置100におけるステップS401からステップS402までと同様の処理なので、その説明を省略する。
Since the input screen display process and the new word input acceptance process from step S1901 to step S1902 are the same as the process from step S401 to step S402 in the
表記変換部102は、入力受付部101が受付けた新語を形態素解析し(ステップS1903)、求めた形態素と同一の属性情報を持つ形態素を辞書121から検索する(ステップS1904)。例えば、ユーザが“上葉”を新語として入力し、形態素として“上”、“葉”が得られた場合、表記“上”の属性情報“位置関係”と同一の属性情報を持つ“下”が辞書121から検索される。
The
次に、表記変換部102は、求めた形態素と同一の属性情報を持つ形態素を辞書121から検索した結果、該当する形態素が存在するか否かを判断する(ステップS1905)。該当する形態素が存在しない場合は(ステップS1905:NO)、単語登録部103が、受付けた新語を辞書121に登録する(ステップS1906)。
Next, the
該当する形態素が存在する場合は(ステップS1905:YES)、表記変換部102は、入力された新語における該当部分の形態素の表記を、辞書121から検索した形態素の表記に変換する(ステップS1907)。上述の例では、“上葉”の“上”の部分を“下”に変換した表記“下葉”が表記を変換した単語として生成される。該当する形態素が複数存在する場合は、その組み合わせの数に相当する個数の単語が、表記を変換した単語として生成される。
If the corresponding morpheme exists (step S1905: YES), the
ステップS1908からステップS1911までの、変換表記確認画面表示処理、登録指定判定処理、辞書登録処理、登録結果確認画面表示処理は、第1の実施の形態にかかる辞書登録装置100におけるステップS406からステップS409までと同様の処理なので、その説明を省略する。
The conversion notation confirmation screen display processing, registration designation determination processing, dictionary registration processing, and registration result confirmation screen display processing from step S1908 to step S1911 are performed from step S406 to step S409 in the
このように、第5の実施の形態にかかる辞書登録装置1700では、表記変換規則表を使用せずに、属性情報を格納した辞書を参照することで表記の変換を行うことができる。
As described above, the
なお、本実施の形態では、第1の実施の形態において表記変換規則表120の代わりに辞書121の属性情報を参照して表記の変換をする例を示したが、第2〜第4の実施の形態においても、表記変換規則表120の代わりに辞書121の属性情報を参照して表記の変換をするように構成することができる。
In this embodiment, the example in which the notation conversion is performed by referring to the attribute information of the
第1〜第5の実施の形態にかかる辞書登録装置は、CPUなどの制御装置と、ROM(Read Only Memory)やRAMなどの記憶装置と、HDD、CDドライブ装置などの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボードやマウスなどの入力装置を備えており、通常のコンピュータを利用したハードウェア構成となっている。 The dictionary registration device according to the first to fifth embodiments includes a control device such as a CPU, a storage device such as a ROM (Read Only Memory) and a RAM, an external storage device such as an HDD and a CD drive device, and a display. It has a display device such as a device and an input device such as a keyboard and a mouse, and has a hardware configuration using a normal computer.
第1〜第5の実施の形態にかかる辞書登録装置で実行される辞書登録プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。 The dictionary registration program executed by the dictionary registration apparatus according to the first to fifth embodiments is an installable or executable file, CD-ROM, flexible disk (FD), CD-R, DVD. (Digital Versatile Disk) or the like recorded on a computer-readable recording medium.
また、第1〜第5の実施の形態にかかる辞書登録装置で実行される辞書登録プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、第1〜第5の実施の形態にかかる辞書登録装置で実行される辞書登録プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。 Further, the dictionary registration program executed by the dictionary registration apparatus according to the first to fifth embodiments is stored on a computer connected to a network such as the Internet and provided by being downloaded via the network. It may be configured. Moreover, you may comprise so that the dictionary registration program performed with the dictionary registration apparatus concerning the 1st-5th embodiment may be provided or distributed via networks, such as the internet.
また、第1〜第5の実施の形態の辞書登録プログラムを、ROM等に予め組み込んで提供するように構成してもよい。 Moreover, you may comprise so that the dictionary registration program of 1st-5th embodiment may be provided by previously incorporating in ROM etc.
第1〜第5の実施の形態にかかる辞書登録装置で実行される辞書登録プログラムは、上述した各部(未知語検出部、入力受付部、表記変換部、単語登録部、変換表記判定部、変換表記分割部)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から辞書登録プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、未知語検出部、入力受付部、表記変換部、単語登録部、変換表記判定部、変換表記分割部が主記憶装置上に生成されるようになっている。 The dictionary registration program executed by the dictionary registration device according to the first to fifth embodiments includes the above-described units (unknown word detection unit, input reception unit, notation conversion unit, word registration unit, conversion notation determination unit, conversion). As the actual hardware, the CPU (processor) reads the dictionary registration program from the storage medium and executes it to load each unit on the main storage device. A word detection unit, an input reception unit, a notation conversion unit, a word registration unit, a conversion notation determination unit, and a conversion notation division unit are generated on the main storage device.
以上のように、本発明にかかる辞書登録装置、辞書登録方法および辞書登録プログラムは、辞書に登録されていない単語を追加登録する機能を有する文書作成システム、かな漢字変換システム、音声認識システムに適している。 As described above, the dictionary registration device, the dictionary registration method, and the dictionary registration program according to the present invention are suitable for a document creation system, a kana-kanji conversion system, and a speech recognition system having a function of additionally registering words that are not registered in the dictionary. Yes.
100、900、1200、1500、1700 辞書登録装置
101 入力受付部
102 表記変換部
103 単語登録部
110 ユーザI/F
120 表記変換規則表
121 辞書
501 読み入力フィールド
502 表記入力フィールド
503 品詞入力フィールド
504 登録ボタン
505 キャンセルボタン
601 チェックボックス
602 登録ボタン
603 キャンセルボタン
701 閉じるボタン
901 未知語検出部
1201 変換表記判定部
1202 変換表記分割部
100, 900, 1200, 1500, 1700
120 Notation Conversion Rule Table 121
Claims (7)
前記辞書に登録されていない未知語の入力を受付ける入力受付手段と、
前記未知語の表記の一部または全部と同一の属性情報を持つ少なくとも1つの単語を前記辞書記憶手段から検索し、検索した単語と同一の属性情報を持つ前記未知語の表記の一部または全部を、検索した単語の表記に変換した少なくとも1つの変換単語を生成する表記変換手段と、
前記変換単語および前記未知語を前記辞書に登録する単語登録手段と、
を備えたことを特徴とする辞書登録装置。 Dictionary storage means for storing a dictionary in which words and word attribute information are associated with each other;
Input receiving means for receiving an input of an unknown word that is not registered in the dictionary;
The dictionary storage means is searched for at least one word having the same attribute information as part or all of the unknown word notation, and part or all of the unknown word notation having the same attribute information as the searched word A notation conversion means for generating at least one converted word obtained by converting into a notation of the searched word,
Word registration means for registering the converted word and the unknown word in the dictionary;
A dictionary registration device comprising:
前記変換表記判定手段が登録する単語として妥当でないと判定した前記変換単語の表記を構成要素に分割する変換表記分割手段とをさらに備え、
前記単語登録手段は、前記変換表記分割手段が分割した前記構成要素および前記未知語を前記辞書に登録することを特徴とする請求項1に記載の辞書登録装置。 Conversion notation determining means for determining that the notation of the conversion word is not valid as the notation of the word registered in the dictionary when the number of the conversion words exceeds a predetermined number;
A conversion notation dividing means for dividing the notation of the converted word determined to be invalid as a word to be registered by the conversion notation determining means, into component elements;
2. The dictionary registration apparatus according to claim 1, wherein the word registration unit registers the component and the unknown word divided by the conversion notation division unit in the dictionary.
前記変換表記判定手段が登録する単語として妥当でないと判定した前記変換単語の表記を構成要素に分割する変換表記分割手段とをさらに備え、
前記単語登録手段は、前記変換表記分割手段が分割した前記構成要素および前記未知語を前記辞書に登録することを特徴とする請求項1に記載の辞書登録装置。 Conversion notation determining means for determining that the notation of the conversion word is not valid as the notation of the word to be registered in the dictionary when the character string length of the conversion word exceeds a predetermined character string length;
A conversion notation dividing means for dividing the notation of the converted word determined to be invalid as a word to be registered by the conversion notation determining means, into component elements;
2. The dictionary registration apparatus according to claim 1, wherein the word registration unit registers the component and the unknown word divided by the conversion notation division unit in the dictionary.
前記単語登録手段は、選択された構成要素および前記未知語を前記辞書に登録すること、
を特徴とする請求項2および3のいずれか1つに記載の辞書登録装置。 The conversion notation dividing unit divides a notation part converted by the notation conversion unit and a notation part not converted as a component, and selects a component not registered in the dictionary from among the divided components,
The word registration means registering the selected component and the unknown word in the dictionary;
The dictionary registration device according to claim 2, wherein:
前記単語登録手段は、選択された構成要素および前記未知語を前記辞書に登録すること、
を特徴とする請求項2および3のいずれか1つに記載の辞書登録装置。 The conversion notation dividing unit morphologically analyzes the notation converted by the notation conversion unit, divides the morpheme obtained by morpheme analysis as a component, and selects a component that is not registered in the dictionary from among the divided components And
The word registration means registering the selected component and the unknown word in the dictionary;
The dictionary registration device according to claim 2, wherein:
表記変換手段が、前記未知語の表記の一部または全部と同一の属性情報を持つ少なくとも1つの単語を前記辞書記憶手段から検索し、検索した単語と同一の属性情報を持つ前記未知語の表記の一部または全部を、検索した単語の表記に変換した少なくとも1つの変換単語を生成する表記変換ステップと、
単語登録手段が、前記変換単語および前記未知語を前記辞書に登録する辞書登録ステップと、
を備えたことを特徴とする辞書登録方法。 An input receiving step for receiving an input of an unknown word that is not registered in the dictionary stored in a dictionary storage unit that stores a dictionary that associates a word with word attribute information;
The notation conversion means searches the dictionary storage means for at least one word having the same attribute information as part or all of the notation of the unknown word, and the notation of the unknown word having the same attribute information as the searched word A notation conversion step for generating at least one converted word in which a part or all of is converted into a searched word notation;
A dictionary registration step in which word registration means registers the converted word and the unknown word in the dictionary;
A dictionary registration method comprising:
前記未知語の表記の一部または全部と同一の属性情報を持つ少なくとも1つの単語を前記辞書記憶手段から検索し、検索した単語と同一の属性情報を持つ前記未知語の表記の一部または全部を、検索した単語の表記に変換した少なくとも1つの変換単語を生成する表記変換手順と、
前記変換単語および前記未知語を前記辞書に登録する辞書登録手順と、
をコンピュータに実行させるための辞書登録プログラム。 An input reception procedure for receiving an input of an unknown word that is not registered in the dictionary stored in a dictionary storage unit that stores a dictionary that associates a word with word attribute information;
The dictionary storage means is searched for at least one word having the same attribute information as part or all of the unknown word notation, and part or all of the unknown word notation having the same attribute information as the searched word A notation conversion procedure for generating at least one converted word converted into the notation of the searched word,
A dictionary registration procedure for registering the converted word and the unknown word in the dictionary;
Dictionary registration program for causing a computer to execute the.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004349050A JP4192142B2 (en) | 2004-12-01 | 2004-12-01 | Dictionary registration device, dictionary registration method, and dictionary registration program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004349050A JP4192142B2 (en) | 2004-12-01 | 2004-12-01 | Dictionary registration device, dictionary registration method, and dictionary registration program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006155529A JP2006155529A (en) | 2006-06-15 |
| JP4192142B2 true JP4192142B2 (en) | 2008-12-03 |
Family
ID=36633705
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004349050A Expired - Fee Related JP4192142B2 (en) | 2004-12-01 | 2004-12-01 | Dictionary registration device, dictionary registration method, and dictionary registration program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4192142B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009258293A (en) * | 2008-04-15 | 2009-11-05 | Mitsubishi Electric Corp | Speech recognition vocabulary dictionary creator |
| JP5332605B2 (en) * | 2008-12-26 | 2013-11-06 | 富士通株式会社 | Sentence example database construction program, sentence example display program, sentence example database construction method, and sentence example display method |
| JP2021140645A (en) | 2020-03-09 | 2021-09-16 | オムロン株式会社 | Word registration device, word registration method and word registration program |
-
2004
- 2004-12-01 JP JP2004349050A patent/JP4192142B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2006155529A (en) | 2006-06-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4301515B2 (en) | Text display method, information processing apparatus, information processing system, and program | |
| JP5599662B2 (en) | System and method for converting kanji into native language pronunciation sequence using statistical methods | |
| JP4701292B2 (en) | Computer system, method and computer program for creating term dictionary from specific expressions or technical terms contained in text data | |
| US8655641B2 (en) | Machine translation apparatus and non-transitory computer readable medium | |
| JPWO2011129198A1 (en) | Inconsistency detection system, method, and program | |
| US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
| JP4192142B2 (en) | Dictionary registration device, dictionary registration method, and dictionary registration program | |
| JP2000067056A (en) | Device for extracting numerical information and device for retrieving numerical information and storage medium for storing numerical information extraction program and storage medium for storing numerical information retrieval program | |
| US12499328B2 (en) | Tonal language dictionary search device, tonal language dictionary search method, and non-transitory computer-readable storage medium storing a computer program readable by a computer of a tonal language dictionary search device | |
| JP6303508B2 (en) | Document analysis apparatus, document analysis system, document analysis method, and program | |
| CN106250354B (en) | Information processing apparatus, information processing method, and program for processing document | |
| JP5326781B2 (en) | Extraction rule creation system, extraction rule creation method, and extraction rule creation program | |
| JPH1011443A (en) | Document code check system | |
| JPH11238051A (en) | Chinese input conversion processing device, Chinese input conversion processing method, recording medium recording Chinese input conversion processing program | |
| JP5443788B2 (en) | Formal name determination system and formal name determination program | |
| JP4266240B1 (en) | Item judgment system and item judgment program | |
| JP4922030B2 (en) | Character string search apparatus, method and program | |
| JP4304146B2 (en) | Dictionary registration device, dictionary registration method, and dictionary registration program | |
| US20240354517A1 (en) | Systems and methods for detecting sensitive text in documents | |
| JP6203083B2 (en) | Unknown word extraction device and unknown word extraction method | |
| JP2776069B2 (en) | Document inspection device | |
| JP4047895B2 (en) | Document proofing apparatus and program storage medium | |
| JP2001109740A (en) | Chinese document creation device and Chinese document creation method | |
| JP2020013178A (en) | Answer classification support system, answer classification support method and answer classification support program | |
| JP4047894B2 (en) | Document proofing apparatus and program storage medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071108 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071113 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080110 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080715 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080821 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080916 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080919 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 3 |
|
| LAPS | Cancellation because of no payment of annual fees |