Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4192142B2 - Dictionary registration device, dictionary registration method, and dictionary registration program - Google Patents
[go: Go Back, main page]

JP4192142B2 - Dictionary registration device, dictionary registration method, and dictionary registration program - Google Patents

Dictionary registration device, dictionary registration method, and dictionary registration program Download PDF

Info

Publication number
JP4192142B2
JP4192142B2 JP2004349050A JP2004349050A JP4192142B2 JP 4192142 B2 JP4192142 B2 JP 4192142B2 JP 2004349050 A JP2004349050 A JP 2004349050A JP 2004349050 A JP2004349050 A JP 2004349050A JP 4192142 B2 JP4192142 B2 JP 4192142B2
Authority
JP
Japan
Prior art keywords
word
notation
dictionary
conversion
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004349050A
Other languages
Japanese (ja)
Other versions
JP2006155529A (en
Inventor
尚義 永江
幸弘 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004349050A priority Critical patent/JP4192142B2/en
Publication of JP2006155529A publication Critical patent/JP2006155529A/en
Application granted granted Critical
Publication of JP4192142B2 publication Critical patent/JP4192142B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、辞書に登録されていない単語を辞書へ登録する辞書登録装置、辞書登録方法および辞書登録プログラムに関するものである。   The present invention relates to a dictionary registration device, a dictionary registration method, and a dictionary registration program for registering words that are not registered in a dictionary.

近年、パソコンや携帯電話等において日本語の文章を入力する手段として、一般にかな漢字変換システムが使用されている。また、最近では音声で文字を入力できる音声認識システムも使用され始めている。これらのシステムでは、ひらがなの入力文字を漢字仮名混じり文に変換する際、システムの辞書に登録されている単語の組合せの中で最適な表記列に変換する。従って、ユーザが希望する表記の単語が辞書に登録されていない場合には正しく変換されず、システムの辞書に登録されている単語の表記を適当に並べた誤った表記列に誤変換されてしまう。   In recent years, a kana-kanji conversion system is generally used as a means for inputting Japanese sentences on a personal computer or a mobile phone. Recently, voice recognition systems that can input characters by voice have begun to be used. In these systems, when hiragana input characters are converted into kanji-kana mixed sentences, they are converted into an optimal notation string among word combinations registered in the system dictionary. Therefore, if the word of the notation desired by the user is not registered in the dictionary, it is not correctly converted, and is erroneously converted into an incorrect notation string in which the notation of the word registered in the system dictionary is appropriately arranged. .

辞書登録装置は、このような不都合を解消するために、システムの辞書に登録されていない単語を辞書へ追加登録する装置である。しかし、ユーザが使用する単語のうち、どの単語がシステムの辞書に登録されていないかを事前にすべて調べることは困難である。通常は、ユーザが文章を入力中に誤変換が発生した時に、初めてその単語が辞書に登録されていないことを知ることになる。従って誤変換を減らすためには、ユーザが未登録単語の存在に気付くたびに随時その単語を辞書に追加登録しなければならない。   The dictionary registration apparatus is an apparatus that additionally registers words that are not registered in the system dictionary in order to eliminate such inconvenience. However, it is difficult to check in advance which words used by the user are not registered in the system dictionary. Normally, when an erroneous conversion occurs while the user is inputting a sentence, the user knows that the word is not registered in the dictionary for the first time. Therefore, in order to reduce erroneous conversion, every time the user notices the presence of an unregistered word, the word must be additionally registered in the dictionary as needed.

このようなユーザによる単語登録の手間を軽減させるため、ユーザが過去に作成した文書ファイルからシステムの辞書に登録されていない単語を抽出し、辞書に一括登録する機能が開発されている(例えば、特許文献1)。   In order to reduce the trouble of registering words by such a user, a function has been developed that extracts words that are not registered in the system dictionary from a document file created by the user in the past and collectively registers them in the dictionary (for example, Patent Document 1).

特開平2−163874号公報JP-A-2-163874

しかしながら、辞書に一括登録する機能を使用した場合においても、今後使用する可能性があるが今まで入力したことがないため文書ファイル中に存在しない単語は辞書に追加登録されないという問題があった。例えば、過去に作成した文書では「右肺上葉」という単語は使用していたが、「左肺上葉」という単語は使用していなかった場合、文書中からは「右肺上葉」という単語しか検出されないため、「左肺上葉」という単語は辞書に登録されない。そのため、後日ユーザが「左肺上葉」と入力した時には、誤変換が発生してしまう。   However, even when the function of batch registration in the dictionary is used, there is a problem that a word that does not exist in the document file is not additionally registered in the dictionary because it may be used in the future, but has not been input so far. For example, if the word “upper lobe of the right lung” was used in a document created in the past, but the word “upper lobe of the left lung” was not used, the word “upper lobe of the right lung” was used from the document. Since only the word is detected, the word “left upper lobe” is not registered in the dictionary. Therefore, when the user inputs “left upper lobe” at a later date, erroneous conversion occurs.

本発明は、上記に鑑みてなされたものであって、ユーザが入力した単語または文書から検出された未知語だけでなく、入力した単語の表記または検出された未知語の表記を、関連する単語の表記に変換するための表記変換規則に従って変換し、変換後の表記の単語も同時に辞書に追加登録することにより、今後入力する可能性のある単語の登録洩れをなくし、ユーザの単語登録の負荷を軽減するとともに文書入力時の誤変換を減少させる辞書登録装置、辞書登録方法および辞書登録プログラムを提供することを目的とする。   The present invention has been made in view of the above, and not only the word input by the user or the unknown word detected from the document, but also the related word notation of the input word or the detected unknown word By converting according to the notation conversion rules for converting to notation, and additionally registering the converted notation word in the dictionary at the same time, it eliminates the omission of registration of words that may be input in the future, and the load of user word registration An object of the present invention is to provide a dictionary registration device, a dictionary registration method, and a dictionary registration program that reduce the number of erroneous conversions during document input.

上述した課題を解決し、目的を達成するために、本発明は、単語と単語の属性情報とを対応づけた辞書を記憶する辞書記憶手段と、前記辞書に登録されていない未知語の入力を受付ける入力受付手段と、前記未知語の表記の一部または全部と同一の属性情報を持つ少なくとも1つの単語を前記辞書記憶手段から検索し、検索した単語と同一の属性情報を持つ前記未知語の表記の一部または全部を、検索した単語の表記に変換した少なくとも1つの変換単語を生成する表記変換手段と、前記変換単語および前記未知語を前記辞書に登録する単語登録手段と、を備えたことを特徴とする。 In order to solve the above-described problems and achieve the object, the present invention provides dictionary storage means for storing a dictionary in which words and word attribute information are associated with each other, and input of unknown words that are not registered in the dictionary. An input receiving means for receiving, and searching the dictionary storage means for at least one word having the same attribute information as a part or all of the notation of the unknown word; the unknown word having the same attribute information as the searched word; Notation conversion means for generating at least one conversion word obtained by converting a part or all of the notation into a search word expression; and word registration means for registering the conversion word and the unknown word in the dictionary It is characterized by that.

また、本発明は、上記装置を実行することができる辞書登録方法および辞書登録プログラムである。   The present invention also provides a dictionary registration method and a dictionary registration program that can execute the above-described apparatus.

本発明によれば、辞書に登録されていない単語を辞書に登録するとき、登録のために入力した単語の表記だけでなく、入力した単語の表記と関連する単語の表記についても同時に登録することができる。このため、誤変換が発生するたびに未登録の単語を辞書に登録する手間を軽減し、誤変換の発生を減少させることができるという効果を奏する。   According to the present invention, when a word not registered in the dictionary is registered in the dictionary, not only the notation of the word input for registration, but also the notation of the word related to the input word notation is registered at the same time. Can do. For this reason, it is possible to reduce the trouble of registering an unregistered word in the dictionary every time erroneous conversion occurs, and to reduce the occurrence of erroneous conversion.

以下に添付図面を参照して、この発明にかかる辞書登録装置、辞書登録方法および辞書登録プログラムの最良な実施の形態を詳細に説明する。   Exemplary embodiments of a dictionary registration device, a dictionary registration method, and a dictionary registration program according to the present invention will be explained below in detail with reference to the accompanying drawings.

(第1の実施の形態)
第1の実施の形態にかかる辞書登録装置は、ユーザが入力した新語の表記を当該新語と関連する表記に変換し、変換した表記の単語も一括して辞書に登録するものである。
(First embodiment)
The dictionary registration apparatus according to the first embodiment converts the notation of a new word input by a user into a notation associated with the new word, and registers the converted notation words together in the dictionary.

図1は、第1の実施の形態にかかる辞書登録装置100の構成を示すブロック図である。同図に示すように、辞書登録装置100は、入力受付部101と、表記変換部102と、単語登録部103と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置100は、ハードディスクドライブ装置(HDD:Hard Disk Drive)に表記変換規則表120と、辞書121とを保存している。HDDは、本発明における表記変換規則記憶手段および辞書記憶手段に相当する。   FIG. 1 is a block diagram illustrating a configuration of the dictionary registration device 100 according to the first embodiment. As shown in the figure, the dictionary registration apparatus 100 includes an input reception unit 101, a notation conversion unit 102, a word registration unit 103, and a user I / F 110. The dictionary registration apparatus 100 according to the present embodiment stores a notation conversion rule table 120 and a dictionary 121 in a hard disk drive (HDD). The HDD corresponds to notation conversion rule storage means and dictionary storage means in the present invention.

入力受付部101は、ユーザが入力した新語または文書ファイルから検出された未知語の入力を受付けるものである。ここで、新語とは、辞書に未登録であると認識してユーザが入力した単語のことをいう。また、未知語とは、辞書に登録されていない単語のことをいい、新語も未知語に含まれる。   The input reception unit 101 receives an input of a new word input by a user or an unknown word detected from a document file. Here, the new word means a word that is input by the user by recognizing that it is not registered in the dictionary. An unknown word means a word that is not registered in the dictionary, and a new word is also included in the unknown word.

表記変換部102は、表記変換規則表120に従って入力受付部101が受付けた単語の表記の変換を行うものである。表記変換規則表120の詳細については後述する。   The notation conversion unit 102 converts the notation of words accepted by the input receiving unit 101 in accordance with the notation conversion rule table 120. Details of the notation conversion rule table 120 will be described later.

単語登録部103は、表記変換部102が変換した単語を変換表記確認画面に表示するためにユーザI/F110に渡すとともに、変換表記確認画面で登録を指定された単語を辞書121に登録するものである。変換表記確認画面の詳細については後述する。   The word registration unit 103 passes the word converted by the notation conversion unit 102 to the user I / F 110 for display on the conversion notation confirmation screen, and registers the word designated for registration in the conversion notation confirmation screen in the dictionary 121. It is. Details of the conversion notation confirmation screen will be described later.

ユーザI/F110は、ディスプレイ装置等の表示装置と、キーボードやマウスなどの入力装置であり、入力画面、変換表記確認画面、登録結果確認画面の表示を行うとともに、これらの画面からの入力操作を受付ける。   The user I / F 110 is a display device such as a display device and an input device such as a keyboard and a mouse. The user I / F 110 displays an input screen, a conversion notation confirmation screen, a registration result confirmation screen, and performs an input operation from these screens. Accept.

表記変換規則表120は、単語の表記の変換規則を格納したものであり、表記変換部102によって参照される。図2は、表記変換規則表120の構造の一例を示す説明図である。同図の例に示すように、表記変換規則表120は、ある単語の表記に対する変換表記を格納している。例えば、表記“上”に対する変換表記として“下”が格納されている。変換表記は複数指定することができ、同図に示す例では、表記“1”に対しては“1”以外の1桁数字を示す2から9の数字を変換表記として指定している。   The notation conversion rule table 120 stores conversion rules for word notation, and is referred to by the notation conversion unit 102. FIG. 2 is an explanatory diagram showing an example of the structure of the notation conversion rule table 120. As shown in the example of the figure, the notation conversion rule table 120 stores conversion notation for the notation of a certain word. For example, “lower” is stored as the conversion notation for the notation “upper”. A plurality of conversion notations can be specified. In the example shown in the figure, for the notation “1”, a number from 2 to 9 indicating a one-digit number other than “1” is specified as the conversion notation.

辞書121は、単語を保持する辞書であり、一般的なかな漢字変換システムや音声認識システムなどで使用される辞書である。図3は、辞書121の構造の一例を示す説明図である。同図に示すように、辞書121は、単語の表記と読みを格納している。辞書121には、これ以外の項目、例えば、品詞などを格納するように構成してもよい。   The dictionary 121 is a dictionary that holds words, and is a dictionary used in a general kana-kanji conversion system, a speech recognition system, or the like. FIG. 3 is an explanatory diagram showing an example of the structure of the dictionary 121. As shown in the figure, the dictionary 121 stores word notations and readings. The dictionary 121 may be configured to store other items such as parts of speech.

次に、このように構成された第1の実施の形態にかかる辞書登録装置100による未知語登録処理について説明する。図4は、第1の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。   Next, an unknown word registration process performed by the dictionary registration apparatus 100 according to the first embodiment configured as described above will be described. FIG. 4 is a flowchart showing the overall flow of the unknown word registration process in the first embodiment.

まず、ユーザI/F110が、新語の入力画面を表示する(ステップS401)。図5は、入力画面の内容を示す模式図である。同図に示すように、入力画面には、読み入力フィールド501、表記入力フィールド502、品詞入力フィールド503、登録ボタン504、キャンセルボタン505が表示されている。各入力フィールドに入力後、登録ボタン504が押下されると入力した単語が受付けられる。キャンセルボタン505が押下された場合は、未知語登録処理を中止する。   First, the user I / F 110 displays a new word input screen (step S401). FIG. 5 is a schematic diagram showing the contents of the input screen. As shown in the figure, a reading input field 501, a notation input field 502, a part-of-speech input field 503, a registration button 504, and a cancel button 505 are displayed on the input screen. When the registration button 504 is pressed after inputting in each input field, the input word is accepted. When the cancel button 505 is pressed, the unknown word registration process is stopped.

入力画面が表示されると、入力受付部101がユーザによる新語の入力を受付ける(ステップS402)。次に、表記変換部102が、入力を受付けた新語の中に表記変換規則表120の“表記”欄と一致する部分が含まれているか否かについて判断する(ステップS403)。入力を受付けた新語の表記と表記変換規則表120の表記との照合は、文字単位の最長一致文字列マッチングで行ってもよいし、新語の表記を形態素解析し、形態素に分割してから照合を行ってもよい。このように、新語の表記に含まれる部分文字列と表記変換規則表120の表記との一致判定は一般的なマッチング手法のいずれによって構成してもよい。   When the input screen is displayed, the input receiving unit 101 receives an input of a new word by the user (step S402). Next, the notation conversion unit 102 determines whether or not the new word that has received the input includes a portion that matches the “notation” column of the notation conversion rule table 120 (step S403). The collation between the new word notation that accepts the input and the notation of the notation conversion rule table 120 may be performed by the longest matching character string matching in character units, or the new word notation is collated after morphological analysis and divided into morphemes. May be performed. As described above, the matching determination between the partial character string included in the new word notation and the notation of the notation conversion rule table 120 may be configured by any of the general matching methods.

表記変換規則表120の“表記”欄と一致する部分が含まれていない場合は(ステップS403:NO)、単語登録部103は、受付けた新語を辞書121へ登録する(ステップS404)。一致する部分が含まれている場合は、(ステップS403:YES)表記変換部102は、該当する部分の表記に対応する変換表記を表記変換規則表120から取得し、入力を受付けた新語の該当部分の表記を取得した変換表記に変換する(ステップS405)。   When the portion that matches the “notation” column of the notation conversion rule table 120 is not included (step S403: NO), the word registration unit 103 registers the accepted new word in the dictionary 121 (step S404). If a matching part is included (step S403: YES), the notation conversion unit 102 acquires the conversion notation corresponding to the notation of the corresponding part from the notation conversion rule table 120, and the corresponding of the new word that accepted the input. The part notation is converted into the acquired conversion notation (step S405).

一致する部分文字列が複数ある場合は、その組み合わせの数に相当する個数の単語が、表記を変換した単語として生成される。例えば、入力を受付けた新語が“右肺上葉”であった場合、部分文字列“右”、“上”が表記変換規則表120の表記と一致する。従って、“右肺下葉”、“左肺上葉”、“左肺下葉”の3つの単語が表記を変換した単語として生成される。   When there are a plurality of matching partial character strings, the number of words corresponding to the number of combinations is generated as a converted word. For example, when the input new word is “upper right lobe”, the partial character strings “right” and “up” match the notation in the notation conversion rule table 120. Accordingly, the three words “lower right lobe”, “upper left lobe”, and “lower left lobe” are generated as converted words.

また、該当する部分の表記に対応する変換表記が複数指定されているときは、変換表記の数に相当する個数の単語が、表記を変換した単語として生成される。例えば、該当する部分の表記が数字の“1”であった場合、表記変換規則表120には対応する変換表記として数字の“2”から“9”までの8つの変換表記が指定されているため、“1”をそれぞれの数字に変換した8つの単語が表記を変換した単語として生成される。   When a plurality of conversion notations corresponding to the notation of the corresponding part are designated, the number of words corresponding to the number of conversion notations is generated as words obtained by converting the notation. For example, when the notation of the corresponding part is the number “1”, the notation conversion rule table 120 designates eight conversion notations from the numbers “2” to “9” as the corresponding conversion notations. Therefore, eight words obtained by converting “1” into respective numbers are generated as words obtained by converting the notation.

次に、ユーザI/F110が、変換した表記の単語を変換表記確認画面に表示する(ステップS406)。図6は、変換表記確認画面の内容を示す模式図である。同図に示すように、変換表記確認画面には、変換した単語の表記、読み、品詞が一覧表示され、個々の単語の左側にチェックボックス601が表示されている。また、変換表記確認画面の下部には、登録ボタン602、キャンセルボタン603が表示されている。   Next, the user I / F 110 displays the converted notation word on the conversion notation confirmation screen (step S406). FIG. 6 is a schematic diagram showing the contents of the conversion notation confirmation screen. As shown in the figure, the conversion notation confirmation screen displays a list of converted word expressions, readings, and parts of speech, and a check box 601 is displayed on the left side of each word. A registration button 602 and a cancel button 603 are displayed at the bottom of the conversion notation confirmation screen.

チェックボックス601をチェックすることにより、その右側に表示されている変換した表記の単語を辞書121に登録することが指定される。登録ボタン602が押下されると、指定された単語を辞書121に登録する。キャンセルボタン603が押下された場合は、未知語登録処理を中止する。   By checking the check box 601, it is specified that the converted notation word displayed on the right side is registered in the dictionary 121. When the registration button 602 is pressed, the designated word is registered in the dictionary 121. When the cancel button 603 is pressed, the unknown word registration process is stopped.

なお、図6では、登録するか否かをチェックボックス601により指定することができるだけであるが、読みや品詞の修正も可能となるように変換表記確認画面を構成してもよい。   In FIG. 6, whether or not to register can only be specified by a check box 601, but the conversion notation confirmation screen may be configured so that reading and part of speech can be corrected.

変換表記確認画面で登録ボタン602が押下されると、単語登録部103はチェックボックス601をチェックすることにより辞書121への登録が指定された表記が存在するか否かを判断する(ステップS407)。登録が指定された表記が存在しない場合は(ステップS407:NO)、単語登録部103は受付けた新語のみを辞書121へ登録する(ステップS404)。登録が指定された表記が存在する場合は(ステップS407:YES)、単語登録部103は、受付けた新語と登録が指定された表記を辞書121へ登録する(ステップS408)。   When the registration button 602 is pressed on the conversion notation confirmation screen, the word registration unit 103 checks the check box 601 to determine whether there is a notation designated to be registered in the dictionary 121 (step S407). . When there is no notation designated for registration (step S407: NO), the word registration unit 103 registers only the accepted new word in the dictionary 121 (step S404). If there is a notation designated for registration (step S407: YES), the word registration unit 103 registers the accepted new word and the notation designated for registration in the dictionary 121 (step S408).

次に、ユーザI/F110が、辞書121に登録した単語を登録結果確認画面に表示する(ステップS409)。図7は、登録結果確認画面の内容を示す模式図である。同図に示すように、登録結果確認画面には、辞書121に登録した単語の表記、読み、品詞が一覧表示され、画面の下部には、閉じるボタン701が表示されている。閉じるボタン701を押下すると、未知語登録処理が終了する。   Next, the user I / F 110 displays the word registered in the dictionary 121 on the registration result confirmation screen (step S409). FIG. 7 is a schematic diagram showing the contents of a registration result confirmation screen. As shown in the figure, the registration result confirmation screen displays a list of notations, readings, and parts of speech of words registered in the dictionary 121, and a close button 701 is displayed at the bottom of the screen. When the close button 701 is pressed, the unknown word registration process ends.

図8は、第1の実施の形態にかかる辞書登録装置100において、上述した未知語登録処理に従って、ユーザにより入力された新語と表記を変換した単語を辞書121に登録する処理の例を示した説明図である。   FIG. 8 shows an example of processing for registering a new word input by the user and a word converted from the notation into the dictionary 121 in the dictionary registration device 100 according to the first embodiment, according to the above-described unknown word registration processing. It is explanatory drawing.

図8に示す例では、ユーザが“右肺上葉”を新語として入力した場合が示されている。この場合、表記変換規則表120との照合により、入力された新語の中の“右”、“上”の部分文字列が表記変換規則表120の表記と一致するため、それぞれ変換表記“左”、“下”が表記変換規則表120から取得される。そして、取得した2つの変換表記を1つずつまたは2つ同時に置き換えた単語3つが生成され、入力された新語を加えた合計4つの単語(“右肺上葉”、“右肺下葉”、“左肺上葉”、“左肺下葉”)が辞書121に追加登録される。   In the example shown in FIG. 8, the case where the user inputs “upper right lobe” as a new word is shown. In this case, the collation with the notation conversion rule table 120 matches the “right” and “upper” partial character strings in the input new word with the notation of the notation conversion rule table 120. , “Below” is acquired from the notation conversion rule table 120. Then, three words are generated by replacing the obtained two conversion expressions one by one or two at the same time, and a total of four words (“upper right lobe”, “lower right lobe”, "Left upper lobe" and "Left lower lobe") are additionally registered in the dictionary 121.

なお、第1の実施の形態にかかる辞書登録装置100においては、変換した表記や登録結果を画面に表示してユーザが確認できるように構成しているが、確認画面の表示やユーザによる単語の選別をせずに、変換した表記をそのまま自動登録するように構成してもよい。   Note that the dictionary registration device 100 according to the first embodiment is configured such that the converted notation and the registration result are displayed on the screen so that the user can check. You may comprise so that the converted description may be automatically registered as it is, without selecting.

このように、第1の実施の形態にかかる辞書登録装置100では、ユーザが入力した新語だけでなく、予め定められた表記変換規則に従って、入力された新語の表記を変換した表記の単語も同時に登録することができ、ユーザが辞書121に登録されていない単語を登録する負担を軽減することができる。また、一度の登録処理で複数の単語を登録することができるため、その後の誤変換の発生を減少させることができる。   As described above, in the dictionary registration apparatus 100 according to the first embodiment, not only a new word input by the user but also a notation word obtained by converting the notation of the input new word according to a predetermined notation conversion rule. It is possible to register, and the burden of the user registering a word that is not registered in the dictionary 121 can be reduced. In addition, since a plurality of words can be registered by a single registration process, the occurrence of subsequent erroneous conversion can be reduced.

(第2の実施の形態)
第2の実施の形態にかかる辞書登録装置は、ユーザが指定した文書ファイルから、辞書に登録されていない未知語を検出し、検出した未知語の表記を関連する表記に変換し、変換した表記の単語も一括して辞書に登録するものである。
(Second Embodiment)
The dictionary registration device according to the second embodiment detects an unknown word that is not registered in the dictionary from a document file specified by the user, converts the detected unknown word notation into a related notation, and converts the notation Are also registered in the dictionary.

すなわち、第2の実施の形態にかかる辞書登録装置900は、ユーザが入力した新語を受付ける代わりに、ユーザが指定した文書ファイルから未知語を検出し、検出した未知語を入力する単語として受付ける点が、第1の実施の形態にかかる辞書登録装置100と相違している。   That is, the dictionary registration apparatus 900 according to the second embodiment detects an unknown word from a document file designated by the user and accepts the detected unknown word as a word to be input instead of accepting a new word input by the user. However, it is different from the dictionary registration device 100 according to the first embodiment.

図9は、第2の実施の形態にかかる辞書登録装置900の構成を示すブロック図である。同図に示すように、辞書登録装置900は、未知語検出部901と、入力受付部101と、表記変換部102と、単語登録部103と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置900は、HDDに表記変換規則表120と、辞書121とを保存している。   FIG. 9 is a block diagram illustrating a configuration of a dictionary registration apparatus 900 according to the second embodiment. As shown in the figure, the dictionary registration device 900 includes an unknown word detection unit 901, an input reception unit 101, a notation conversion unit 102, a word registration unit 103, and a user I / F 110. Also, the dictionary registration apparatus 900 according to the present embodiment stores the notation conversion rule table 120 and the dictionary 121 in the HDD.

第2の実施の形態においては、未知語検出部901を追加したことが第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる辞書登録装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。   The second embodiment is different from the first embodiment in that an unknown word detector 901 is added. Other configurations and functions are the same as those in FIG. 1 which is a block diagram showing the configuration of the dictionary registration apparatus 100 according to the first embodiment, and therefore, the same reference numerals are given and description thereof is omitted here.

未知語検出部901は、ユーザが指定した文書ファイルから辞書121に登録されていないすべての未知語を検出し、検出した未知語を入力受付部101に渡す処理を行う。   The unknown word detection unit 901 detects all unknown words that are not registered in the dictionary 121 from the document file designated by the user, and performs processing to pass the detected unknown words to the input reception unit 101.

次に、このように構成された第2の実施の形態にかかる辞書登録装置900による未知語登録処理について説明する。図10は、第2の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。   Next, an unknown word registration process performed by the dictionary registration apparatus 900 according to the second embodiment configured as described above will be described. FIG. 10 is a flowchart showing an overall flow of the unknown word registration process in the second embodiment.

まず、未知語検出部901が、ユーザが指定した文書ファイルから未知語を検出する(ステップS1001)。次に、入力受付部101が、未知語検出部901が検出した未知語の入力を受付け(ステップS1002)、表記変換部102が、入力を受付けた未知語の中に、表記変換規則表120の“表記”欄と一致する部分が含まれているか否かについて判断する(ステップS1003)。   First, the unknown word detection unit 901 detects an unknown word from a document file designated by the user (step S1001). Next, the input reception unit 101 receives an input of an unknown word detected by the unknown word detection unit 901 (step S1002), and the notation conversion unit 102 includes the notation conversion rule table 120 in the unknown word that has received the input. It is determined whether or not a portion matching the “notation” field is included (step S1003).

一致する部分が含まれていない場合は(ステップS1003:NO)、単語登録部103が検出した未知語を辞書121へ登録する(ステップS1004)。一致する部分が含まれている場合は(ステップS1003:YES)、表記変換部102は、当該部分の表記を、表記変換規則表120の“変換表記”欄に格納されている表記に変換する(ステップS1005)。   If the matching part is not included (step S1003: NO), the unknown word detected by the word registration unit 103 is registered in the dictionary 121 (step S1004). If a matching part is included (step S1003: YES), the notation conversion unit 102 converts the notation of the part into a notation stored in the “conversion notation” column of the notation conversion rule table 120 ( Step S1005).

次に、単語登録部103は、検出した未知語と、上述の処理で変換された表記の単語を辞書121へ登録する(ステップS1006)。その後、未知語検出部901は、ユーザにより指定された文書ファイル内のすべての未知語が処理されたか否かを判断し(ステップS1007)、すべての未知語が処理されていない場合は(ステップS1007:NO)、次の未知語の検出処理に遷移する(ステップS1001)。   Next, the word registration unit 103 registers the detected unknown word and the notation word converted by the above-described process in the dictionary 121 (step S1006). Thereafter, the unknown word detection unit 901 determines whether all unknown words in the document file designated by the user have been processed (step S1007). If all unknown words have not been processed (step S1007). : NO), the process proceeds to the next unknown word detection process (step S1001).

すべての未知語が処理された場合は(ステップS1007:YES)、未知語登録処理を終了する。   If all unknown words have been processed (step S1007: YES), the unknown word registration process ends.

図11は、第2の実施の形態にかかる辞書登録装置900において、上述した未知語登録処理に従って、ユーザが指定した文書ファイルから未知語を検出して辞書121に登録する処理の例を示した説明図である。   FIG. 11 shows an example of processing for detecting an unknown word from a document file designated by the user and registering it in the dictionary 121 in the dictionary registration apparatus 900 according to the second embodiment in accordance with the above-described unknown word registration processing. It is explanatory drawing.

図11に示す例では、ユーザにより“所見ファイル001”が入力する文書ファイルとして指定された場合が示されている。当該文書ファイルから、同図に示すように、辞書121に登録されていない単語“右肺上葉”が未知語として検出される。検出された未知語と表記変換規則表120との照合により、検出された未知語の中の“右”、“上”の部分文字列が表記変換規則表120の表記と一致するため、それぞれ変換表記“左”、“下”が表記変換規則表120から取得される。そして、取得した2つの変換表記を1つずつまたは2つ同時に置き換えた単語3つが生成され、検出された未知語を加えた合計4つの単語(“右肺上葉”、“右肺下葉”、“左肺上葉”、“左肺下葉”)が辞書121に追加登録される。   In the example shown in FIG. 11, a case where “finding file 001” is designated as an input document file by the user is shown. From the document file, as shown in the figure, the word “upper right lobe” that is not registered in the dictionary 121 is detected as an unknown word. By comparing the detected unknown word with the notation conversion rule table 120, the “right” and “upper” partial character strings in the detected unknown word match the notation of the notation conversion rule table 120. The notations “left” and “lower” are acquired from the notation conversion rule table 120. Then, three words are generated by replacing the obtained two conversion expressions one by one or two at the same time, and a total of four words (“right lung upper lobe”, “right lung lower lobe”) including the detected unknown words are generated. , “Left upper lobe”, “Left lower lobe”) are additionally registered in the dictionary 121.

この後、同図には示していないが、指定された文書ファイルから次の未知語を検出し、表記変換処理、辞書登録処理が繰り返される。   Thereafter, although not shown in the figure, the next unknown word is detected from the designated document file, and the notation conversion process and the dictionary registration process are repeated.

なお、第2の実施の形態ではユーザI/F110上に画面を表示していないが、変換した表記を確認する変換表記確認画面や、辞書121に登録した結果を確認する登録結果確認画面を表示するように構成してもよい。   Although the screen is not displayed on the user I / F 110 in the second embodiment, a conversion notation confirmation screen for confirming the converted notation and a registration result confirmation screen for confirming the result registered in the dictionary 121 are displayed. You may comprise.

このように、第2の実施の形態にかかる辞書登録装置900では、ユーザが指定した文書ファイルから未知語を検出し、検出した未知語とともに、予め定められた表記変換規則に従って、検出した未知語の表記を変換した表記の単語も同時に登録することができるため、ユーザが辞書に登録されていない単語を登録する負担を軽減することができる。また、一度の登録処理で複数の単語を登録することができるため、その後の誤変換の発生を減少させることができる。   As described above, in the dictionary registration apparatus 900 according to the second embodiment, an unknown word is detected from a document file designated by the user, and the detected unknown word is detected according to a predetermined notation conversion rule together with the detected unknown word. Since the notation word converted from the notation can be registered at the same time, the burden of registering the word not registered in the dictionary by the user can be reduced. In addition, since a plurality of words can be registered by a single registration process, the occurrence of subsequent erroneous conversion can be reduced.

(第3の実施の形態)
第3の実施の形態にかかる辞書登録装置は、ユーザが入力した新語の表記を当該新語と関連する表記に変換し、変換した表記が予め定められた辞書登録の登録条件を満たさない場合には、変換した表記を構成要素に分割して、分割した構成要素の中で辞書に未登録の構成要素をユーザが入力した新語とともに辞書に登録するものである。
(Third embodiment)
The dictionary registration device according to the third embodiment converts the notation of a new word input by the user into a notation associated with the new word, and the converted notation does not satisfy a predetermined registration condition for dictionary registration. Then, the converted notation is divided into constituent elements, and among the divided constituent elements, constituent elements not registered in the dictionary are registered in the dictionary together with new words input by the user.

図12は、第3の実施の形態にかかる辞書登録装置1200の構成を示すブロック図である。同図に示すように、辞書登録装置1200は、入力受付部101と、表記変換部102と、単語登録部103と、変換表記判定部1201と、変換表記分割部1202と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置1200は、HDDに表記変換規則表120と、辞書121とを保存している。   FIG. 12 is a block diagram illustrating a configuration of a dictionary registration apparatus 1200 according to the third embodiment. As shown in the figure, the dictionary registration device 1200 includes an input reception unit 101, a notation conversion unit 102, a word registration unit 103, a conversion notation determination unit 1201, a conversion notation division unit 1202, and a user I / F 110. It has. The dictionary registration apparatus 1200 according to the present embodiment stores a notation conversion rule table 120 and a dictionary 121 in the HDD.

第3の実施の形態においては、変換表記判定部1201と、変換表記分割部1202とを追加したことが第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる辞書登録装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。   The third embodiment is different from the first embodiment in that a conversion notation determination unit 1201 and a conversion notation division unit 1202 are added. Other configurations and functions are the same as those in FIG. 1 which is a block diagram showing the configuration of the dictionary registration apparatus 100 according to the first embodiment, and therefore, the same reference numerals are given and description thereof is omitted here.

変換表記判定部1201は、表記変換部102が変換した表記が、予め定められた辞書登録のための登録条件を満たすか否かを判定する。変換表記分割部1202は、変換表記判定部1201により登録条件を満たさないと判定された表記を構成要素に分割し、辞書121に未登録の構成要素を選別する処理を行う。   The conversion notation determination unit 1201 determines whether or not the notation converted by the notation conversion unit 102 satisfies a predetermined registration condition for dictionary registration. The conversion notation division unit 1202 divides the notation determined by the conversion notation determination unit 1201 that the registration condition is not satisfied into components, and performs processing for selecting components not registered in the dictionary 121.

次に、このように構成された第3の実施の形態にかかる辞書登録装置1200による未知語登録処理について説明する。図13は、第3の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。   Next, an unknown word registration process performed by the dictionary registration apparatus 1200 according to the third embodiment configured as described above will be described. FIG. 13 is a flowchart showing an overall flow of unknown word registration processing in the third embodiment.

ステップS1301からステップS1305までの、入力画面表示処理、新語入力受付処理、表記変換処理は、第1の実施の形態にかかる辞書登録装置100におけるステップS401からステップS405までと同様の処理なので、その説明を省略する。   The input screen display process, new word input reception process, and notation conversion process from step S1301 to step S1305 are the same as the process from step S401 to step S405 in the dictionary registration device 100 according to the first embodiment, and therefore the description thereof will be given. Is omitted.

表記変換部102が入力された新語の表記を変換した後、変換表記判定部1201が、変換した表記が登録条件を満たすか否かを判断する(ステップS1306)。この場合、表記の変換により生成された単語の個数や文字列長が予め定められた上限値を超えないことなどを登録条件とするように構成することができる。このように構成することにより、例えば変換により生成した単語の個数が非常に多いため、すべて登録するとその後追加登録できる単語数が制限されてしまうといった不都合を回避することができる。   After the notation conversion unit 102 converts the input new word notation, the conversion notation determination unit 1201 determines whether or not the converted notation satisfies the registration condition (step S1306). In this case, the registration condition may be that the number of words or the character string length generated by the conversion of the notation does not exceed a predetermined upper limit value. With this configuration, for example, since the number of words generated by conversion is very large, it is possible to avoid the inconvenience that the number of words that can be additionally registered thereafter is limited when all the words are registered.

登録条件を満たさない場合は(ステップS1306:NO)、変換表記分割部1202が、入力された新語の表記を構成要素に分割する(ステップS1307)。分割の方法としては、新語の表記のうち表記が変換された部分とそれ以外の部分に分割するように構成してもよいし、新語の表記に対して形態素解析を行って、形態素単位に分割するように構成してもよい。次に、変換表記分割部1202は、分割した構成要素から、辞書121に未登録の構成要素を選別する(ステップS1308)。辞書121に既に登録されている構成要素をさらに登録する必要がないためである。   If the registration condition is not satisfied (step S1306: NO), the conversion notation dividing unit 1202 divides the input new word notation into components (step S1307). As a method of division, the new word notation may be divided into a part where the notation is converted and the other part, or the new word notation is divided into morpheme units by performing morphological analysis. You may comprise. Next, the conversion notation division unit 1202 sorts out components that are not registered in the dictionary 121 from the divided components (step S1308). This is because there is no need to further register components already registered in the dictionary 121.

登録条件を満たす場合(ステップS1306:YES)、および、辞書121に未登録の構成要素が選別された後、ユーザI/F110が変換表記確認画面を表示する(ステップS1309)。ステップS1310からステップS1312までの、登録指定の判定処理、辞書121への登録処理、登録結果確認画面表示処理は、第1の実施の形態にかかる辞書登録装置100におけるステップS407からステップS409までと同様の処理なので、その説明を省略する。   When the registration condition is satisfied (step S1306: YES), and after unregistered components are selected in the dictionary 121, the user I / F 110 displays a conversion notation confirmation screen (step S1309). The registration designation determination process, the registration process to the dictionary 121, and the registration result confirmation screen display process from step S1310 to step S1312 are the same as those from step S407 to step S409 in the dictionary registration apparatus 100 according to the first embodiment. Therefore, the description thereof is omitted.

図14は、第3の実施の形態にかかる辞書登録装置1200において、上述した未知語登録処理に従って、ユーザが入力した新語の登録条件を判定し、新語を分割した構成要素を辞書121に登録する処理の例を示した説明図である。この例では、変換した表記の数が上限値10を超えないことが登録条件として指定されていることを前提とする。   FIG. 14 is a diagram illustrating a dictionary registration apparatus 1200 according to the third embodiment. In accordance with the above-described unknown word registration process, a registration condition for a new word input by a user is determined, and components obtained by dividing the new word are registered in the dictionary 121. It is explanatory drawing which showed the example of the process. In this example, it is assumed that the registration condition specifies that the number of converted notations does not exceed the upper limit 10.

図14に示す例では、ユーザが“T2強調像”を新語として入力した場合が示されている。この場合、表記変換規則表120との照合により、入力された新語の中の“T”、“2”の部分文字列が表記変換規則表120の表記と一致するため、それぞれ変換表記“A”〜“S”および“U”〜“Z”(アルファベット25種)、“1”および“3”〜“9”(数字8種)が表記変換規則表120から取得される。   In the example illustrated in FIG. 14, a case where the user inputs “T2-weighted image” as a new word is illustrated. In this case, since the partial character strings “T” and “2” in the input new word match the notation of the notation conversion rule table 120 by collation with the notation conversion rule table 120, the conversion notation “A” respectively. “S” and “U” to “Z” (25 alphabets), “1” and “3” to “9” (8 numbers) are acquired from the notation conversion rule table 120.

この結果、入力された新語を加えると、合計で26×9=234個の単語が生成される。これは、変換した表記の数が10を超えないこととした登録条件を満たさないため、入力された新語の表記の分割が行われる。この例では、新語の表記のうち表記が変換された部分とそれ以外の部分に分割する方法により、入力された新語“T2強調像”は“T”、“2”、“強調像”の3つの構成要素に分割される。さらに、“T”、“2”は通常、辞書121に登録されているため、辞書121に登録されていない“強調像”のみが選別され、辞書121に追加登録される。これにより、その後、例えば“T1強調像”と入力された場合でも、“T”、“1”、“強調像”の3つの単語列として正しく変換することができるようになる。   As a result, when the input new word is added, a total of 26 × 9 = 234 words are generated. Since this does not satisfy the registration condition that the number of converted expressions does not exceed 10, the input new word expressions are divided. In this example, the input new word “T2 weighted image” is divided into three parts “T”, “2”, and “highlighted image” by dividing the new word notation into a part where the notation is converted and a part other than that. Divided into two components. Furthermore, since “T” and “2” are normally registered in the dictionary 121, only “emphasized images” that are not registered in the dictionary 121 are selected and additionally registered in the dictionary 121. Thereby, for example, even when “T1 weighted image” is input thereafter, it can be correctly converted as three word strings of “T”, “1”, and “weighted image”.

なお、第3の実施の形態にかかる辞書登録装置1200においては、変換した表記や登録結果を画面に表示してユーザが確認できるように構成しているが、確認画面の表示やユーザによる単語の選別をせずに、変換した表記をそのまま自動登録するように構成してもよい。   Note that the dictionary registration device 1200 according to the third embodiment is configured such that the converted notation and registration result are displayed on the screen so that the user can check. You may comprise so that the converted description may be automatically registered as it is, without selecting.

このように、第3の実施の形態にかかる辞書登録装置1200では、変換した表記が予め定められた登録条件を満たす場合にだけ変換した表記を辞書に登録することで、不必要な変換表記の登録を回避することができる。また、登録条件を満たさない場合には、入力された新語を構成する構成要素の中で辞書に未登録の構成要素だけを登録することで、その後の誤変換を回避することができる。   As described above, in the dictionary registration device 1200 according to the third embodiment, an unnecessary conversion notation can be obtained by registering the converted notation in the dictionary only when the converted notation satisfies a predetermined registration condition. Registration can be avoided. Further, when the registration condition is not satisfied, by registering only the unregistered components in the dictionary among the components constituting the input new word, the subsequent erroneous conversion can be avoided.

(第4の実施の形態)
第4の実施の形態にかかる辞書登録装置は、ユーザが指定した文書ファイルから、辞書に登録されていない未知語を検出し、検出した未知語の表記を関連する表記に変換し、変換した表記が予め定められた辞書登録の登録条件を満たさない場合には、変換した表記を構成要素に分割して、分割した構成要素の中で辞書に未登録の構成要素をユーザが入力した新語とともに辞書に登録するものである。
(Fourth embodiment)
The dictionary registration device according to the fourth exemplary embodiment detects an unknown word that is not registered in the dictionary from a document file specified by the user, converts the detected unknown word notation into a related notation, and converts the notation If the registration condition does not satisfy a predetermined dictionary registration condition, the converted notation is divided into components, and among the divided components, the dictionary together with new words that the user has entered unregistered components in the dictionary To register.

図15は、第4の実施の形態にかかる辞書登録装置1500の構成を示すブロック図である。同図に示すように、辞書登録装置1500は、未知語検出部901と、入力受付部101と、表記変換部102と、単語登録部103と、変換表記判定部1201と、変換表記分割部1202と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置1500は、HDDに表記変換規則表120と、辞書121とを保存している。   FIG. 15 is a block diagram illustrating a configuration of a dictionary registration apparatus 1500 according to the fourth embodiment. As shown in the figure, the dictionary registration device 1500 includes an unknown word detection unit 901, an input reception unit 101, a notation conversion unit 102, a word registration unit 103, a conversion notation determination unit 1201, and a conversion notation division unit 1202. And a user I / F 110. The dictionary registration device 1500 according to the present embodiment stores the notation conversion rule table 120 and the dictionary 121 in the HDD.

第4の実施の形態においては、未知語検出部901を追加したことが第3の実施の形態と異なっている。その他の構成および機能は、第3の実施の形態にかかる辞書登録装置1200の構成を表すブロック図である図12と同様であるので、同一符号を付し、ここでの説明は省略する。また、未知語検出部901は、第2の実施の形態にかかる辞書登録装置900における未知語検出部901と同様であるので説明を省略する。   The fourth embodiment is different from the third embodiment in that an unknown word detector 901 is added. Other configurations and functions are the same as those in FIG. 12, which is a block diagram showing the configuration of the dictionary registration apparatus 1200 according to the third embodiment. Moreover, since the unknown word detection part 901 is the same as the unknown word detection part 901 in the dictionary registration apparatus 900 concerning 2nd Embodiment, description is abbreviate | omitted.

第4の実施の形態は、ユーザが入力した新語を受付ける代わりに、ユーザが指定した文書ファイルから未知語を検出し、検出した未知語を入力する単語として受付ける点が、第3の実施の形態と相違している。また、この相違点は第1の実施の形態と第2の実施の形態の相違点と同じである。すなわち、第4の実施の形態は、第2の実施の形態と第3の実施の形態を組み合わせた実施の形態である。   In the fourth embodiment, instead of accepting a new word input by the user, an unknown word is detected from a document file designated by the user, and the detected unknown word is accepted as an input word. Is different. This difference is the same as the difference between the first embodiment and the second embodiment. That is, the fourth embodiment is an embodiment in which the second embodiment and the third embodiment are combined.

次に、このように構成された第4の実施の形態にかかる辞書登録装置1500による未知語登録処理について説明する。図16は、第3の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。   Next, an unknown word registration process by the dictionary registration apparatus 1500 according to the fourth embodiment configured as described above will be described. FIG. 16 is a flowchart showing an overall flow of unknown word registration processing in the third embodiment.

ステップS1601からステップS1605までの、未知語検出処理、未知語入力受付処理、表記変換処理は、第2の実施の形態にかかる辞書登録装置1500におけるステップS1001からステップS1005までと同様の処理なので、その説明を省略する。また、ステップS1606からステップS1608までの変換表記判定処理、変換表記分割処理は、第3の実施の形態にかかる辞書登録装置1200におけるステップS1306からステップS1308までと同様の処理なので、その説明を省略する。   The unknown word detection processing, unknown word input reception processing, and notation conversion processing from step S1601 to step S1605 are the same as the processing from step S1001 to step S1005 in the dictionary registration device 1500 according to the second embodiment. Description is omitted. The conversion notation determination processing and conversion notation division processing from step S1606 to step S1608 are the same as the processing from step S1306 to step S1308 in the dictionary registration apparatus 1200 according to the third embodiment, and thus description thereof is omitted. .

変換した表記が登録条件を満たす場合(ステップS1606:YES)、または、辞書121に未登録の構成要素が選別された場合(ステップS1608)、単語登録部103は、検出した未知語と変換した表記または選別した構成要素を辞書121へ登録する(ステップS1609)。   When the converted notation satisfies the registration condition (step S1606: YES), or when an unregistered component is selected in the dictionary 121 (step S1608), the word registration unit 103 converts the detected unknown word into the notation. Alternatively, the selected components are registered in the dictionary 121 (step S1609).

次に、未知語検出部901は、ユーザにより指定された文書ファイル内のすべての未知語が処理されたか否かを判断し(ステップS1610)、すべての未知語が処理されていない場合は(ステップS1610:NO)、次の未知語の検出処理に遷移する(ステップS1601)。   Next, the unknown word detection unit 901 determines whether or not all unknown words in the document file designated by the user have been processed (step S1610), and if all unknown words have not been processed (step S1610). S1610: NO), the process proceeds to the next unknown word detection process (step S1601).

すべての未知語が処理された場合は(ステップS1610:YES)、未知語登録処理を終了する。   If all unknown words have been processed (step S1610: YES), the unknown word registration process ends.

なお、第4の実施の形態ではユーザI/F110上に画面を表示していないが、変換した表記を確認する変換表記確認画面や、辞書121に登録した結果を確認する登録結果確認画面を表示するように構成してもよい。   Although the screen is not displayed on the user I / F 110 in the fourth embodiment, a conversion notation confirmation screen for confirming the converted notation and a registration result confirmation screen for confirming the result registered in the dictionary 121 are displayed. You may comprise.

このように、第4の実施の形態にかかる辞書登録装置1500では、ユーザが指定した文書ファイルから未知語を検出し、検出した未知語とともに、予め定められた表記変換規則に従って、検出した未知語の表記を変換した表記の単語も同時に登録することができる。さらに、変換した表記が予め定められた登録条件を満たす場合にだけ変換した表記を辞書に登録することで、不必要な変換表記の登録を回避することができる。また、登録条件を満たさない場合には、入力された新語を構成する構成要素の中で辞書に未登録の構成要素だけを登録することで、その後の誤変換を回避することができる。   As described above, in the dictionary registration device 1500 according to the fourth embodiment, an unknown word is detected from a document file designated by the user, and the detected unknown word is detected in accordance with a predetermined notation conversion rule together with the detected unknown word. It is also possible to register a notation word converted from the notation at the same time. Furthermore, registration of the converted notation can be avoided by registering the converted notation in the dictionary only when the converted notation satisfies a predetermined registration condition. Further, when the registration condition is not satisfied, by registering only the unregistered components in the dictionary among the components constituting the input new word, the subsequent erroneous conversion can be avoided.

(第5の実施の形態)
第5の実施の形態にかかる辞書登録装置は、ユーザが入力した新語の表記を、表記変換規則表120ではなく、単語の属性情報が格納された辞書を参照して当該新語と関連する表記に変換し、変換した表記の単語も一括して辞書に登録するものである。
(Fifth embodiment)
In the dictionary registration device according to the fifth embodiment, the notation of the new word input by the user is referred to not the notation conversion rule table 120 but the dictionary in which the attribute information of the word is stored. The converted words are also registered in the dictionary in a lump.

図17は、第5の実施の形態にかかる辞書登録装置1700の構成を示すブロック図である。同図に示すように、辞書登録装置1700は、入力受付部101と、表記変換部102と、単語登録部103と、ユーザI/F110とを備えている。また、本実施の形態にかかる辞書登録装置1700は、HDDに辞書121を保存している。   FIG. 17 is a block diagram illustrating a configuration of a dictionary registration device 1700 according to the fifth embodiment. As shown in the figure, the dictionary registration device 1700 includes an input reception unit 101, a notation conversion unit 102, a word registration unit 103, and a user I / F 110. The dictionary registration apparatus 1700 according to the present embodiment stores the dictionary 121 in the HDD.

第5の実施の形態においては、HDDに表記変換規則表120を保存していないこと、および、辞書121の内容が第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる辞書登録装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。   In the fifth embodiment, the notation conversion rule table 120 is not stored in the HDD, and the contents of the dictionary 121 are different from those in the first embodiment. Other configurations and functions are the same as those in FIG. 1 which is a block diagram showing the configuration of the dictionary registration apparatus 100 according to the first embodiment, and therefore, the same reference numerals are given and description thereof is omitted here.

図18は、本実施の形態における辞書121の構造の一例を示す説明図である。同図に示すように、本実施の形態における辞書121は、単語の表記と読みの他に属性情報を格納していることが、図3に示した第1の実施の形態における辞書121と異なっている。属性情報としては、位置関係を表す単語であること、程度を表す単語であること、臓器名を表す単語であること、数字であることおよびその桁数、英字であることおよびその桁数、大文字/小文字の区別、などが指定できる。   FIG. 18 is an explanatory diagram showing an example of the structure of the dictionary 121 in the present embodiment. As shown in the figure, the dictionary 121 in this embodiment is different from the dictionary 121 in the first embodiment shown in FIG. 3 in that it stores attribute information in addition to word notation and reading. ing. As attribute information, it is a word representing a positional relationship, a word representing a degree, a word representing an organ name, a number and its number of digits, an alphabetic character and its number of digits, uppercase letters / You can specify case sensitivity.

なお、属性情報はこれらに限られるものではなく、単語の意味や品詞、桁数などを基に単語の分類に使用できるあらゆる属性を属性情報として指定することができる。   The attribute information is not limited to these, and any attribute that can be used for classifying words can be designated as attribute information based on the meaning, part of speech, number of digits, and the like of the word.

次に、このように構成された第5の実施の形態にかかる辞書登録装置1700による未知語登録処理について説明する。図19は、第5の実施の形態における未知語登録処理の全体の流れを示すフローチャートである。   Next, an unknown word registration process performed by the dictionary registration apparatus 1700 according to the fifth embodiment configured as described above will be described. FIG. 19 is a flowchart showing an overall flow of unknown word registration processing in the fifth embodiment.

ステップS1901からステップS1902までの、入力画面表示処理、新語入力受付処理は、第1の実施の形態にかかる辞書登録装置100におけるステップS401からステップS402までと同様の処理なので、その説明を省略する。   Since the input screen display process and the new word input acceptance process from step S1901 to step S1902 are the same as the process from step S401 to step S402 in the dictionary registration apparatus 100 according to the first embodiment, the description thereof is omitted.

表記変換部102は、入力受付部101が受付けた新語を形態素解析し(ステップS1903)、求めた形態素と同一の属性情報を持つ形態素を辞書121から検索する(ステップS1904)。例えば、ユーザが“上葉”を新語として入力し、形態素として“上”、“葉”が得られた場合、表記“上”の属性情報“位置関係”と同一の属性情報を持つ“下”が辞書121から検索される。   The notation conversion unit 102 performs a morphological analysis on the new word received by the input receiving unit 101 (step S1903), and searches the dictionary 121 for a morpheme having the same attribute information as the obtained morpheme (step S1904). For example, when the user inputs “upper leaf” as a new word and “upper” and “leaf” are obtained as morphemes, “lower” having the same attribute information as the attribute information “positional relationship” of the notation “upper” Is retrieved from the dictionary 121.

次に、表記変換部102は、求めた形態素と同一の属性情報を持つ形態素を辞書121から検索した結果、該当する形態素が存在するか否かを判断する(ステップS1905)。該当する形態素が存在しない場合は(ステップS1905:NO)、単語登録部103が、受付けた新語を辞書121に登録する(ステップS1906)。   Next, the notation conversion unit 102 determines whether or not the corresponding morpheme exists as a result of searching the dictionary 121 for the morpheme having the same attribute information as the obtained morpheme (step S1905). If the corresponding morpheme does not exist (step S1905: NO), the word registration unit 103 registers the accepted new word in the dictionary 121 (step S1906).

該当する形態素が存在する場合は(ステップS1905:YES)、表記変換部102は、入力された新語における該当部分の形態素の表記を、辞書121から検索した形態素の表記に変換する(ステップS1907)。上述の例では、“上葉”の“上”の部分を“下”に変換した表記“下葉”が表記を変換した単語として生成される。該当する形態素が複数存在する場合は、その組み合わせの数に相当する個数の単語が、表記を変換した単語として生成される。   If the corresponding morpheme exists (step S1905: YES), the notation conversion unit 102 converts the notation of the corresponding part of the input new word into the notation of the morpheme retrieved from the dictionary 121 (step S1907). In the above example, the notation “lower leaf” obtained by converting the “upper” portion of “upper leaf” to “lower” is generated as a word obtained by converting the notation. When there are a plurality of corresponding morphemes, the number of words corresponding to the number of combinations is generated as words whose notation is converted.

ステップS1908からステップS1911までの、変換表記確認画面表示処理、登録指定判定処理、辞書登録処理、登録結果確認画面表示処理は、第1の実施の形態にかかる辞書登録装置100におけるステップS406からステップS409までと同様の処理なので、その説明を省略する。   The conversion notation confirmation screen display processing, registration designation determination processing, dictionary registration processing, and registration result confirmation screen display processing from step S1908 to step S1911 are performed from step S406 to step S409 in the dictionary registration device 100 according to the first embodiment. Since it is the same processing as before, the description thereof is omitted.

このように、第5の実施の形態にかかる辞書登録装置1700では、表記変換規則表を使用せずに、属性情報を格納した辞書を参照することで表記の変換を行うことができる。   As described above, the dictionary registration apparatus 1700 according to the fifth embodiment can convert the notation by referring to the dictionary storing the attribute information without using the notation conversion rule table.

なお、本実施の形態では、第1の実施の形態において表記変換規則表120の代わりに辞書121の属性情報を参照して表記の変換をする例を示したが、第2〜第4の実施の形態においても、表記変換規則表120の代わりに辞書121の属性情報を参照して表記の変換をするように構成することができる。   In this embodiment, the example in which the notation conversion is performed by referring to the attribute information of the dictionary 121 instead of the notation conversion rule table 120 in the first embodiment has been described. Also in this form, it is possible to convert the notation by referring to the attribute information of the dictionary 121 instead of the notation conversion rule table 120.

第1〜第5の実施の形態にかかる辞書登録装置は、CPUなどの制御装置と、ROM(Read Only Memory)やRAMなどの記憶装置と、HDD、CDドライブ装置などの外部記憶装置と、ディスプレイ装置などの表示装置と、キーボードやマウスなどの入力装置を備えており、通常のコンピュータを利用したハードウェア構成となっている。   The dictionary registration device according to the first to fifth embodiments includes a control device such as a CPU, a storage device such as a ROM (Read Only Memory) and a RAM, an external storage device such as an HDD and a CD drive device, and a display. It has a display device such as a device and an input device such as a keyboard and a mouse, and has a hardware configuration using a normal computer.

第1〜第5の実施の形態にかかる辞書登録装置で実行される辞書登録プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。   The dictionary registration program executed by the dictionary registration apparatus according to the first to fifth embodiments is an installable or executable file, CD-ROM, flexible disk (FD), CD-R, DVD. (Digital Versatile Disk) or the like recorded on a computer-readable recording medium.

また、第1〜第5の実施の形態にかかる辞書登録装置で実行される辞書登録プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、第1〜第5の実施の形態にかかる辞書登録装置で実行される辞書登録プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。   Further, the dictionary registration program executed by the dictionary registration apparatus according to the first to fifth embodiments is stored on a computer connected to a network such as the Internet and provided by being downloaded via the network. It may be configured. Moreover, you may comprise so that the dictionary registration program performed with the dictionary registration apparatus concerning the 1st-5th embodiment may be provided or distributed via networks, such as the internet.

また、第1〜第5の実施の形態の辞書登録プログラムを、ROM等に予め組み込んで提供するように構成してもよい。   Moreover, you may comprise so that the dictionary registration program of 1st-5th embodiment may be provided by previously incorporating in ROM etc.

第1〜第5の実施の形態にかかる辞書登録装置で実行される辞書登録プログラムは、上述した各部(未知語検出部、入力受付部、表記変換部、単語登録部、変換表記判定部、変換表記分割部)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から辞書登録プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、未知語検出部、入力受付部、表記変換部、単語登録部、変換表記判定部、変換表記分割部が主記憶装置上に生成されるようになっている。   The dictionary registration program executed by the dictionary registration device according to the first to fifth embodiments includes the above-described units (unknown word detection unit, input reception unit, notation conversion unit, word registration unit, conversion notation determination unit, conversion). As the actual hardware, the CPU (processor) reads the dictionary registration program from the storage medium and executes it to load each unit on the main storage device. A word detection unit, an input reception unit, a notation conversion unit, a word registration unit, a conversion notation determination unit, and a conversion notation division unit are generated on the main storage device.

以上のように、本発明にかかる辞書登録装置、辞書登録方法および辞書登録プログラムは、辞書に登録されていない単語を追加登録する機能を有する文書作成システム、かな漢字変換システム、音声認識システムに適している。   As described above, the dictionary registration device, the dictionary registration method, and the dictionary registration program according to the present invention are suitable for a document creation system, a kana-kanji conversion system, and a speech recognition system having a function of additionally registering words that are not registered in the dictionary. Yes.

第1の実施の形態にかかる辞書登録装置の構成を示すブロック図である。It is a block diagram which shows the structure of the dictionary registration apparatus concerning 1st Embodiment. 表記変換規則表の一例を示す説明図である。It is explanatory drawing which shows an example of a notation conversion rule table. 辞書の一例を示す説明図である。It is explanatory drawing which shows an example of a dictionary. 第1の実施の形態にかかる辞書登録装置における未知語登録処理を示すフローチャートである。It is a flowchart which shows the unknown word registration process in the dictionary registration apparatus concerning 1st Embodiment. 入力画面の一例を示す模式図である。It is a schematic diagram which shows an example of an input screen. 変換表記確認画面の一例を示す模式図である。It is a schematic diagram which shows an example of a conversion notation confirmation screen. 登録結果確認画面の一例を示す模式図である。It is a schematic diagram which shows an example of a registration result confirmation screen. 第1の実施の形態にかかる辞書登録装置における未知語登録処理の一例を示す模式図である。It is a schematic diagram which shows an example of the unknown word registration process in the dictionary registration apparatus concerning 1st Embodiment. 第2の実施の形態にかかる辞書登録装置の構成を示すブロック図である。It is a block diagram which shows the structure of the dictionary registration apparatus concerning 2nd Embodiment. 第2の実施の形態にかかる辞書登録装置における未知語登録処理を示すフローチャートである。It is a flowchart which shows the unknown word registration process in the dictionary registration apparatus concerning 2nd Embodiment. 第2の実施の形態にかかる辞書登録装置における未知語登録処理の一例を示す模式図である。It is a schematic diagram which shows an example of the unknown word registration process in the dictionary registration apparatus concerning 2nd Embodiment. 第3の実施の形態にかかる辞書登録装置の構成を示すブロック図である。It is a block diagram which shows the structure of the dictionary registration apparatus concerning 3rd Embodiment. 第3の実施の形態にかかる辞書登録装置における未知語登録処理を示すフローチャートである。It is a flowchart which shows the unknown word registration process in the dictionary registration apparatus concerning 3rd Embodiment. 第3の実施の形態にかかる辞書登録装置における未知語登録処理の一例を示す模式図である。It is a schematic diagram which shows an example of the unknown word registration process in the dictionary registration apparatus concerning 3rd Embodiment. 第4の実施の形態にかかる辞書登録装置の構成を示すブロック図である。It is a block diagram which shows the structure of the dictionary registration apparatus concerning 4th Embodiment. 第4の実施の形態にかかる辞書登録装置における未知語登録処理を示すフローチャートである。It is a flowchart which shows the unknown word registration process in the dictionary registration apparatus concerning 4th Embodiment. 第5の実施の形態にかかる辞書登録装置の構成を示すブロック図である。It is a block diagram which shows the structure of the dictionary registration apparatus concerning 5th Embodiment. 第5の実施の形態にかかる辞書登録装置における辞書の一例を示す説明図である。It is explanatory drawing which shows an example of the dictionary in the dictionary registration apparatus concerning 5th Embodiment. 第5の実施の形態にかかる辞書登録装置における未知語登録処理を示すフローチャートである。It is a flowchart which shows the unknown word registration process in the dictionary registration apparatus concerning 5th Embodiment.

符号の説明Explanation of symbols

100、900、1200、1500、1700 辞書登録装置
101 入力受付部
102 表記変換部
103 単語登録部
110 ユーザI/F
120 表記変換規則表
121 辞書
501 読み入力フィールド
502 表記入力フィールド
503 品詞入力フィールド
504 登録ボタン
505 キャンセルボタン
601 チェックボックス
602 登録ボタン
603 キャンセルボタン
701 閉じるボタン
901 未知語検出部
1201 変換表記判定部
1202 変換表記分割部
100, 900, 1200, 1500, 1700 Dictionary registration device 101 Input reception unit 102 Notation conversion unit 103 Word registration unit 110 User I / F
120 Notation Conversion Rule Table 121 Dictionary 501 Reading Input Field 502 Notation Input Field 503 Part-of-Speech Input Field 504 Registration Button 505 Cancel Button 601 Check Box 602 Registration Button 603 Cancel Button 701 Close Button 901 Unknown Word Detection Unit 1201 Conversion Notation Determination Unit 1202 Conversion Notation Dividing part

Claims (7)

単語と単語の属性情報とを対応づけた辞書を記憶する辞書記憶手段と、
前記辞書に登録されていない未知語の入力を受付ける入力受付手段と、
前記未知語の表記の一部または全部と同一の属性情報を持つ少なくとも1つの単語を前記辞書記憶手段から検索し、検索した単語と同一の属性情報を持つ前記未知語の表記の一部または全部を、検索した単語の表記に変換した少なくとも1つの変換単語を生成する表記変換手段と、
前記変換単語および前記未知語を前記辞書に登録する単語登録手段と、
を備えたことを特徴とする辞書登録装置。
Dictionary storage means for storing a dictionary in which words and word attribute information are associated with each other;
Input receiving means for receiving an input of an unknown word that is not registered in the dictionary;
The dictionary storage means is searched for at least one word having the same attribute information as part or all of the unknown word notation, and part or all of the unknown word notation having the same attribute information as the searched word A notation conversion means for generating at least one converted word obtained by converting into a notation of the searched word,
Word registration means for registering the converted word and the unknown word in the dictionary;
A dictionary registration device comprising:
前記変換単語の個数が予め定められた個数を超える場合に、前記変換単語の表記は前記辞書に登録する単語の表記として妥当でないと判定する変換表記判定手段と、
前記変換表記判定手段が登録する単語として妥当でないと判定した前記変換単語の表記を構成要素に分割する変換表記分割手段とをさらに備え、
前記単語登録手段は、前記変換表記分割手段が分割した前記構成要素および前記未知語を前記辞書に登録することを特徴とする請求項1に記載の辞書登録装置。
Conversion notation determining means for determining that the notation of the conversion word is not valid as the notation of the word registered in the dictionary when the number of the conversion words exceeds a predetermined number;
A conversion notation dividing means for dividing the notation of the converted word determined to be invalid as a word to be registered by the conversion notation determining means, into component elements;
2. The dictionary registration apparatus according to claim 1, wherein the word registration unit registers the component and the unknown word divided by the conversion notation division unit in the dictionary.
前記変換単語の文字列長が予め定められた文字列長を超える場合に、前記変換単語の表記は前記辞書に登録する単語の表記として妥当でないと判定する変換表記判定手段と、
前記変換表記判定手段が登録する単語として妥当でないと判定した前記変換単語の表記を構成要素に分割する変換表記分割手段とをさらに備え、
前記単語登録手段は、前記変換表記分割手段が分割した前記構成要素および前記未知語を前記辞書に登録することを特徴とする請求項1に記載の辞書登録装置。
Conversion notation determining means for determining that the notation of the conversion word is not valid as the notation of the word to be registered in the dictionary when the character string length of the conversion word exceeds a predetermined character string length;
A conversion notation dividing means for dividing the notation of the converted word determined to be invalid as a word to be registered by the conversion notation determining means, into component elements;
2. The dictionary registration apparatus according to claim 1, wherein the word registration unit registers the component and the unknown word divided by the conversion notation division unit in the dictionary.
前記変換表記分割手段は、前記表記変換手段が変換した表記の部分と変換しない表記の部分とを構成要素として分割し、分割した構成要素のうち前記辞書に登録されていない構成要素を選択し、
前記単語登録手段は、選択された構成要素および前記未知語を前記辞書に登録すること、
を特徴とする請求項2および3のいずれか1つに記載の辞書登録装置。
The conversion notation dividing unit divides a notation part converted by the notation conversion unit and a notation part not converted as a component, and selects a component not registered in the dictionary from among the divided components,
The word registration means registering the selected component and the unknown word in the dictionary;
The dictionary registration device according to claim 2, wherein:
前記変換表記分割手段は、前記表記変換手段が変換した表記を形態素解析し、形態素解析により求めた形態素を構成要素として分割し、分割した構成要素のうち前記辞書に登録されていない構成要素を選択し、
前記単語登録手段は、選択された構成要素および前記未知語を前記辞書に登録すること、
を特徴とする請求項2および3のいずれか1つに記載の辞書登録装置。
The conversion notation dividing unit morphologically analyzes the notation converted by the notation conversion unit, divides the morpheme obtained by morpheme analysis as a component, and selects a component that is not registered in the dictionary from among the divided components And
The word registration means registering the selected component and the unknown word in the dictionary;
The dictionary registration device according to claim 2, wherein:
入力受付手段が、単語と単語の属性情報とを対応づけた辞書を記憶する辞書記憶手段に記憶されている前記辞書に登録されていない未知語の入力を受付ける入力受付ステップと、
表記変換手段が、前記未知語の表記の一部または全部と同一の属性情報を持つ少なくとも1つの単語を前記辞書記憶手段から検索し、検索した単語と同一の属性情報を持つ前記未知語の表記の一部または全部を、検索した単語の表記に変換した少なくとも1つの変換単語を生成する表記変換ステップと、
単語登録手段が、前記変換単語および前記未知語を前記辞書に登録する辞書登録ステップと、
を備えたことを特徴とする辞書登録方法。
An input receiving step for receiving an input of an unknown word that is not registered in the dictionary stored in a dictionary storage unit that stores a dictionary that associates a word with word attribute information;
The notation conversion means searches the dictionary storage means for at least one word having the same attribute information as part or all of the notation of the unknown word, and the notation of the unknown word having the same attribute information as the searched word A notation conversion step for generating at least one converted word in which a part or all of is converted into a searched word notation;
A dictionary registration step in which word registration means registers the converted word and the unknown word in the dictionary;
A dictionary registration method comprising:
単語と単語の属性情報とを対応づけた辞書を記憶する辞書記憶手段に記憶されている前記辞書に登録されていない未知語の入力を受付ける入力受付手順と、
前記未知語の表記の一部または全部と同一の属性情報を持つ少なくとも1つの単語を前記辞書記憶手段から検索し、検索した単語と同一の属性情報を持つ前記未知語の表記の一部または全部を、検索した単語の表記に変換した少なくとも1つの変換単語を生成する表記変換手順と、
前記変換単語および前記未知語を前記辞書に登録する辞書登録手順と、
をコンピュータに実行させるための辞書登録プログラム。
An input reception procedure for receiving an input of an unknown word that is not registered in the dictionary stored in a dictionary storage unit that stores a dictionary that associates a word with word attribute information;
The dictionary storage means is searched for at least one word having the same attribute information as part or all of the unknown word notation, and part or all of the unknown word notation having the same attribute information as the searched word A notation conversion procedure for generating at least one converted word converted into the notation of the searched word,
A dictionary registration procedure for registering the converted word and the unknown word in the dictionary;
Dictionary registration program for causing a computer to execute the.
JP2004349050A 2004-12-01 2004-12-01 Dictionary registration device, dictionary registration method, and dictionary registration program Expired - Fee Related JP4192142B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004349050A JP4192142B2 (en) 2004-12-01 2004-12-01 Dictionary registration device, dictionary registration method, and dictionary registration program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004349050A JP4192142B2 (en) 2004-12-01 2004-12-01 Dictionary registration device, dictionary registration method, and dictionary registration program

Publications (2)

Publication Number Publication Date
JP2006155529A JP2006155529A (en) 2006-06-15
JP4192142B2 true JP4192142B2 (en) 2008-12-03

Family

ID=36633705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004349050A Expired - Fee Related JP4192142B2 (en) 2004-12-01 2004-12-01 Dictionary registration device, dictionary registration method, and dictionary registration program

Country Status (1)

Country Link
JP (1) JP4192142B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009258293A (en) * 2008-04-15 2009-11-05 Mitsubishi Electric Corp Speech recognition vocabulary dictionary creator
JP5332605B2 (en) * 2008-12-26 2013-11-06 富士通株式会社 Sentence example database construction program, sentence example display program, sentence example database construction method, and sentence example display method
JP2021140645A (en) 2020-03-09 2021-09-16 オムロン株式会社 Word registration device, word registration method and word registration program

Also Published As

Publication number Publication date
JP2006155529A (en) 2006-06-15

Similar Documents

Publication Publication Date Title
JP4301515B2 (en) Text display method, information processing apparatus, information processing system, and program
JP5599662B2 (en) System and method for converting kanji into native language pronunciation sequence using statistical methods
JP4701292B2 (en) Computer system, method and computer program for creating term dictionary from specific expressions or technical terms contained in text data
US8655641B2 (en) Machine translation apparatus and non-transitory computer readable medium
JPWO2011129198A1 (en) Inconsistency detection system, method, and program
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP4192142B2 (en) Dictionary registration device, dictionary registration method, and dictionary registration program
JP2000067056A (en) Device for extracting numerical information and device for retrieving numerical information and storage medium for storing numerical information extraction program and storage medium for storing numerical information retrieval program
US12499328B2 (en) Tonal language dictionary search device, tonal language dictionary search method, and non-transitory computer-readable storage medium storing a computer program readable by a computer of a tonal language dictionary search device
JP6303508B2 (en) Document analysis apparatus, document analysis system, document analysis method, and program
CN106250354B (en) Information processing apparatus, information processing method, and program for processing document
JP5326781B2 (en) Extraction rule creation system, extraction rule creation method, and extraction rule creation program
JPH1011443A (en) Document code check system
JPH11238051A (en) Chinese input conversion processing device, Chinese input conversion processing method, recording medium recording Chinese input conversion processing program
JP5443788B2 (en) Formal name determination system and formal name determination program
JP4266240B1 (en) Item judgment system and item judgment program
JP4922030B2 (en) Character string search apparatus, method and program
JP4304146B2 (en) Dictionary registration device, dictionary registration method, and dictionary registration program
US20240354517A1 (en) Systems and methods for detecting sensitive text in documents
JP6203083B2 (en) Unknown word extraction device and unknown word extraction method
JP2776069B2 (en) Document inspection device
JP4047895B2 (en) Document proofing apparatus and program storage medium
JP2001109740A (en) Chinese document creation device and Chinese document creation method
JP2020013178A (en) Answer classification support system, answer classification support method and answer classification support program
JP4047894B2 (en) Document proofing apparatus and program storage medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071113

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080715

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080916

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080919

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees