JP3403715B2 - Machine translation equipment - Google Patents
Machine translation equipmentInfo
- Publication number
- JP3403715B2 JP3403715B2 JP2001084925A JP2001084925A JP3403715B2 JP 3403715 B2 JP3403715 B2 JP 3403715B2 JP 2001084925 A JP2001084925 A JP 2001084925A JP 2001084925 A JP2001084925 A JP 2001084925A JP 3403715 B2 JP3403715 B2 JP 3403715B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- paraphrase
- sentence
- source language
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明は、換言機構を両言語
に備えた機械翻訳装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a machine translation device provided with a paraphrasing mechanism for both languages.
【0002】[0002]
【従来の技術及び発明が解決しようとする課題】翻訳困
難な表現や構文の機械翻訳の翻訳品質を向上させるため
の従来の自動編集、自動書き換えなど(以下、換言とい
う)は、機構的には従来技術の機械翻訳機構と同等又は
その一部であり、換言の結果が複数個可能であれば、そ
れらの結果の中から人間の操作者が一つを選択すること
が必要であった。こうした換言機構を備えただけの翻訳
装置では、操作者は原言語及び目的言語(例えば日英翻
訳においては原言語は日本語、目的言語は英語)の知識
を持ち、換言の結果を選択する能力を備える必要があっ
たため、当該翻訳装置の利用者が限定されるという問題
点があった。2. Description of the Related Art Conventional automatic editing, automatic rewriting, etc. (hereinafter referred to as paraphrasing) for improving the translation quality of machine translation of difficult-to-translate expressions and syntaxes are mechanically If the machine translation mechanism is equivalent to or a part of the machine translation mechanism of the related art and a plurality of paraphrasing results are possible, it is necessary for a human operator to select one from the results. In a translation device having only such paraphrasing mechanism, an operator has knowledge of a source language and a target language (for example, in Japanese-English translation, the source language is Japanese and the target language is English), and the ability to select the result of the paraphrase. Therefore, there is a problem that users of the translation device are limited.
【0003】あるいは、換言の結果が複数個可能になら
ないように、換言操作の根拠となる知識(以下、換言知
識という)の条件を予め詳細に設定しておかなければな
らなかった。こうした換言機構を備えただけの翻訳装置
では、換言機構以外の狭義の翻訳(以下、言語変換とい
う)機構における言語変換の根拠となる知識の開発及び
準備の負荷の一部を、換言知識の開発及び準備の負荷に
転嫁したものであり、当該翻訳装置の性能は開発者の知
識と能力に大きく左右される点に変わりなかった。この
ため、機械翻訳装置の開発には大きな資源が必要である
という問題点があった。Alternatively, the condition of knowledge (hereinafter referred to as paraphrase knowledge) which is the basis of paraphrase operation must be set in advance in advance so that a plurality of paraphrase results cannot be obtained. In a translation device having only such a paraphrasing mechanism, a part of the load of development and preparation of knowledge that is the basis for language conversion in a translation mechanism in a narrow sense other than the paraphrasing mechanism (hereinafter referred to as language conversion) It was passed on to the load of preparation and preparation, and the performance of the translation device remained largely dependent on the knowledge and ability of the developer. Therefore, there has been a problem that development of a machine translation device requires a large amount of resources.
【0004】本発明の目的は以上の問題点を解決し、換
言機構を両言語に備えた機械翻訳装置において、原言語
と目的言語の知識を持たない操作者が使用可能であり、
開発に必要な資源(例えば、時間、手間、及び人的資源
など)を低減可能な機械翻訳装置を提供することにあ
る。The object of the present invention is to solve the above problems, and in a machine translation device provided with a paraphrasing mechanism for both languages, it can be used by an operator who does not have knowledge of the source language and the target language,
It is to provide a machine translation device capable of reducing the resources required for development (for example, time, labor, and human resources).
【0005】[0005]
【課題を解決するための手段】第1の発明に係る機械翻
訳装置は、原言語文を目的言語文に翻訳する機械翻訳装
置において、上記原言語文を解析して上記原言語文の単
語又は句である原言語文の構成要素を抽出し、原言語の
換言操作の換言前後の構成要素の対にてなる原言語の換
言操作を参照して、上記原言語文の構成要素に対する、
上記原言語の換言操作の換言前の構成要素の近似の程度
を示す第1のスコアを計算し、最大の第1のスコアを有
する上記原言語の換言操作の換言前の構成要素を含む上
記原言語の換言操作を選択し、選択された上記原言語の
換言操作を用いて上記原言語文を換言後の原言語文に換
言するとともに、選択された上記原言語の換言操作の処
理の前後の差違を表す差違情報を生成する原言語換言処
理部と、原言語の構成要素と対応する目的言語の構成要
素との対にてなる言語変換知識を参照して、上記換言後
の原言語文を目的言語文に言語変換する言語変換処理部
と、上記目的言語文を解析して上記目的言語文の単語又
は句である目的言語文の構成要素を抽出し、上記差違情
報に基づいて、目的言語の換言操作の換言前後の構成要
素の対にてなる目的言語の換言操作を参照して、上記目
的言語文の構成要素に対する、上記差違情報と反対の換
言操作を行う上記目的言語の換言操作の換言前の構成要
素の近似の程度を示す第2のスコアを計算し、最大の第
2のスコアを有する上記目的言語の換言操作の換言前の
構成要素を含む上記目的言語の換言操作を選択し、選択
された上記目的言語の換言操作を用いて上記目的言語文
を換言後の目的言語文に換言する目的言語換言処理部と
を備えたことを特徴とする。A machine translation device according to a first aspect of the present invention is a machine translation device for translating a source language sentence into a target language sentence, analyzes the source language sentence, and extracts words or words in the source language sentence. Extract the constituent elements of the source language sentence that is a phrase, refer to the paraphrasing operation of the source language consisting of a pair of constituent elements before and after the paraphrase of the paraphrasing operation of the source language, for the constituent elements of the source language sentence,
A first score indicating the degree of approximation of the pre-paraphrase component of the source language paraphrasing operation is calculated, and the original score including the pre-paraphrase component of the source language paraphrasing operation having the maximum first score is calculated. Select a language paraphrasing operation, paraphrase the source language sentence into a post-paraphrase source language sentence using the selected source language paraphrase operation, and select before and after processing of the selected source language paraphrase operation. The source language paraphrase processing unit that generates the difference information indicating the difference and the language conversion knowledge that is a pair of the source language constituent element and the corresponding target language constituent element are referred to A language conversion processing unit that performs language conversion into a target language sentence, and extracts the constituent elements of the target language sentence that are words or phrases of the target language sentence by analyzing the target language sentence, and based on the difference information, the target language An eye consisting of a pair of components before and after the paraphrase operation A second score indicating the degree of approximation of the component before the paraphrase of the paraphrase operation of the target language, which performs the paraphrase operation opposite to the difference information, with respect to the component of the target language sentence, with reference to the paraphrase operation of the language. And selecting a paraphrase operation of the target language that includes a component before paraphrase operation of the paraphrase operation of the target language having the maximum second score, and using the paraphrase operation of the selected target language to select the objective And a target language paraphrasing processing unit that paraphrases the language sentence into the target language sentence after paraphrasing.
【0006】また、第2の発明に係る機械翻訳装置は、
原言語文を目的言語文に翻訳する機械翻訳装置におい
て、上記原言語文を解析して上記原言語文の単語又は句
である原言語文の構成要素を抽出し、原言語の換言操作
の換言前後の構成要素の対にてなる原言語の換言操作を
参照して、上記原言語文の構成要素に対する、上記原言
語の換言操作の換言前の構成要素の近似の程度を示す第
1のスコアを計算し、最大の第1のスコアを有する上記
原言語の換言操作の換言前の構成要素を含む上記原言語
の換言操作を選択し、選択された上記原言語の換言操作
を用いて上記原言語文を換言後の原言語文に換言する原
言語換言処理部と、原言語の構成要素と対応する目的言
語の構成要素との対にてなる言語変換知識を参照して、
上記換言後の原言語文を目的言語文に言語変換する言語
変換処理部と、上記目的言語文を解析して上記目的言語
文の単語又は句である目的言語文の構成要素を抽出し、
上記差違情報に基づいて、目的言語の換言操作の換言前
後の構成要素の対にてなる所定の目的言語の換言操作を
参照して、上記目的言語文の構成要素に対する、上記目
的言語の換言操作の換言前の構成要素の近似の程度を示
す第2のスコアを計算し、最大の第2のスコアを有する
上記目的言語の換言操作の換言前の構成要素を含む上記
目的言語の換言操作を選択し、選択された上記目的言語
の換言操作を用いて上記目的言語文を換言後の目的言語
文に換言する目的言語換言処理部とを備え、上記言語変
換処理部は、上記言語変換知識の原言語の構成要素を参
照して、上記換言後の原言語文に対する、上記言語変換
知識の原言語の構成要素の近似の程度を示す第3のスコ
アを計算し、計算した第3のスコアの値が所定のしきい
値より高いときは、最大の第3のスコアを有する上記言
語変換知識の原言語の構成要素を含む上記言語変換知識
を選択し、選択された上記言語変換知識を用いて上記換
言後の原言語文を上記目的言語文に言語変換する一方、
計算した第3のスコアの値が上記しきい値以下のとき
は、最大の第3のスコアを有する上記言語変換知識の原
言語の構成要素を翻訳可能文情報として選択して上記原
言語換言処理部に出力し、上記原言語換言処理部は、上
記原言語文の構成要素に対する上記原言語の換言操作の
換言前の構成要素の近似の程度と、上記翻訳可能文情報
に対する上記原言語の換言操作の換言後の構成要素の近
似の程度とを示す第1のスコアを計算し、最大の第1の
スコアを有する原言語の換言操作の換言前後の構成要素
を含む上記原言語の換言操作を選択し、選択された上記
原言語の換言操作を用いて上記原言語文を換言後の原言
語文に換言することを特徴とする。A machine translation device according to the second invention is
In a machine translation device for translating a source language sentence into a target language sentence, the source language sentence is analyzed to extract the constituent elements of the source language sentence that are words or phrases of the source language sentence, and paraphrase of the paraphrase operation of the source language A first score indicating a degree of approximation of a component before paraphrase of the paraphrase operation of the source language with respect to a component of the source language sentence, with reference to a paraphrase operation of a source language composed of a pair of front and rear components And selecting a paraphrasing operation of the source language that includes a component before paraphrasing the paraphrasing operation of the source language having the maximum first score, and using the paraphrasing operation of the selected source language to select the source language With reference to the source language paraphrasing processing unit that paraphrases the language sentence into the source language sentence after paraphrase, and the language conversion knowledge that is a pair of the source language component and the corresponding target language component,
A language conversion processing unit that converts the source language sentence after the paraphrase into a target language sentence, and extracts the constituent elements of the target language sentence that are words or phrases of the target language sentence by analyzing the target language sentence,
On the basis of the difference information, referring to the paraphrasing operation of a predetermined target language consisting of a pair of components before and after paraphrasing the paraphrasing operation of the target language, the paraphrasing operation of the target language for the constituent elements of the target language sentence Calculating a second score indicating the degree of approximation of the pre-paraphrase component, and selecting the paraphrase operation of the target language including the preparaphrase component of the paraphrase operation of the target language having the maximum second score. And a target language paraphrasing processing unit that paraphrases the target language sentence into a target language sentence after paraphrasing using the paraphrasing operation of the selected target language, and the language conversion processing unit is a source of the language conversion knowledge. A third score indicating the degree of approximation of the source language component of the language conversion knowledge with respect to the source language sentence after the paraphrase is calculated with reference to the language component, and the calculated third score value Is higher than a given threshold The language conversion knowledge including the source language component of the language conversion knowledge having the maximum third score is selected, and the source language sentence after the paraphrase is converted into the target language sentence using the selected language conversion knowledge. While converting the language to
When the calculated value of the third score is equal to or less than the threshold value, the source language constituent element of the source language of the language conversion knowledge having the maximum third score is selected as the translatable sentence information, and the source language paraphrasing process is performed. The source language paraphrasing processing unit outputs, to the source language paraphrase processing unit, the degree of approximation of the pre-paraphrase component of the paraphrase operation of the source language with respect to the component of the source language sentence, and the paraphrase of the source language with respect to the translatable sentence information. A first score indicating the degree of approximation of the component after the paraphrase of the operation is calculated, and the paraphrase operation of the source language including the components before and after the paraphrase of the paraphrase operation of the source language having the maximum first score is performed. It is characterized in that the source language sentence is paraphrased into the source language sentence after paraphrase by using the paraphrase operation of the selected source language.
【0007】[0007]
【発明の実施の形態】以下、図面を参照して本発明の実
施形態について説明する。BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings.
【0008】図1は、本発明の実施形態に係る機械翻訳
装置3を備えた音声翻訳合成システムの構成を示すブロ
ック図である。この音声翻訳合成システムは、音声認識
装置2、機械翻訳装置3及び音声合成装置4を備えて構
成され、機械翻訳装置3は、従来技術の問題点を解決す
るために、ある原言語文又は目的言語に翻訳された原言
語文に対して複数個存在する可能な換言の中から自動的
に1つを選択する両言語の換言機構を、図2に示すよう
に、言語変換処理部12の両側の原言語換言処理部11
及び目的言語換言処理部13とに設け、(A)原言語換
言処理部11は、選択された原言語の換言操作の処理の
前後の差違を表す差違情報を生成し、目的言語換言処理
部13は、上記差違情報に基づいて、目的言語の換言操
作の換言前後の構成要素の対にてなる目的言語の換言操
作を参照して、上記目的言語文の構成要素に対する、上
記差違情報と反対の換言操作を行う上記目的言語の換言
操作の換言前の構成要素の近似の程度を示す第2のスコ
アを計算し、最大の第2のスコアを有する上記目的言語
の換言操作の換言前の構成要素を含む上記目的言語の換
言操作を選択すること、並びに、(B)言語変換処理部
12は、上記言語変換知識の原言語の構成要素を参照し
て、上記換言後の原言語文に対する、上記言語変換知識
の原言語の構成要素の近似の程度を示す第3のスコアを
計算し、計算した第3のスコアの値が上記しきい値以下
のときは、最大の第3のスコアを有する上記言語変換知
識の原言語の構成要素を翻訳可能文情報として選択して
原言語換言処理部11に帰還して出力し、原言語換言処
理部11は、上記原言語文の構成要素に対する上記原言
語の換言操作の換言前の構成要素の近似の程度と、上記
翻訳可能文情報に対する上記原言語の換言操作の換言後
の構成要素の近似の程度とを示す第1のスコアを計算
し、最大の第1のスコアを有する上記原言語の換言操作
の換言前後の構成要素を含む原言語の換言操作を選択
し、選択された上記原言語の換言操作を用いて上記原言
語文を上記換言後の原言語文に換言することを特徴とし
ている。FIG. 1 is a block diagram showing a configuration of a speech translation synthesis system including a machine translation device 3 according to an embodiment of the present invention. This speech translation synthesis system comprises a speech recognition device 2, a machine translation device 3 and a speech synthesis device 4, and the machine translation device 3 has a certain source language sentence or object in order to solve the problems of the prior art. As shown in FIG. 2, a paraphrasing mechanism for both languages that automatically selects one from a plurality of possible paraphrases for a source language sentence translated into a language is provided on both sides of the language conversion processing unit 12. Source language paraphrasing processing unit 11
And (A) the source language paraphrasing processing unit 11 is provided in the target language paraphrasing processing unit 13 to generate difference information indicating the difference between before and after the processing of the paraphrasing operation of the selected source language. Refers to the paraphrasing operation of the target language consisting of a pair of constituent elements before and after paraphrasing the paraphrasing operation of the target language based on the difference information, and the opposite of the difference information to the constituent element of the target language sentence. A second score indicating the degree of approximation of the pre-paraphrase component of the paraphrasing operation of the target language that performs paraphrasing operation is calculated, and the pre-paraphrase component of the paraphrasing operation of the target language having the maximum second score is calculated. And selecting the paraphrase operation of the target language including (B) the language conversion processing unit 12 with reference to the constituent elements of the source language of the language conversion knowledge, Source language of translation knowledge Is calculated, and when the calculated third score value is less than or equal to the threshold value, the source language component of the language conversion knowledge having the maximum third score. As the translatable sentence information and returning it to the source language paraphrasing processing unit 11 for output, and the source language paraphrasing processing unit 11 outputs the component before the paraphrase of the paraphrase operation of the source language with respect to the component of the source language sentence. And the degree of approximation of the constituents after paraphrase of the paraphrasing operation of the source language with respect to the translatable sentence information are calculated, and the source language having the maximum first score is calculated. Selecting a paraphrasing operation of a source language including components before and after paraphrasing the paraphrasing operation, and paraphrasing the source language sentence to the source language sentence after the paraphrase by using the paraphrasing operation of the selected source language. I am trying.
【0009】図1において、音声翻訳合成システムは、
マイクロホン1と、音声認識装置2と、機械翻訳装置3
と、音声合成装置4と、スピーカ5とを備えて構成され
る。ここで、音声認識装置2と機械翻訳装置3とにより
音声翻訳システムを構成し、機械翻訳装置3と音声合成
装置4とにより翻訳音声合成システムを構成する。In FIG. 1, the speech translation synthesis system is
Microphone 1, voice recognition device 2, machine translation device 3
And a voice synthesizer 4 and a speaker 5. Here, the voice recognition device 2 and the machine translation device 3 configure a voice translation system, and the machine translation device 3 and the voice synthesis device 4 configure a translated voice synthesis system.
【0010】マイクロホン1に入力された原言語文の発
声音声は電気信号に変換された後、音声認識装置2に入
力され、音声認識装置2は公知の音声認識方法を用い
て、入力される原言語文の音声信号を音声認識すること
により原言語文の文字列に変換して機械翻訳装置3に出
力する。次いで、機械翻訳装置3は入力される原言語文
の文字列を詳細後述する方法を用いて、目的言語文の文
字列に機械翻訳した後、音声合成装置4に出力する。さ
らに、音声合成装置4は公知の音声合成方法を用いて、
入力される目的言語文の文字列を音声信号に音声合成し
てスピーカ5から合成音声を出力する。The uttered voice of the source language sentence input to the microphone 1 is converted to an electric signal and then input to the voice recognition device 2, which is input using a known voice recognition method. The voice signal of the language sentence is recognized by voice and converted into a character string of the source language sentence and output to the machine translation device 3. Then, the machine translation device 3 machine-translates the input character string of the source language sentence into a character string of the target language sentence by using a method described in detail later, and then outputs the character string to the speech synthesis device 4. Furthermore, the speech synthesizer 4 uses a known speech synthesis method,
The character string of the input target language sentence is voice-synthesized into a voice signal, and a synthesized voice is output from the speaker 5.
【0011】図2は、図1の機械翻訳装置3の詳細構成
を示すブロック図である。本実施形態の機械翻訳装置3
は、処理制御部10と、上記処理制御部10にそれぞれ
接続された原言語換言処理部11、言語変換処理部12
及び目的言語換言処理部13を備えている。処理制御部
10は、音声認識装置2から入力された原言語文を原言
語換言処理部11に出力し、原言語換言処理部11は上
記原言語文を機械翻訳に適当な表現及び構文に換言して
原言語換言文を生成し、上記原言語換言文と当該換言に
関連する換言知識の差違情報とを処理制御部10に出力
する。この換言の結果、原言語文中の語義及び並列構文
の構造などが特定され、それによって原言語文の持つあ
いまい性が解消される。次いで、処理制御部10は言語
変換処理部12に上記原言語換言文を翻訳原文として入
力し、言語変換処理部12は、上記翻訳原文を目的言語
に言語変換した目的言語翻訳文を生成して処理制御部1
0に出力し、もしくは、当該言語変換が可能でないと
き、翻訳可能文情報を生成して処理制御部10に出力す
る。処理制御部10は、上記生成された翻訳可能文情報
と、それに対応する原言語文とを原言語換言処理部11
に入力し、原言語換言処理部11は、翻訳可能文情報を
参照して、目的言語翻訳文を生成するためにより適切な
換言を実行する。次に、処理制御部10は、目的言語翻
訳文と、上記生成された差異情報とは反対の差異情報を
発生して目的言語換言処理部13に出力し、目的言語換
言処理部13は、原言語での換言処理によって発生した
原言語文との差違を解消するために、上記反対の差違情
報を用いて、目的言語翻訳文を換言後の目的言語文、す
なわち目的言語換言文に換言して処理制御部10に出力
する。最後に、処理制御部10は目的言語文を音声合成
装置4に出力する。FIG. 2 is a block diagram showing a detailed configuration of the machine translation device 3 of FIG. Machine translation device 3 of this embodiment
Is a processing control unit 10, and a source language paraphrasing processing unit 11 and a language conversion processing unit 12 respectively connected to the processing control unit 10.
And a target language paraphrasing processing unit 13. The processing control unit 10 outputs the source language sentence input from the speech recognition device 2 to the source language paraphrase processing unit 11, and the source language paraphrase processing unit 11 paraphrases the source language sentence into an expression and a syntax suitable for machine translation. Then, the source language paraphrase text is generated, and the source language paraphrase text and the difference information of the paraphrase knowledge related to the paraphrase are output to the processing control unit 10. As a result of this paraphrasing, the meaning of words in the source language sentence, the structure of the parallel syntax, etc. are specified, and thereby the ambiguity of the source language sentence is eliminated. Next, the processing control unit 10 inputs the source language paraphrase sentence as a translation source sentence into the language conversion processing unit 12, and the language conversion processing unit 12 generates a target language translation sentence by performing the language conversion of the translation source sentence into a target language. Processing control unit 1
0, or when the language conversion is not possible, translatable sentence information is generated and output to the processing control unit 10. The processing control unit 10 stores the generated translatable sentence information and the corresponding source language sentence in the source language paraphrasing unit 11.
Then, the source language paraphrasing processing unit 11 refers to the translatable sentence information and executes a more appropriate paraphrase for generating the target language translated sentence. Next, the processing control unit 10 generates a target language translation sentence and difference information opposite to the generated difference information, and outputs the difference information to the target language paraphrasing processing unit 13. In order to eliminate the difference between the source language sentence and the source language sentence generated by the language paraphrasing process, the target language translation sentence is paraphrased into the target language sentence after paraphrase, using the opposite difference information. It is output to the processing control unit 10. Finally, the processing control unit 10 outputs the target language sentence to the speech synthesizer 4.
【0012】図3は、図2の原言語換言処理部11の詳
細構成を示すブロック図である。図3において、原言語
換言処理部11は、近似照合処理部112と、上記近似
照合処理部112にそれぞれ接続された原言語解析処理
部111、原言語換言文生成部113及び換言知識メモ
リ114と、上記近似照合処理部112及び上記原言語
解析処理部111に接続された履歴情報メモリ115と
を備えて構成される。FIG. 3 is a block diagram showing a detailed configuration of the source language paraphrasing processing unit 11 of FIG. In FIG. 3, the source language paraphrase processing unit 11 includes an approximate collation processing unit 112, a source language analysis processing unit 111, a source language paraphrase sentence generation unit 113, and a paraphrase knowledge memory 114, which are connected to the approximate collation processing unit 112, respectively. The history information memory 115 connected to the approximate collation processing unit 112 and the source language analysis processing unit 111.
【0013】原言語解析処理部111は、公知の機械翻
訳装置に利用されている公知の形態素解析方法により原
言語文を形態素解析して、原言語文の各構成要素(例え
ば、ある単語又は句)を抽出し、原言語文を換言知識メ
モリ114に記憶された換言知識と照合可能な形式に変
形して原言語文解析結果とする。ここで、上記換言知識
は、原言語の換言前の構成要素(又は文字列)と換言後
の構成要素(又は文字列)とを対にした情報である換言
操作と、上記換言前の構成要素と上記換言後の構成要素
との差違を表す差違情報とのデータを含む。次いで、近
似照合処理部112は、言語変換処理部12において生
成される翻訳可能文情報が入力されない場合、原言語文
解析結果と換言知識の換言操作とを照合し、所定のスコ
ア計算方法を用いて原言語文解析結果の各構成要素とそ
こに適用される換言操作に係る換言前の構成要素との間
の近似の程度を示す第1のスコアを計算し、最大の第1
のスコアを有し、原言語文解析結果に適用可能な換言操
作を記述した換言知識を選択し、選択した換言知識と、
原言語文解析結果とを原言語換言文生成部113に出力
する。第1のスコアの計算は、例えば、別途用意した単
言語コーパスにおける出現確率などにより、複数の換言
候補の間のさまざまな尤度を比較することによって実行
することができる。原言語換言文生成部113は、公知
の方法により、原言語文解析結果を換言知識の換言操作
を用いて原言語換言文に換言して出力する。ここで、公
知の方法とは、例えば公知の機械翻訳装置に利用されて
いる、形態素解析手段、変換手段、生成手段等の手段で
あり、原言語と目的言語が同一言語である点を除けば、
原言語換言文生成部113は公知の機械翻訳装置の機構
と同等又はその一部として構成される。さらに、原言語
換言文生成部113は、選択された換言操作の処理前後
の差違を表す換言知識の差違情報を出力する。原言語換
言処理部11は、後に参照するために、入力される各原
言語文と、それに対する次の表に示された各項目の情報
とを履歴情報メモリ115に記憶する。The source language analysis processing unit 111 morphologically analyzes the source language sentence by a known morpheme analysis method used in a known machine translation device, and each component of the source language sentence (for example, a certain word or phrase). ) Is extracted and the source language sentence is transformed into a format that can be collated with the paraphrase knowledge stored in the paraphrase knowledge memory 114 to obtain the source language sentence analysis result. Here, the paraphrase knowledge is paraphrasing operation which is information in which a constituent element (or character string) before paraphrase of the source language and a constituent element (or character string) after paraphrase are paired, and the constituent element before paraphrase. And the difference information indicating the difference between the component after the above paraphrase. Next, when the translatable sentence information generated by the language conversion processing unit 12 is not input, the approximate matching processing unit 112 matches the source language sentence analysis result with the paraphrase knowledge paraphrase operation, and uses a predetermined score calculation method. Then, a first score indicating the degree of approximation between each constituent element of the source language sentence analysis result and the constituent element before the paraphrase related to the paraphrase operation applied thereto is calculated, and the maximum first score is calculated.
And selecting the paraphrase knowledge describing the paraphrase operation applicable to the source language sentence analysis result, and the selected paraphrase knowledge,
The source language sentence analysis result and the source language paraphrase sentence generation unit 113 are output. The calculation of the first score can be performed by comparing various likelihoods among a plurality of paraphrase candidates, for example, by using an appearance probability in a separately prepared monolingual corpus. The source language paraphrase sentence generation unit 113 paraphrases the source language paraphrase sentence result into a source language paraphrase sentence by using a paraphrase operation of paraphrase knowledge, and outputs the result. Here, the known method is, for example, a means such as a morphological analysis means, a conversion means, a generation means or the like used in a known machine translation device, except that the source language and the target language are the same language. ,
The source language paraphrase sentence generation unit 113 is equivalent to or a part of the mechanism of a known machine translation device. Further, the source language paraphrase text generation unit 113 outputs the paraphrase knowledge difference information indicating the difference before and after the processing of the selected paraphrase operation. The source language paraphrasing unit 11 stores in the history information memory 115 each source language sentence to be input and the information of each item shown in the following table corresponding thereto for reference.
【0014】[0014]
【表1】 ―――――――――――――――――――――――――――――――――――― 原言語文 原言語文の形態素解析結果 対応する換言知識 原言語換言文 ――――――――――――――――――――――――――――――――――――[Table 1] ―――――――――――――――――――――――――――――――――――― Source language sentence Morphological analysis result of source language sentence Corresponding paraphrase knowledge Source language paraphrase sentence ――――――――――――――――――――――――――――――――――――
【0015】一方、言語変換処理部12によって生成さ
れた翻訳可能文情報が入力された場合、近似照合処理部
112は、翻訳可能文情報と原言語文解析結果と換言知
識の換言操作とを照合し、所定のスコア計算方法を用い
て原言語文解析結果の各構成要素とそこに適用される換
言操作に係る換言前の構成要素との間の近似の程度と、
上記翻訳可能文情報と換言操作の換言後の構成要素との
間の近似の程度とを示す第1のスコアを計算し、最大の
第1のスコアを有し、原言語文解析結果に適用可能な換
言操作を記述した換言知識を選択し、選択した換言語知
識と、原言語文解析結果とを原言語換言文生成部113
に出力する。ただし、原言語換言処理部11の他の動作
は、翻訳可能文情報が入力されない場合と同様である。On the other hand, when the translatable sentence information generated by the language conversion processing unit 12 is input, the approximate collation processing unit 112 collates the translatable sentence information, the source language sentence analysis result and the paraphrase knowledge paraphrase operation. Then, the degree of approximation between each component of the source language sentence analysis result using a predetermined score calculation method and the component before paraphrase relating to the paraphrase operation applied thereto,
A first score indicating the degree of approximation between the translatable sentence information and the components after the paraphrasing operation is calculated, and has a maximum first score, and is applicable to the source language sentence analysis result. A paraphrase knowledge describing a simple paraphrase operation is selected, and the selected paraphrase knowledge and the source language sentence analysis result are combined into the source language paraphrase sentence generation unit 113.
Output to. However, other operations of the source language paraphrasing processing unit 11 are the same as when the translatable sentence information is not input.
【0016】図4は、図2の言語変換処理部12の詳細
構成を示すブロック図である。言語変換処理部12は、
原言語照合処理部121と、上記原言語照合処理部12
1に接続された近似照合判定部122及び言語変換知識
メモリ124と、近似照合判定部122に接続された目
的言語文生成部123とを備えて構成される。原言語照
合処理部121は、処理制御部10から翻訳原文として
入力された原言語換言文と、言語変換知識メモリ124
に記憶された言語変換知識の原言語情報とを照合して、
所定のスコア計算方法を用いて翻訳原文とそこに適用さ
れる言語変換知識の原言語情報との間の近似の程度を示
す第3のスコアを計算し、計算した第3のスコアの値で
示される、言語変換処理における言語変換の根拠となる
可能性が、あるしきい値より高い言語変換知識と、翻訳
原文とを、近似照合判定部122に出力する。上記第3
のスコアの計算は、公知の方法を用いて、例えば、翻訳
原文と、言語変換知識の原言語情報との構文上の類似点
を数値化し、それによって各原言語情報に対してスコア
を計算する。言語変換知識は、言語変換知識メモリ12
4に記憶された、原言語の構成要素(すなわち原言語情
報)と目的言語の構成要素(すなわち目的言語情報)と
を対とした情報であり、それによって言語変換知識メモ
リ124は対訳辞書として動作する。ここで、上記しき
い値よりも高い値の第3のスコアを有する言語変換知識
が発見されないときは、機械翻訳装置3による翻訳は実
行されない。近似照合判定部122は、翻訳原文と言語
変換知識の原言語情報とを順次照合して言語変換するか
否かを判定し、言語変換する場合には最大の第3のスコ
アを有する当該言語変換知識を選択して翻訳原文ととも
に目的言語文生成部123に出力し、また、第3のスコ
アの値がすべて所定のしきい値以下であり、言語変換し
ない場合には、翻訳原文と最も近似した、すなわち最大
のスコアを有する言語変換知識の原言語情報を翻訳可能
文情報として出力する。近似照合判定部122は、例え
ば同一翻訳原文に対する近似照合判定回数や、翻訳処理
の経過時間などにより近似照合を徐々に緩和して言語変
換するか否かを判定する。目的言語文生成部123は、
例えば公知の機械翻訳装置に利用されている公知の方法
により、翻訳原文を目的言語翻訳文に言語変換して出力
する。目的言語文生成部123は公知の機械翻訳装置の
機構と同等又はその一部として構成される。FIG. 4 is a block diagram showing the detailed arrangement of the language conversion processing unit 12 shown in FIG. The language conversion processing unit 12
The source language collation processing unit 121 and the source language collation processing unit 12
1 and an approximate matching determination unit 122 and a language conversion knowledge memory 124, and a target language sentence generation unit 123 connected to the approximate matching determination unit 122. The source language collation processing unit 121 includes the source language paraphrase text input as the source translation text from the processing control unit 10 and the language conversion knowledge memory 124.
The source language information of the language conversion knowledge stored in
A third score indicating the degree of approximation between the translation source sentence and the source language information of the language conversion knowledge applied thereto is calculated using a predetermined score calculation method, and is shown by the calculated third score value. The linguistic conversion knowledge having a higher possibility of being the basis for linguistic conversion in the linguistic conversion processing, which is higher than a certain threshold, and the translated original sentence are output to the approximate matching determination unit 122. Third above
For the calculation of the score of, for example, a publicly known method is used to quantify the syntactical similarity between the translation source sentence and the source language information of the language conversion knowledge, and thereby the score is calculated for each source language information. . The language conversion knowledge is stored in the language conversion knowledge memory 12
4 is information in which the constituent elements of the source language (that is, the source language information) and the constituent elements of the target language (that is, the target language information) are stored as a pair, whereby the language conversion knowledge memory 124 operates as a bilingual dictionary. To do. Here, when the language conversion knowledge having the third score higher than the threshold value is not found, the translation by the machine translation device 3 is not executed. The approximate matching determination unit 122 determines whether or not to perform the language conversion by sequentially matching the translation source sentence and the source language information of the language conversion knowledge, and when performing the language conversion, the language conversion having the maximum third score. Knowledge is selected and output to the target language sentence generation unit 123 together with the translated original sentence. Further, when the values of the third scores are all equal to or less than a predetermined threshold value and no language conversion is performed, the closest approximation to the translated original sentence is made. That is, the source language information of the language conversion knowledge having the maximum score is output as translatable sentence information. The approximate matching determination unit 122 determines whether or not to perform the language conversion by gradually relaxing the approximate matching based on the number of times of the approximate matching with respect to the same translated original sentence, the elapsed time of the translation process, and the like. The target language sentence generator 123
For example, a translation source sentence is language-converted into a target language translation sentence by a publicly known method utilized in a publicly known machine translation device, and is output. The target language sentence generator 123 is equivalent to or part of the mechanism of a known machine translation device.
【0017】図5は、図2の目的言語換言処理部13の
詳細構成を示すブロック図である。目的言語換言処理部
13は、近似照合処理部132と、上記近似照合処理部
132にそれぞれ接続された翻訳文解析処理部131、
目的言語換言文生成部133及び換言知識メモリ134
とを備えて構成される。翻訳文解析処理部131は、例
えば公知の機械翻訳装置に利用されている公知の形態素
解析方法を用いて、目的言語翻訳文を形態素解析し、目
的言語翻訳文の各構成要素(例えば、ある単語又は句)
を抽出し、換言知識メモリ134に記憶された換言知識
と照合可能な形式に変形して翻訳文解析結果とする。こ
こで、上記換言知識は、目的言語の換言前の構成要素
(又は文字列)と換言後の構成要素(又は文字列)とを
対にした情報である換言操作と、上記換言操作による換
言前の構成要素と換言後の構成要素との差違を表す差違
情報とにてなるデータの組である。近似照合処理部13
2は、処理制御部10から入力された差違情報と、翻訳
文解析結果と、換言知識メモリ134に記憶された換言
知識の換言操作及び差違情報とを照合し、所定のスコア
計算方法を用いて、翻訳文解析結果の各構成要素に対す
る、上記処理制御部10で生成された反対の差違情報が
反映された換言操作に含まれる換言前の構成要素の近似
の程度を示す第2のスコアを計算し、最大の第2のスコ
アを有し、翻訳文解析結果に適用可能な換言操作を記述
した換言知識を選択し、選択した換言知識と、翻訳文解
析結果とを、目的言語換言文生成部133に出力する。
第2のスコアの計算は、第1のスコアの計算方法と同様
に、例えば、別途用意した単言語コーパスにおける出現
確率などにより、複数の換言候補の間のさまざまな尤度
を比較することによって実行することができる。目的言
語換言文生成部133は公知の方法を用いて、翻訳文解
析結果を換言知識の換言操作を用いて目的言語換言文に
換言して出力する。ここで、公知の方法とは、例えば公
知の機械翻訳装置に利用されている、形態素解析手段、
変換手段、生成手段等の手段であり、原言語と目的言語
が同一言語である点を除けば、目的言語換言文生成部1
33は公知の機械翻訳装置の機構と同等又はその一部と
して構成される。FIG. 5 is a block diagram showing a detailed configuration of the target language paraphrasing processing unit 13 of FIG. The target language paraphrasing processing unit 13 includes an approximate matching processing unit 132 and a translation sentence analysis processing unit 131 connected to the approximate matching processing unit 132,
Target language paraphrase sentence generation unit 133 and paraphrase knowledge memory 134
And is configured. The translation sentence analysis processing unit 131 morphologically analyzes the target language translation sentence by using, for example, a known morphological analysis method used in a known machine translation device, and analyzes each component of the target language translation sentence (for example, a certain word). Or phrase)
Is extracted and transformed into a format that can be collated with the paraphrase knowledge stored in the paraphrase knowledge memory 134 to obtain a translation sentence analysis result. Here, the paraphrase knowledge is paraphrasing operation which is information in which a component (or character string) before paraphrase of the target language and a component (or character string) after paraphrase are paired, and before paraphrase by the paraphrase operation. Is a set of data including difference information indicating a difference between the constituent element and the constituent element after the paraphrase. Approximate matching processing unit 13
2 collates the difference information input from the processing control unit 10, the translated sentence analysis result, and the paraphrase operation of paraphrase knowledge and the difference information stored in the paraphrase knowledge memory 134, and uses a predetermined score calculation method. , Calculating a second score indicating the degree of approximation of the pre-paraphrase component included in the paraphrase operation in which the opposite difference information generated by the processing control unit 10 is reflected for each component of the translated sentence analysis result Then, the paraphrase knowledge having the maximum second score and describing the paraphrase operation applicable to the translation sentence analysis result is selected, and the selected paraphrase knowledge and the translation sentence analysis result are selected as the target language paraphrase sentence generation unit. It outputs to 133.
The calculation of the second score is performed by comparing various likelihoods among a plurality of paraphrase candidates by using, for example, an appearance probability in a separately prepared monolingual corpus, as in the method of calculating the first score. can do. The target language paraphrase sentence generation unit 133 uses a known method to paraphrase the translation sentence analysis result into the target language paraphrase sentence by using the paraphrase operation of the paraphrase knowledge and outputs it. Here, the known method is, for example, a morphological analysis unit used in a known machine translation device,
The target language paraphrase sentence generation unit 1 is a means such as a conversion means and a generation means, except that the source language and the target language are the same language.
The numeral 33 is equivalent to or a part of a mechanism of a known machine translation device.
【0018】本実施形態の機械翻訳装置3では、原言語
換言処理部11及び言語変換処理部12の構成を介し
て、原言語の換言において、複数個適用可能になった換
言操作の中から自動的に一つを選択する機構を設けたこ
とにより、結果的に、複数個可能になった換言の結果の
中から自動的に一つを選択している。また、原言語換言
処理部11、言語変換処理部12及び目的言語換言処理
部13の構成を介して、目的言語の換言において、複数
個適用可能になった換言操作の中から自動的に一つを選
択する機構を設けたことにより、結果的に、複数個可能
になった換言の結果の中から自動的に一つを選択してい
る。In the machine translation device 3 of the present embodiment, the source language paraphrasing processing unit 11 and the language conversion processing unit 12 are used to automatically select from a plurality of paraphrasing operations that are applicable in the source language paraphrasing. As a result, by providing a mechanism for automatically selecting one, one is automatically selected from a plurality of possible paraphrasing results. In addition, through the configuration of the source language paraphrasing processing unit 11, the language conversion processing unit 12, and the target language paraphrasing processing unit 13, in the paraphrase of the target language, one of a plurality of paraphrasing operations that can be applied is automatically performed. As a result, by providing the mechanism for selecting, one is automatically selected from the results of the paraphrases that are possible.
【0019】[0019]
【実施例】以下、例文を用いて、本発明の実施形態に係
る機械翻訳装置の動作について説明する。説明のため
に、以下、原言語が英語、目的言語が日本語であるとす
るが、他の実施形態において、本発明を日本語から英語
への翻訳、又は別の言語間での翻訳のために用いること
を制限しない。ここで、原言語文は "Could I have you
r name, sir?" であるとする。EXAMPLE The operation of the machine translation apparatus according to the embodiment of the present invention will be described below with reference to example sentences. For the sake of explanation, it is assumed that the source language is English and the target language is Japanese, but in another embodiment, the present invention is used for translating from Japanese to English or between different languages. It is not restricted to be used for. Here, the source language sentence is "Could I have you
r name, sir? ".
【0020】処理制御部10は、原言語文 "Could I ha
ve your name, sir?" が入力されると、原言語換言処理
部11に上記原言語文を入力し、原言語換言処理部11
からの出力を待機する。The processing control unit 10 uses the source language sentence "Could I ha
ve your name, sir? "is input, the source language paraphrase processing unit 11 is input with the source language paraphrase processing unit 11 and the source language paraphrase processing unit 11 is input.
Wait for output from.
【0021】原言語換言処理部11は、原言語文 "Coul
d I have your name, sir?" が入力されると、原言語解
析処理部111で原言語文を形態素解析して、換言知識
と照合可能な形式に変形して原言語文解析結果とする。
本実施例では原言語文解析結果は表記上、以下のような
ものになる。The source language paraphrase processing unit 11 uses the source language sentence "Coul.
When "d I have your name, sir?" is input, the source language analysis processing unit 111 morphologically analyzes the source language sentence and transforms it into a format that can be collated with paraphrase knowledge to obtain the source language sentence analysis result.
In this example, the source language sentence analysis result is as follows in terms of notation.
【0022】[0022]
【表2】 ―――――――――――――――――――――――――――――――――――― <文頭> could I have your name <読点> sir <文末> ――――――――――――――――――――――――――――――――――――[Table 2] ―――――――――――――――――――――――――――――――――――― <Start of sentence> could I have your name <reading mark> sir <end of sentence> ――――――――――――――――――――――――――――――――――――
【0023】換言知識は、換言知識メモリ114に記憶
された、原言語における換言操作と差違情報とを対とし
た情報である。以下の表にその例を示す。The paraphrase knowledge is the information stored in the paraphrase knowledge memory 114, which is a pair of the paraphrase operation in the source language and the difference information. An example is shown in the table below.
【0024】[0024]
【表3】 ―――――――――――――――――――――――――――――――――――― 換言操作 差違情報 ―――――――――――――――――――――――――――――――――――― <文頭> could I → <文頭> can I 丁重さ− sir <文末> → (空) <文末> 丁重さ− ――――――――――――――――――――――――――――――――――――[Table 3] ―――――――――――――――――――――――――――――――――――― Paraphrase operation Difference information ―――――――――――――――――――――――――――――――――――― <Text> could I → <text> can I politeness − sir <end of sentence> → (empty) <end of sentence> politeness − ――――――――――――――――――――――――――――――――――――
【0025】原言語の換言操作は、例えば、原言語にお
ける、ある単語又は句の換言前の構成要素と、換言後の
構成要素とを対にした情報である。勿論、換言操作を
「sir<文末>:第1要素を削除」のように操作として記
述してもよい。また、差違情報の別の例として、強調及
び婉曲、女性的な表現の強弱、男性的な表現の強弱など
を含むことができるが、しかしこれらに制限されない。
本実施例では、「丁重さ」に関する、+と−で表された
増減についてのみ考察する。The paraphrasing operation in the source language is, for example, information in which a constituent element before a paraphrase of a certain word or phrase and a constituent element after the paraphrase are paired in the source language. Of course, the paraphrasing operation may be described as an operation such as “sir <end of sentence>: delete first element”. Another example of the difference information may include, but is not limited to, emphasis and euphemism, feminine expression strength, masculine expression strength, and the like.
In this embodiment, only the increase / decrease represented by + and − with respect to “politeness” will be considered.
【0026】近似照合処理部112は、初めの段階では
翻訳可能文情報が入力されないので、上記原言語文解析
結果と上記換言知識とを照合して、所定のスコア計算方
法を用いて原言語文解析結果に対する原言語の換言操作
の換言前の構成要素の近似の程度を示す第1のスコアを
計算して、原言語文解析結果に適用可能な換言操作を記
述した換言知識の内から最大の第1のスコアを有する換
言知識を選択し、当該換言知識と原言語文解析結果とを
原言語換言文生成部113に出力する。本実施例では上
記の原言語文解析結果と換言知識2件とが出力されたも
のとする。Since the translatable sentence information is not input at the initial stage, the approximate collation processing unit 112 collates the source language sentence analysis result with the paraphrase knowledge, and uses a predetermined score calculation method to calculate the source language sentence. The first score showing the degree of approximation of the pre-paraphrase component of the source language paraphrase operation to the analysis result is calculated, and the maximum score is obtained from the paraphrase knowledge describing the paraphrase operation applicable to the source language sentence analysis result. The paraphrase knowledge having the first score is selected, and the paraphrase knowledge and the source language sentence analysis result are output to the source language paraphrase sentence generation unit 113. In the present embodiment, it is assumed that the above-mentioned source language sentence analysis result and two paraphrase knowledge are output.
【0027】原言語換言文生成部113は、従来技術の
手段により、原言語文解析結果を原言語の換言知識の換
言操作を用いて原言語換言文に換言して出力する。本実
施例では原言語換言文は、"Can I have your name?" と
なる。また、原言語換言文生成部113は、選択された
換言操作の処理前後の差違を表す換言知識の差違情報を
出力する。本実施例では差違情報は、「丁重さ−」が2
件となる。The source language paraphrase sentence generating unit 113 paraphrases the source language paraphrase sentence into the source language paraphrase sentence by using the paraphrase operation of the paraphrase knowledge of the source language by means of the conventional technique. In this embodiment, the source language paraphrase is “Can I have your name?”. Further, the source language paraphrase sentence generation unit 113 outputs the paraphrase knowledge difference information indicating the difference before and after the processing of the selected paraphrase operation. In the present embodiment, the difference information is “Politeness-” is 2
It becomes a matter.
【0028】原言語換言処理部11は、処理の経過を履
歴情報メモリ115に保存し、同じ処理が繰り返される
ことを避ける。The source language paraphrasing processing unit 11 saves the progress of processing in the history information memory 115 to avoid repeating the same processing.
【0029】処理制御部10は、上記の原言語換言文と
差違情報とが、原言語換言処理部11から出力される
と、上記差異情報を、当該差違情報とは反対の換言操作
の差異情報に変換して一時的に保存する。この変換は、
例えば予め組み込んだ対応表を参照して行ない、本実施
例では2件の「丁重さ−」をそれぞれ「丁重さ+」とす
る。差違情報についての説明は、後に目的言語換言処理
部13の説明と関連して述べる。When the source language paraphrase sentence and the difference information are output from the source language paraphrase processing unit 11, the processing control unit 10 sets the difference information to the difference information of the paraphrase operation opposite to the difference information. Convert to and save temporarily. This conversion is
For example, the correspondence table incorporated in advance is referred to, and in the present embodiment, the two "weights-" are set to "weights +". The difference information will be described later in connection with the description of the target language paraphrasing processing unit 13.
【0030】処理制御部10は、言語変換処理部12に
上記原言語換言文を翻訳原文として入力し、言語変換処
理部12からの出力を待機する。The processing control unit 10 inputs the above-mentioned original language paraphrase sentence into the language conversion processing unit 12 as a translation source sentence, and waits for an output from the language conversion processing unit 12.
【0031】言語変換処理部12の動作において、ま
ず、原言語照合処理部121は、翻訳原文 "Can I have
your name?" が入力されると、翻訳原文と、言語変換
知識メモリ124に記憶された言語変換知識の原言語情
報とを照合して、所定のスコア計算方法を用いて翻訳原
文に対する言語変換知識の原言語情報の近似の程度を示
す第3のスコアを計算し、計算した第3のスコアの値で
示される、言語変換処理における言語変換の根拠となる
可能性が、あるしきい値より高い言語変換知識と翻訳原
文とを選択し、近似照合判定部122に出力する。In the operation of the language conversion processing unit 12, first, the source language collation processing unit 121 determines that the translated original sentence "Can I have.
When "your name?" is input, the translation source sentence is collated with the source language information of the language translation knowledge stored in the language translation knowledge memory 124, and the language translation knowledge for the translation source sentence is calculated using a predetermined score calculation method. A third score indicating the degree of approximation of the source language information of is calculated, and the possibility of being the basis of the language conversion in the language conversion processing, which is represented by the value of the calculated third score, is higher than a certain threshold value. The language conversion knowledge and the translated original sentence are selected and output to the approximate matching determination unit 122.
【0032】言語変換知識は、言語変換知識メモリ12
4に記憶された、以下に示されたような、原言語情報と
目的言語情報とを対とした情報である。The language conversion knowledge is stored in the language conversion knowledge memory 12
It is the information stored in No. 4 as a pair of the source language information and the target language information as shown below.
【0033】[0033]
【表4】 ―――――――――――――――――――――――――――――――――――― 原言語情報 目的言語情報 ―――――――――――――――――――――――――――――――――――― May I have your name ? 貴方の名前を教えて下さい。 Can I help you ? はい、どうぞ。 Can I <VP> ? <VP>てもいいですか。 ――――――――――――――――――――――――――――――――――――[Table 4] ―――――――――――――――――――――――――――――――――――― Source language information Target language information ―――――――――――――――――――――――――――――――――――― May I have your name? Please tell me your name. Can I help you? Yes, please. Can I <VP>? Can I use <VP>? ――――――――――――――――――――――――――――――――――――
【0034】ここで、<VP>は動詞句を表す。本実施例で
は、上記3件の言語変換知識が、上記のしきい値より高
い可能性があるものとして出力されたものとする。Here, <VP> represents a verb phrase. In the present embodiment, it is assumed that the above-mentioned three pieces of language conversion knowledge are output as those that may be higher than the above threshold value.
【0035】近似照合判定部122は、翻訳原文と言語
変換知識の原言語情報とを順次照合して、言語変換する
か否かを判定し、言語変換する場合には当該言語変換知
識と翻訳原文とを目的言語文生成部123に出力し、言
語変換しない場合には翻訳原文と最も近似した、すなわ
ち最大の第3のスコアを有する言語変換知識の原言語情
報を翻訳可能文情報として処理制御部10に出力する。
このとき、近似照合判定部122は、例えば同一翻訳原
文に対する近似照合判定回数や、翻訳処理の経過時間な
どにより近似照合を徐々に緩和して言語変換するか否か
を判定する。The approximate collation judging unit 122 sequentially collates the translation source sentence with the source language information of the language conversion knowledge to determine whether or not to perform the language conversion. When performing the language conversion, the language conversion knowledge and the translation source sentence are compared. Is output to the target language sentence generation unit 123, and in the case where the language is not converted, the source language information of the language conversion knowledge that is the closest to the translated original sentence, that is, has the maximum third score is used as the translatable sentence information as the process control unit. Output to 10.
At this time, the approximate matching determination unit 122 determines whether or not to perform the language conversion by gradually relaxing the approximate matching based on, for example, the number of times of the approximate matching for the same translated original sentence and the elapsed time of the translation process.
【0036】つまり、翻訳原文 "Can I have your name
?" に対して、原言語情報 May I have your name ?
は、1語置換されただけの比較的近似した情報である
が、説明上の現時点では初回の近似照合判定であるた
め、言語変換しないと判定する。しかし、近似照合の緩
和の設定によるが、例えば2回目の近似照合判定であっ
たり翻訳処理の経過時間が1秒を超えていたりしていた
場合には、当該言語変換知識で言語変換すると判定する
ことになる。In other words, the original translation "Can I have your name
"" For source language information May I have your name?
Is relatively approximate information in which only one word has been replaced, but since it is the first approximate matching determination at the present time in the description, it is determined that the language conversion is not performed. However, depending on the setting of the relaxation of the approximate matching, for example, when the second approximate matching determination is made or the elapsed time of the translation processing exceeds 1 second, it is determined that the language conversion is performed with the language conversion knowledge. It will be.
【0037】本実施例では、上記3件の言語変換知識の
うち、原言語情報 May I have yourname ? が翻訳原文
と最も近似した原言語情報であるとして、翻訳可能文情
報として出力する。翻訳可能文情報は例えば "May", "
I", "have", "your", "name","?" という語句のリスト
である。In this embodiment, out of the above three pieces of language conversion knowledge, the source language information May I have yourname? Is the source language information that is the closest to the translated source sentence, and is output as translatable sentence information. The translatable sentence information is, for example, "May", "
It is a list of the words I "," have "," your "," name ","? ".
【0038】処理制御部10は、上記の翻訳可能文情報
が言語変換処理部12から出力されると、原言語文 "Co
uld I have your name, sir?" と翻訳可能文情報 "Ma
y", "I", "have", "your", "name", "?" を原言語換言
処理部11に出力し、原言語換言処理部11の出力に待
機する。When the translatable sentence information is output from the language conversion processing unit 12, the processing control unit 10 outputs the source language sentence "Co
uld I have your name, sir? "
y, "I", "have", "your", "name", and "?" are output to the source language paraphrasing processing unit 11 and the source language paraphrasing processing unit 11 waits for output.
【0039】本実施例の以上のステップにおいて、原言
語換言文に適用可能な言語変換知識が発見されなかった
ため、次に、原言語換言処理部11は、翻訳可能文情報
を参照し、原言語文の換言を再び実行する。原言語換言
処理部11は、処理の経過を保存した上記の履歴情報メ
モリ115に記憶された履歴情報から当該原言語文の原
言語文解析結果を得て、上記の翻訳可能文情報と共に、
近似照合処理部112で上記原言語の換言知識との照合
を行ない、所定のスコア計算方法により、原言語文に対
する換言操作の換言前の構成要素の近似の程度と、翻訳
可能文情報に対する換言操作の換言後の構成要素の近似
の程度とを示す第1のスコアを計算する。当該原言語文
の原言語文解析結果が保存されていなければ、原言語解
析処理部111で形態素解析する。In the above steps of this embodiment, since no language conversion knowledge applicable to the source language paraphrase sentence was found, the source language paraphrase processing unit 11 next refers to the translatable sentence information to refer to the source language paraphrase information. Execute the paraphrase of the sentence again. The source language paraphrasing processing unit 11 obtains a source language sentence analysis result of the source language sentence from the history information stored in the history information memory 115 in which the progress of processing is stored, and together with the translatable sentence information,
The approximate collation processing unit 112 performs collation with the paraphrase knowledge of the source language, and by a predetermined score calculation method, the degree of approximation of the components before the paraphrase of the paraphrase operation with respect to the source language sentence and the paraphrase operation with respect to the translatable sentence information. Compute a first score that indicates the degree of approximation of the component after paraphrasing. If the source language sentence analysis result of the source language sentence is not stored, the source language analysis processing unit 111 performs morphological analysis.
【0040】近似照合処理部112は、計算した第1の
スコアの値を参照し、換言知識メモリ114に記憶され
た換言知識の中で、翻訳可能文情報によって言語変換処
理における言語変換の根拠となる可能性が上がり、上記
のしきい値を超えるものがあれば、出力する換言知識に
加える。The approximate matching processing unit 112 refers to the calculated value of the first score, and in the paraphrase knowledge stored in the paraphrase knowledge memory 114, uses the translatable sentence information as the basis for the language conversion in the language conversion processing. If there is something that exceeds the above threshold, it is added to the paraphrase knowledge to be output.
【0041】それは、例えば以下のような換言知識であ
るが、本実施例では換言知識メモリ114に予め存在し
なかったものとする。The following paraphrase knowledge, for example, is assumed not to exist in advance in the paraphrase knowledge memory 114 in this embodiment.
【0042】[0042]
【表5】 ―――――――――――――――――――――――――――――――――――― 換言操作 差違情報 ―――――――――――――――――――――――――――――――――――― <文頭> could I → <文頭> may I 丁重さ− ――――――――――――――――――――――――――――――――――――[Table 5] ―――――――――――――――――――――――――――――――――――― Paraphrase operation Difference information ―――――――――――――――――――――――――――――――――――― <Sentence> could I → <Sentence> may I Courtesy − ――――――――――――――――――――――――――――――――――――
【0043】また、原言語換言処理部11は、当該原言
語文に対する原言語換言文 "Can Ihave your name?" を
原言語解析処理部111で形態素解析し、原言語文解析
結果を得て、上記の翻訳可能文情報と共に、近似照合処
理部112で上記換言知識との照合を行なう。当該原言
語換言文の原言語文解析結果に相当するものが、例えば
原言語換言文生成部113の処理経過として履歴情報メ
モリ115に保存されていれば、それを利用して形態素
解析処理を省略する。以下こうした補足説明は省略す
る。Further, the source language paraphrasing processing unit 11 morphologically analyzes the source language paraphrase sentence "Can Ihave your name?" For the source language sentence by the source language analysis processing unit 111 to obtain the source language sentence analysis result, Together with the translatable sentence information, the approximate collation processing unit 112 collates the paraphrase knowledge. If a source language sentence analysis result of the source language paraphrase sentence is stored in the history information memory 115 as the processing progress of the source language paraphrase sentence generation unit 113, the morpheme analysis process is omitted by using it. To do. Hereinafter, such supplementary description will be omitted.
【0044】[0044]
【表6】 ―――――――――――――――――――――――――――――――――――― 換言操作 差違情報 ―――――――――――――――――――――――――――――――――――― <文頭> can I → <文頭> may I (空) ――――――――――――――――――――――――――――――――――――[Table 6] ―――――――――――――――――――――――――――――――――――― Paraphrase operation Difference information ―――――――――――――――――――――――――――――――――――― <Start> can I → <Start> may I (empty) ――――――――――――――――――――――――――――――――――――
【0045】近似照合処理部112は、上記と同様に、
上記原言語文解析結果と上記換言知識とを照合して、所
定のスコア計算方法を用いて原言語文解析結果に対する
原言語の換言操作の換言前の構成要素の近似の程度を示
す第1のスコアを計算して、原言語文解析結果に適用可
能な換言操作を記述した換言知識の内から最大の第1の
スコアを有する換言知識を選択し、当該換言知識と原言
語文解析結果とを原言語換言文生成部113に出力す
る。本実施例では上記原言語文解析結果と上記の換言知
識1件とが出力されたものとする。The approximate collation processing unit 112, similarly to the above,
The first result indicating the degree of approximation of the pre-paraphrase component of the paraphrase operation of the source language with respect to the source language sentence analysis result using a predetermined score calculation method by collating the source language sentence analysis result with the paraphrase knowledge. The paraphrase knowledge having the maximum first score is selected from the paraphrase knowledge describing the paraphrase operation applicable to the source language sentence analysis result by calculating the score, and the paraphrase knowledge and the source language sentence analysis result are selected. It is output to the source language paraphrase sentence generation unit 113. In the present embodiment, it is assumed that the source language sentence analysis result and the paraphrase knowledge described above are output.
【0046】原言語換言文生成部113は、上記と同様
に、原言語解析結果を原言語換言文に換言して出力す
る。本実施例では原言語換言文は、"May I have your n
ame?"となる。また、原言語換言文生成部113は、選
択された換言操作の処理前後の差違を表す換言知識の差
違情報を、当該原言語文の以前の換言の換言知識の差違
情報に加えて、出力する。表5の換言知識に差違情報は
存在しないので、本実施例において差違情報は、「丁重
さ−」が2件のままである。The source language paraphrase sentence generation unit 113 paraphrases the source language parsing result into the source language paraphrase sentence and outputs it. In this embodiment, the source language paraphrase is "May I have your n
In addition, the source language paraphrase sentence generation unit 113 replaces the paraphrase knowledge difference information indicating the difference before and after the selected paraphrase operation with the paraphrase knowledge difference information of the previous paraphrase of the source language sentence. In addition, since there is no difference information in the paraphrase knowledge in Table 5, the difference information in the present embodiment is "Collecting-" is still two.
【0047】処理制御部10は、言語変換処理部12に
上記原言語換言文を翻訳原文として出力し、言語変換処
理部12からの出力を待機する。The processing control unit 10 outputs the original language paraphrase sentence as a translation source sentence to the language conversion processing unit 12, and waits for the output from the language conversion processing unit 12.
【0048】言語変換処理部12は、翻訳原文 "May I
have your name?" を入力すると、上記と同様に、原言
語照合処理部121で翻訳原文と上記言語変換知識の原
言語情報とを照合して、所定のスコア計算方法を用いて
翻訳原文に対する言語変換知識の原言語情報の近似の程
度を示す第3のスコアを計算し、計算した第3のスコア
の値で示される言語変換処理における言語変換の根拠と
なる可能性が、あるしきい値より高い言語変換知識と翻
訳原文とを、近似照合判定部122に出力する。The language conversion processing unit 12 uses the translated original sentence "May I
If "have your name?" is input, the source language collation processing unit 121 collates the source language information with the source language information of the language conversion knowledge in the same manner as above, and the language for the source language is translated using a predetermined score calculation method. A third score, which indicates the degree of approximation of the source language information of the conversion knowledge, is calculated, and the possibility of being the basis of the language conversion in the language conversion processing indicated by the calculated third score value is greater than a certain threshold value. The high language conversion knowledge and the translated original text are output to the approximate matching determination unit 122.
【0049】言語変換知識は、原言語情報と目的言語情
報とを対とした情報である。The language conversion knowledge is information in which the source language information and the target language information are paired.
【0050】[0050]
【表7】 ―――――――――――――――――――――――――――――――――――― 原言語情報 目的言語情報 ―――――――――――――――――――――――――――――――――――― May I have your name ? 貴方の名前を教えて下さい。 May I help you ? はい、どうぞ。 May I <VP> ? <VP>てもいいですか。 ――――――――――――――――――――――――――――――――――――[Table 7] ―――――――――――――――――――――――――――――――――――― Source language information Target language information ―――――――――――――――――――――――――――――――――――― May I have your name? Please tell me your name. May I help you? Yes, please. May I <VP>? Can I use <VP>? ――――――――――――――――――――――――――――――――――――
【0051】本実施例では、上記3件の言語変換知識
が、上記のしきい値より高い可能性があるものとして出
力されたものとする。In this embodiment, it is assumed that the above-mentioned three pieces of language conversion knowledge are output as those that may be higher than the above threshold value.
【0052】近似照合判定部122は、上記と同様に、
翻訳原文と言語変換知識の原言語情報とを順次照合し
て、言語変換するか否かを判定し、言語変換する場合に
は当該言語変換知識と翻訳原文とを目的言語文生成部1
23に出力し、言語変換しない場合には翻訳原文と最も
近似した、すなわち最大の第3のスコアを有する言語変
換知識の原言語情報を翻訳可能文情報として出力する。The approximate collation judging unit 122, similarly to the above,
The translation source sentence and the source language information of the language conversion knowledge are sequentially compared to determine whether or not to perform the language conversion. When performing the language conversion, the language conversion knowledge and the translation source sentence are combined into the target language sentence generation unit 1
When the language is not converted, the source language information of the language conversion knowledge that is the closest to the translation source sentence, that is, has the maximum third score is output as the translatable sentence information.
【0053】本実施例では、以下の言語変換知識により
言語変換すると判定する。In this embodiment, it is determined that language conversion is to be performed based on the following language conversion knowledge.
【0054】[0054]
【表8】 ―――――――――――――――――――――――――――――――――――― 原言語情報 目的言語情報 ―――――――――――――――――――――――――――――――――――― May I have your name ? 貴方の名前を教えて下さい。 ――――――――――――――――――――――――――――――――――――[Table 8] ―――――――――――――――――――――――――――――――――――― Source language information Target language information ―――――――――――――――――――――――――――――――――――― May I have your name? Please tell me your name. ――――――――――――――――――――――――――――――――――――
【0055】近似照合判定部122は、翻訳原文 "May
I have your name?" と上記の言語変換知識1件とを目
的言語文生成部123に出力する。The approximate matching determination unit 122 determines that the translated original sentence "May
"I have your name?" And one piece of the above language conversion knowledge are output to the target language sentence generation unit 123.
【0056】目的言語文生成部123は、従来技術の手
段により、翻訳原文を言語変換知識を用いて目的言語翻
訳文に言語変換して出力する。本実施例では目的言語翻
訳文は、"貴方の名前を教えて下さい。" となる。The target language sentence generator 123 converts the source language sentence into a target language translated sentence by using the language conversion knowledge, and outputs the translated sentence by the conventional technique. In this embodiment, the target language translation is "Please tell me your name."
【0057】次に、目的言語換言処理部13で実行され
る、目的言語における換言処理について説明する。本実
施例では、原言語における換言処理、すなわち、原言語
換言処理部11及び言語変換処理部12で実行される処
理について説明されたときと同一の原言語文で説明し、
原言語における換言処理と重なる部分は説明を省略し
て、続きとして説明する。Next, the paraphrasing process in the target language executed by the target language paraphrasing unit 13 will be described. In the present embodiment, description will be made with the same source language sentence as the description of the paraphrasing process in the source language, that is, the process executed by the source language paraphrasing processing unit 11 and the language conversion processing unit 12,
The description of the part overlapping with the paraphrasing process in the source language will be omitted and will be described as a continuation.
【0058】処理制御部10は、上記の原言語換言文と
差違情報とが、原言語換言処理部11から出力される
と、入力される差違情報を、当該差異情報と反対の換言
操作の差違情報に変換して、一時的に保存する。この変
換は、例えば予め組み込まれた対応表を参照して行な
い、本実施例では「丁重さ−」を「丁重さ+」とする。
本実施例では、2回目の換言では差違情報が加わらなか
った。When the source language paraphrase sentence and the difference information are output from the source language paraphrase processing unit 11, the processing control unit 10 sets the input difference information to the difference of the paraphrase operation opposite to the difference information. Convert it to information and save it temporarily. This conversion is performed, for example, by referring to a correspondence table incorporated in advance, and in the present embodiment, "politeness-" is taken as "politeness +".
In this example, the difference information was not added in the second paraphrase.
【0059】処理制御部10は、2件の上記差違情報
「丁重さ+」と目的言語翻訳文 "貴方の名前を教えて下
さい。" とを目的言語換言処理部13に出力し、目的言
語換言処理部13からの出力を待機する。The processing control unit 10 outputs the above two pieces of difference information "Dignity +" and the target language translation "Tell me your name." To the target language paraphrasing processing unit 13, and the target language paraphrase is output. The output from the processing unit 13 is awaited.
【0060】目的言語換言処理部13は、目的言語翻訳
文 "貴方の名前を教えて下さい。"を入力すると、翻訳
文解析処理部131で目的言語翻訳文を形態素解析し
て、換言知識と照合可能な形式に変形して翻訳文解析結
果とする。本実施例では翻訳文解析結果は表記上、以下
のようなものになる。When the target language translation sentence, "Tell me your name," is input to the target language paraphrase processing unit 13, the translation sentence analysis processing unit 131 morphologically analyzes the target language translation sentence and collates it with the paraphrase knowledge. It is transformed into a possible format and used as the translated sentence analysis result. In this embodiment, the translated sentence analysis result is as follows in terms of notation.
【0061】[0061]
【表9】 ―――――――――――――――――――――――――――――――――――― <文頭> 貴方 の 名前 を 教える て下さい <文末> ――――――――――――――――――――――――――――――――――――[Table 9] ―――――――――――――――――――――――――――――――――――― <Beginning> Tell us your name <End> ――――――――――――――――――――――――――――――――――――
【0062】換言知識は、換言知識メモリ134に記憶
された、目的言語における換言操作と差違情報とを対と
した情報である。換言操作は、例えば目的言語の換言前
の構成要素と換言後の構成要素とを対にした情報であ
る。The paraphrase knowledge is the information stored in the paraphrase knowledge memory 134, which is a pair of the paraphrase operation and the difference information in the target language. The paraphrase operation is, for example, information in which the pre-paraphrase component and the post-paraphrase component of the target language are paired.
【0063】[0063]
【表10】 ―――――――――――――――――――――――――――――――――――― 換言操作 差違情報 ―――――――――――――――――――――――――――――――――――― 貴方 の → お客様 の 丁重さ+ 貴方 の → そちら の 丁重さ− 教える て下さい <文末> → 頂戴できますか <文末> 丁重さ+ て下さい <文末> → て頂けますか <文末> 丁重さ+ 教える て下さい <文末> → 告知すること <文末> 高圧的+ ――――――――――――――――――――――――――――――――――――[Table 10] ―――――――――――――――――――――――――――――――――――― Paraphrase operation Difference information ―――――――――――――――――――――――――――――――――――― Your → Your politeness + Your → Your politeness − Please tell me <End of sentence> → Can you accept it <End of sentence> Courtesy + Please <end of sentence> → can you please <end of sentence> politeness + Please tell me <End of sentence> → Notify <End of sentence> High pressure + ――――――――――――――――――――――――――――――――――――
【0064】近似照合処理部132は、上記翻訳文解析
結果と上記換言知識と処理制御部10から入力した差違
情報とを照合し、所定のスコア計算方法を用いて、上記
翻訳文解析結果及び上記差違情報に対する目的言語の換
言知識の第2のスコアを計算する。近似照合処理部13
2は、計算した第2のスコアに基づいて、翻訳文解析結
果に適用可能な換言操作と、処理制御部10から入力し
た差違情報と反対の差違情報とを記述した換言知識を選
択し、当該換言知識と翻訳文解析結果とを目的言語換言
文生成部133に出力する。本実施例では、上記の翻訳
文解析結果と、表に図示された換言知識5件のうち差違
情報に「丁重さ+」を含む3件とが出力されたものとす
る。The approximate collation processing unit 132 collates the translation sentence analysis result with the paraphrase knowledge and the difference information input from the processing control unit 10, and uses a predetermined score calculation method to calculate the translation sentence analysis result and the translation sentence analysis result. A second score of the paraphrase knowledge of the target language for the difference information is calculated. Approximate matching processing unit 13
2 selects the paraphrase knowledge describing the paraphrase operation applicable to the translated sentence analysis result and the difference information opposite to the difference information input from the processing control unit 10 based on the calculated second score. The paraphrase knowledge and the translated sentence analysis result are output to the target language paraphrase sentence generation unit 133. In the present embodiment, it is assumed that the above translated sentence analysis result and three out of the five paraphrase knowledge illustrated in the table including the difference information including “politeness +” are output.
【0065】目的言語換言文生成部133は、予め記憶
された目的言語の文法知識を参照して、実際に適用する
差違情報を決定し、従来技術の手段により、翻訳文解析
結果を目的言語の換言知識の換言操作を用いて目的言語
換言文に換言して出力する。本実施例では目的言語換言
文は、"お客様の名前を頂戴できますか" となる。The target language paraphrase sentence generation unit 133 refers to the grammatical knowledge of the target language stored in advance, determines the difference information to be actually applied, and uses the conventional technique to convert the translated sentence analysis result to the target language. The target language paraphrase text is paraphrased and output using the paraphrase operation of paraphrase knowledge. In this embodiment, the target language paraphrase is "Can you give me your name?"
【0066】処理制御部10は、上記の目的言語換言文
が目的言語換言処理部13から出力されると、それを目
的言語文として音声合成装置4に出力し、次の原言語文
の入力に待機する。ここで、履歴情報メモリ115に記
憶された1つの原言語文に関連する情報は、各原言語文
の入力ごとに更新されても、又は更新されずに蓄積され
てもよい。When the target language paraphrase sentence is output from the target language paraphrase processing unit 13, the processing control unit 10 outputs it as a target language sentence to the speech synthesizer 4 for inputting the next source language sentence. stand by. Here, the information related to one source language sentence stored in the history information memory 115 may be updated for each input of the source language sentence, or may be accumulated without being updated.
【0067】以上の実施形態において、原言語換言処理
部11が目的言語換言処理部13に原言語文と換言され
た原言語文との差違情報を引き渡し、目的言語換言処理
部13が上記差違情報に基づいて自動的に最も妥当な換
言された目的言語文を選択して出力する構成のみを備え
るように構成してもよい。In the above embodiment, the source language paraphrasing processing unit 11 passes the difference information between the source language sentence and the paraphrased source language sentence to the target language paraphrasing processing unit 13, and the target language paraphrasing processing unit 13 sends the difference information. It may be configured such that only the most appropriate paraphrased target language sentence is automatically selected and output based on the above.
【0068】以上の実施形態において、言語変換処理部
12が原言語換言処理部11に翻訳可能文情報をフィー
ドバックし、原言語換言処理部11はそれに基づいて自
動的に元も妥当な換言された原言語文を出力する構成の
みを備えるように構成してもよい。In the above embodiment, the language conversion processing unit 12 feeds back the translatable sentence information to the source language paraphrasing processing unit 11, and the source language paraphrasing processing unit 11 automatically makes a proper paraphrase based on it. You may comprise so that only the structure which outputs a source language sentence may be provided.
【0069】以上の実施形態においては、形態素解析し
て文をその構成要素に変換しているが、形態素解析に代
えて構文解析を用いてもよい。In the above embodiment, the sentence is converted into its constituent elements by morphological analysis, but syntactic analysis may be used instead of morphological analysis.
【0070】[0070]
【発明の効果】以上詳述したように本発明に係る機械翻
訳装置によれば、ある原言語文又は目的言語に翻訳され
た原言語文に対して複数個存在する可能な換言の中から
自動的に1つを選択する両言語の換言機構を、言語変換
処理部の両側の原言語換言処理部及び目的言語換言処理
部とに設け、原言語換言処理部11は目的言語換言処理
部13に原言語文と換言された原言語文との差違情報を
引き渡し、目的言語換言処理部13が上記差違情報に基
づいて自動的に最も妥当な換言された目的言語文を選択
して出力し、又は/及び、言語変換処理部12は原言語
換言処理部11に翻訳可能文情報をフィードバックし、
原言語換言処理部11はそれに基づて自動的に元も妥当
な換言された原言語文を出力する。As described above in detail, the machine translation apparatus according to the present invention automatically selects from a plurality of possible paraphrases for a source language sentence or a source language sentence translated into a target language. A paraphrasing mechanism for both languages for selectively selecting one is provided in the source language paraphrasing processing unit and the target language paraphrasing processing unit on both sides of the language conversion processing unit, and the source language paraphrasing processing unit 11 is provided in the target language paraphrasing processing unit 13. The difference information between the source language sentence and the paraphrased source language sentence is delivered, and the target language paraphrase processing unit 13 automatically selects and outputs the most appropriate paraphrased target language sentence based on the difference information, or / And the language conversion processing unit 12 feeds back the translatable sentence information to the source language paraphrasing processing unit 11,
The source language paraphrasing processing unit 11 automatically outputs a source language sentence that is originally paraphrased based on the source language paraphrase processing unit 11.
【0071】従って、原言語での換言における差違情報
を目的言語での換言に使用しているので、目的言語にお
いて換言する語彙を自動選択するときの精度を上げるこ
とができる。そのため、機械翻訳装置の操作者に原言
語、目的言語の知識を要求せずに済むため、機械翻訳装
置の用途が広がる。例えば、図1のように音声認識装置
や音声合成装置と組み合わせて音声翻訳(通訳)装置と
し、一般の人が海外旅行に持って出るということが可能
になる。また、翻訳の実行時に適当な訳語を自動選択
し、換言精度を上げることができるため、機械翻訳装置
の開発に必要な事前知識を削減することができ、それに
よって、機械翻訳装置の開発に必要な資源を低減でき
る。これにより、例えば日英間以外の言語間での機械翻
訳装置の開発が容易になる。さらに、日英間の翻訳装置
でも、現在は専門用語辞書の入れ替えといったごく一部
の変更で幾つかの分野や用途に対応しているのに対し、
分野や用途に特化した機械翻訳装置の開発が容易にな
る。Therefore, since the difference information in the paraphrase in the source language is used for the paraphrase in the target language, it is possible to improve the accuracy in automatically selecting the vocabulary to be paraphrased in the target language. Therefore, it is not necessary for the operator of the machine translation device to have knowledge of the source language and the target language, and the use of the machine translation device is expanded. For example, as shown in FIG. 1, a speech translation (interpretation) device can be combined with a speech recognition device or a speech synthesis device to allow an ordinary person to take it on an overseas trip. Also, since it is possible to automatically select an appropriate translated word when executing translation and improve paraphrase accuracy, it is possible to reduce the prior knowledge necessary for developing a machine translation device, which is necessary for developing a machine translation device. Resource can be reduced. This facilitates the development of a machine translation device between languages other than Japanese and English, for example. In addition, even with Japanese-English translation devices, currently some technical changes such as replacement of the technical term dictionary are compatible with some fields and applications.
It facilitates the development of machine translation devices specialized for fields and applications.
【図1】 本発明の実施形態に係る機械翻訳装置3を備
えた音声翻訳合成システムの構成を示すブロック図であ
る。FIG. 1 is a block diagram showing the configuration of a speech translation synthesis system including a machine translation device 3 according to an embodiment of the present invention.
【図2】 図1の機械翻訳装置3の詳細構成を示すブロ
ック図である。FIG. 2 is a block diagram showing a detailed configuration of a machine translation device 3 of FIG.
【図3】 図2の原言語換言処理部11の詳細構成を示
すブロック図である。3 is a block diagram showing a detailed configuration of a source language paraphrasing processing unit 11 in FIG.
【図4】 図2の言語変換処理部12の詳細構成を示す
ブロック図である。4 is a block diagram showing a detailed configuration of a language conversion processing unit 12 in FIG.
【図5】 図2の目的言語換言処理部13の詳細構成を
示すブロック図である。5 is a block diagram showing a detailed configuration of a target language paraphrasing processing unit 13 in FIG.
1…マイクロホン、 2…音声認識装置、 3…機械翻訳装置、 4…音声合成装置、 5…スピーカ、 10…処理制御部、 11…原言語換言処理部、 12…言語変換処理部、 13…目的言語換言処理部、 111…原言語解析処理部、 112,132…近似照合処理部、 113…原言語換言文生成部、 114,134…換言知識メモリ、 115…履歴情報メモリ、 121…原言語照合処理部、 122…近似照合判定部、 123…目的言語文生成部、 124…言語変換知識メモリ、 131…翻訳文解析処理部、 133…目的言語換言文生成部。 1 ... Microphone, 2 ... voice recognition device, 3 ... Machine translation device, 4 ... voice synthesizer, 5 ... speaker, 10 ... Process control unit, 11 ... Source language paraphrasing unit, 12 ... Language conversion processing unit, 13 ... Target language paraphrasing processing unit, 111 ... Source language analysis processing unit, 112, 132 ... Approximate matching processing unit, 113 ... Source language paraphrase sentence generation unit, 114,134 ... paraphrase knowledge memory, 115 ... History information memory, 121 ... Source language collation processing unit, 122 ... Approximate matching determination unit, 123 ... a target language sentence generator, 124 ... Language conversion knowledge memory, 131 ... Translated sentence analysis processing unit, 133 ... Target language paraphrase sentence generation unit.
───────────────────────────────────────────────────── フロントページの続き (72)発明者 張 玉潔 京都府相楽郡精華町光台二丁目2番地2 株式会社エイ・ティ・アール音声言語 通信研究所内 (56)参考文献 佐藤理史,論文表題を言い換える,情 報処理学会論文誌,日本,1999年 7月 15日,Vol.40,No.7,p.2937 −p.2945 山本和英・白井諭・坂本仁・張玉潔, SANDGLASS:両言語換言機構を 基軸とする音声翻訳,言語処理学会第7 回年次大会発表論文集,日本,2001年 3月27日,p.221−p.224,「1 動 機と提案の概略」及び「参考文献」の欄 (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28 JICSTファイル(JOIS)─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor, Tama Kiyoshi, 2-2, Kodai 2-chome, Seika-cho, Soraku-gun, Kyoto Pref., Spoken Language Communication Research Laboratories, Ltd. (56) Bibliography Satoshi Sato, title of paper In other words, Journal of Information Processing Society of Japan, Japan, July 15, 1999, Vol. 40, No. 7, p. 2937-p. 2945 Kazuhide Yamamoto, Satoshi Shirai, Hitoshi Sakamoto, Kiyoshi Zhangtama, SANDGLASS: Speech translation based on bilingual paraphrasing mechanism, Proceedings of the 7th Annual Conference of Linguistic Processing Society, Japan, March 27, 2001, p. 221-p. 224, "1 Motivation and Proposal Outline" and "References" (58) Fields investigated (Int.Cl. 7 , DB name) G06F 17/21-17/28 JISST file (JOIS)
Claims (3)
訳装置において、 上記原言語文を解析して上記原言語文の単語又は句であ
る原言語文の構成要素を抽出し、原言語の換言操作の換
言前後の構成要素の対にてなる原言語の換言操作を参照
して、上記原言語文の構成要素に対する、上記原言語の
換言操作の換言前の構成要素の近似の程度を示す第1の
スコアを計算し、最大の第1のスコアを有する上記原言
語の換言操作の換言前の構成要素を含む上記原言語の換
言操作を選択し、選択された上記原言語の換言操作を用
いて上記原言語文を換言後の原言語文に換言するととも
に、選択された上記原言語の換言操作の処理の前後の差
違を表す差違情報を生成する原言語換言処理部と、 原言語の構成要素と対応する目的言語の構成要素との対
にてなる言語変換知識を参照して、上記換言後の原言語
文を目的言語文に言語変換する言語変換処理部と、 上記目的言語文を解析して上記目的言語文の単語又は句
である目的言語文の構成要素を抽出し、上記差違情報に
基づいて、目的言語の換言操作の換言前後の構成要素の
対にてなる目的言語の換言操作を参照して、上記目的言
語文の構成要素に対する、上記差違情報と反対の換言操
作を行う上記目的言語の換言操作の換言前の構成要素の
近似の程度を示す第2のスコアを計算し、最大の第2の
スコアを有する上記目的言語の換言操作の換言前の構成
要素を含む上記目的言語の換言操作を選択し、選択され
た上記目的言語の換言操作を用いて上記目的言語文を換
言後の目的言語文に換言する目的言語換言処理部とを備
えたことを特徴とする機械翻訳装置。1. A machine translation device for translating a source language sentence into a target language sentence, analyzing the source language sentence to extract constituent elements of the source language sentence, which are words or phrases of the source language sentence, and extract the source language sentence. With reference to the source language paraphrasing operation consisting of a pair of components before and after the paraphrase of the paraphrasing operation, the degree of approximation of the component before the paraphrase of the source language paraphrasing operation with respect to the component of the source language sentence is described. Calculating a first score, selecting the source language paraphrase operation that includes the pre-paraphrase component of the source language paraphrase operation having the largest first score, and selecting the selected source language paraphrase operation A source language paraphrase processing unit that paraphrases the source language sentence into a source language sentence after paraphrase using, and generates difference information that indicates a difference between before and after processing of the selected source language paraphrase operation; In pairs with the components of the corresponding target language A language conversion processing unit that converts the source language sentence after the paraphrase into a target language sentence by referring to the language conversion knowledge, and a target language that is a word or a phrase of the target language sentence by analyzing the target language sentence. Extract the constituent elements of the sentence, based on the difference information, referring to the paraphrasing operation of the target language consisting of a pair of constituent elements before and after paraphrasing the paraphrasing operation of the target language, for the constituent elements of the target language sentence, A second score indicating the degree of approximation of the pre-paraphrase component of the paraphrase operation of the target language that performs the paraphrase operation opposite to the difference information is calculated, and the paraphrase operation of the target language having the maximum second score is calculated. And a target language paraphrasing processing unit that paraphrases the target language sentence into a post-paraphrase target language sentence by using a paraphrasing operation of the target language including the component before paraphrasing. Machine equipped with Translation apparatus.
訳装置において、 上記原言語文を解析して上記原言語文の単語又は句であ
る原言語文の構成要素を抽出し、原言語の換言操作の換
言前後の構成要素の対にてなる原言語の換言操作を参照
して、上記原言語文の構成要素に対する、上記原言語の
換言操作の換言前の構成要素の近似の程度を示す第1の
スコアを計算し、最大の第1のスコアを有する上記原言
語の換言操作の換言前の構成要素を含む上記原言語の換
言操作を選択し、選択された上記原言語の換言操作を用
いて上記原言語文を換言後の原言語文に換言する原言語
換言処理部と、 原言語の構成要素と対応する目的言語の構成要素との対
にてなる言語変換知識を参照して、上記換言後の原言語
文を目的言語文に言語変換する言語変換処理部と、 上記目的言語文を解析して上記目的言語文の単語又は句
である目的言語文の構成要素を抽出し、上記差違情報に
基づいて、目的言語の換言操作の換言前後の構成要素の
対にてなる所定の目的言語の換言操作を参照して、上記
目的言語文の構成要素に対する、上記目的言語の換言操
作の換言前の構成要素の近似の程度を示す第2のスコア
を計算し、最大の第2のスコアを有する上記目的言語の
換言操作の換言前の構成要素を含む上記目的言語の換言
操作を選択し、選択された上記目的言語の換言操作を用
いて上記目的言語文を換言後の目的言語文に換言する目
的言語換言処理部とを備え、 上記言語変換処理部は、上記言語変換知識の原言語の構
成要素を参照して、上記換言後の原言語文に対する、上
記言語変換知識の原言語の構成要素の近似の程度を示す
第3のスコアを計算し、計算した第3のスコアの値が所
定のしきい値より高いときは、最大の第3のスコアを有
する上記言語変換知識の原言語の構成要素を含む上記言
語変換知識を選択し、選択された上記言語変換知識を用
いて上記換言後の原言語文を上記目的言語文に言語変換
する一方、計算した第3のスコアの値が上記しきい値以
下のときは、最大の第3のスコアを有する上記言語変換
知識の原言語の構成要素を翻訳可能文情報として選択し
て上記原言語換言処理部に出力し、 上記原言語換言処理部は、上記原言語文の構成要素に対
する上記原言語の換言操作の換言前の構成要素の近似の
程度と、上記翻訳可能文情報に対する上記原言語の換言
操作の換言後の構成要素の近似の程度とを示す第1のス
コアを計算し、最大の第1のスコアを有する原言語の換
言操作の換言前後の構成要素を含む上記原言語の換言操
作を選択し、選択された上記原言語の換言操作を用いて
上記原言語文を換言後の原言語文に換言することを特徴
とする機械翻訳装置。2. A machine translation device for translating a source language sentence into a target language sentence, analyzing the source language sentence to extract constituent elements of the source language sentence, which are words or phrases of the source language sentence, and extract the source language sentence. With reference to the source language paraphrasing operation consisting of a pair of components before and after the paraphrase of the paraphrasing operation, the degree of approximation of the component before the paraphrase of the source language paraphrasing operation with respect to the component of the source language sentence is described. Calculating a first score, selecting the source language paraphrase operation that includes the pre-paraphrase component of the source language paraphrase operation having the largest first score, and selecting the selected source language paraphrase operation , The source language paraphrase processing unit that paraphrases the source language sentence into the source language sentence after paraphrase, and the language conversion knowledge composed of a pair of the source language constituent element and the corresponding target language constituent element. , Language conversion for converting the source language sentence after the above paraphrase into the target language sentence And a constituent part of the target language sentence that is a word or a phrase of the target language sentence by analyzing the target language sentence, and based on the difference information, the components before and after the paraphrase of the paraphrase operation of the target language. A second score indicating the degree of approximation of the component before the paraphrase of the paraphrase operation of the target language with respect to the component of the target language sentence is calculated with reference to the paraphrase operation of the predetermined target language consisting of a pair of Then, the paraphrase operation of the target language including the component before paraphrase of the paraphrase operation of the target language having the maximum second score is selected, and the target language sentence is selected using the paraphrase operation of the selected target language. And a target language paraphrasing processing unit that paraphrases the target language sentence after paraphrasing, wherein the language conversion processing unit refers to the constituent elements of the source language of the language conversion knowledge, with respect to the source language sentence after paraphrasing, Source language configuration required for the above language conversion knowledge A third score indicating the degree of approximation of the prime is calculated, and when the value of the calculated third score is higher than a predetermined threshold value, the language conversion knowledge of the source language having the maximum third score is calculated. The language conversion knowledge including the constituent elements is selected, and the source language sentence after the paraphrase is language-converted into the target language sentence using the selected language conversion knowledge, while the value of the calculated third score is the above. When it is less than or equal to the threshold value, the constituent element of the source language of the language conversion knowledge having the maximum third score is selected as translatable sentence information and output to the source language paraphrasing processing unit. The part is a degree of approximation of a component before paraphrase of the paraphrase operation of the source language with respect to a component of the source language sentence, and an approximation of a component after paraphrase of the paraphrase operation of the source language with respect to the translatable sentence information. Calculate the first score, which indicates the degree and After paraphrasing the source language sentence using the paraphrasing operation of the source language including components before and after paraphrasing the paraphrasing operation of the source language having the largest first score, and using the paraphrasing operation of the selected source language A machine translation device characterized by paraphrasing the original language sentence of.
識の原言語の構成要素を参照して、上記換言後の原言語
文に対する、上記言語変換知識の原言語の構成要素の近
似の程度を示す第3のスコアを計算し、計算した第3の
スコアの値が所定のしきい値より高いときは、最大の第
3のスコアを有する上記言語変換知識の原言語の構成要
素を含む上記言語変換知識を選択し、選択された上記言
語変換知識を用いて上記換言後の原言語文を上記目的言
語文に言語変換する一方、計算した第3のスコアの値が
上記しきい値以下のときは、最大の第3のスコアを有す
る上記言語変換知識の原言語の構成要素を翻訳可能文情
報として選択して上記原言語換言処理部に出力し、 上記原言語換言処理部は、上記原言語文の構成要素に対
する上記原言語の換言操作の換言前の構成要素の近似の
程度と、上記翻訳可能文情報に対する上記原言語の換言
操作の換言後の構成要素の近似の程度とを示す第1のス
コアを計算し、最大の第1のスコアを有する上記原言語
の換言操作の換言前後の構成要素を含む原言語の換言操
作を選択し、選択された上記原言語の換言操作を用いて
上記原言語文を上記換言後の原言語文に換言するととも
に、選択された上記原言語の換言操作の処理の前後の差
違を表す差違情報を生成することを特徴とする請求項1
記載の機械翻訳装置。3. The degree of approximation of the source language constituent element of the language conversion knowledge with respect to the source language sentence after the paraphrase, by the language conversion processing unit referring to the source language constituent element of the language conversion knowledge. Is calculated, and when the value of the calculated third score is higher than a predetermined threshold value, the source language component of the language conversion knowledge having the maximum third score is included. Language conversion knowledge is selected, and the source language sentence after the paraphrase is language converted into the target language sentence by using the selected language conversion knowledge, while the calculated third score value is equal to or less than the threshold value. In this case, the constituent element of the source language of the language conversion knowledge having the maximum third score is selected as translatable sentence information and output to the source language paraphrasing processing unit. Paraphrase of the above source language for the constituent elements of the language sentence A first score indicating the degree of approximation of the component before the paraphrase of the work and the degree of approximation of the component after the paraphrase of the paraphrase operation of the source language with respect to the translatable sentence information is calculated, and the maximum first score is calculated. Selecting a source language paraphrase operation including components before and after the source language paraphrase operation having a score of, and using the selected source language paraphrase operation to convert the source language sentence to the source language after the paraphrase. The phrase information is paraphrased, and difference information representing a difference before and after processing of the selected source language paraphrase operation is generated.
The machine translation device described.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001084925A JP3403715B2 (en) | 2001-03-23 | 2001-03-23 | Machine translation equipment |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001084925A JP3403715B2 (en) | 2001-03-23 | 2001-03-23 | Machine translation equipment |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2002288168A JP2002288168A (en) | 2002-10-04 |
| JP3403715B2 true JP3403715B2 (en) | 2003-05-06 |
Family
ID=18940523
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001084925A Expired - Fee Related JP3403715B2 (en) | 2001-03-23 | 2001-03-23 | Machine translation equipment |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3403715B2 (en) |
-
2001
- 2001-03-23 JP JP2001084925A patent/JP3403715B2/en not_active Expired - Fee Related
Non-Patent Citations (2)
| Title |
|---|
| 佐藤理史,論文表題を言い換える,情報処理学会論文誌,日本,1999年 7月15日,Vol.40,No.7,p.2937−p.2945 |
| 山本和英・白井諭・坂本仁・張玉潔,SANDGLASS:両言語換言機構を基軸とする音声翻訳,言語処理学会第7回年次大会発表論文集,日本,2001年 3月27日,p.221−p.224,「1 動機と提案の概略」及び「参考文献」の欄 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2002288168A (en) | 2002-10-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6282507B1 (en) | Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection | |
| US6223150B1 (en) | Method and apparatus for parsing in a spoken language translation system | |
| US6278968B1 (en) | Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system | |
| US6243669B1 (en) | Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation | |
| EP1089193A2 (en) | Translating apparatus and method, and recording medium used therewith | |
| US20020198713A1 (en) | Method and apparatus for perfoming spoken language translation | |
| JP2000353161A (en) | Method and device for controlling style in generation of natural language | |
| WO1999063456A1 (en) | Language conversion rule preparing device, language conversion device and program recording medium | |
| US20010029443A1 (en) | Machine translation system, machine translation method, and storage medium storing program for executing machine translation method | |
| JPH0682377B2 (en) | Emotion information extraction device | |
| JP3403715B2 (en) | Machine translation equipment | |
| JP3441400B2 (en) | Language conversion rule creation device and program recording medium | |
| JP2758851B2 (en) | Automatic translation device and automatic translation device | |
| JP4033093B2 (en) | Natural language processing system, natural language processing method, and computer program | |
| JPH08190562A (en) | Machine translation device | |
| JP4812811B2 (en) | Machine translation apparatus and machine translation program | |
| Zong et al. | Interactive Chinese-to-English speech translation based on dialogue management | |
| JP3136038B2 (en) | Interpreting device | |
| JP3972699B2 (en) | Natural language processing system, natural language processing method, and computer program | |
| JP4092861B2 (en) | Natural language pattern creation apparatus and method | |
| Tanev et al. | LINGUA: a robust architecture for text processing and anaphora resolution in Bulgarian | |
| JP2004199519A (en) | Machine translation method, machine translation device, and machine translation program | |
| JPH0635964A (en) | Machine translation device | |
| JP2935928B2 (en) | Natural language translator | |
| JPH07141382A (en) | Foreign language document creation support device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030204 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |