JP6492466B2 - Information processing system, translation method, and program therefor - Google Patents
Information processing system, translation method, and program therefor Download PDFInfo
- Publication number
- JP6492466B2 JP6492466B2 JP2014177895A JP2014177895A JP6492466B2 JP 6492466 B2 JP6492466 B2 JP 6492466B2 JP 2014177895 A JP2014177895 A JP 2014177895A JP 2014177895 A JP2014177895 A JP 2014177895A JP 6492466 B2 JP6492466 B2 JP 6492466B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- language
- dictionary
- original
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013519 translation Methods 0.000 title claims description 109
- 230000010365 information processing Effects 0.000 title claims description 60
- 238000000034 method Methods 0.000 title description 30
- 238000012545 processing Methods 0.000 claims description 7
- 230000014616 translation Effects 0.000 description 95
- 238000010586 diagram Methods 0.000 description 19
- 230000000694 effects Effects 0.000 description 13
- 239000000284 extract Substances 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010835 comparative analysis Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 239000000470 constituent Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
本発明は、機械翻訳の技術に関し、特にブリッジ翻訳の技術に関する。 The present invention relates to a machine translation technique, and more particularly to a bridge translation technique.
機械翻訳技術及びさまざまな関連技術が知られている。 Machine translation technology and various related technologies are known.
例えば、特許文献1は、関連文検索装置を開示する。特許文献1に記載された関連文検索装置は、前段対訳文検索装置と、後段対訳文検索装置と、を備える。前段対訳文検索装置は、入力された第1言語文に基づいて、第2言語で書かれた訳文の集合を検索し、第2言語文の集合を出力する。後段対訳文検索装置は、第2言語文の集合に基づいて、第3言語で書かれた訳文の集合を検索し、第3言語文の集合を出力する。 For example, Patent Literature 1 discloses a related sentence search device. The related sentence search device described in Patent Document 1 includes a front-end parallel translation search apparatus and a back-end parallel translation search apparatus. The preceding translation search device searches a set of translations written in the second language based on the input first language sentence, and outputs a set of second language sentences. The post-translational sentence search device searches a set of translated sentences written in the third language based on the set of second language sentences, and outputs a set of third language sentences.
即ち、特許文献1の関連文検索装置は、入力された第1言語文に対応する第3言語文を、第2言語文を介して翻訳する。 That is, the related sentence search device of Patent Document 1 translates the third language sentence corresponding to the input first language sentence via the second language sentence.
換言すると、特許文献1の関連文検索装置は、「言語対の異なる機械翻訳装置を複数組み合わせて、新しい言語対の翻訳を行う装置」とも言える。 In other words, the related sentence search device of Patent Document 1 can be said to be “a device that translates a new language pair by combining a plurality of machine translation devices having different language pairs”.
具体的には、英語(第1言語)と日本語(第2言語)間の翻訳装置(前段対訳文検索装置)と、日本語(第2言語)と中国語(第3言語)間の翻訳装置(後段対訳文検索装置)とがあり、英語と中国語の翻訳装置がないとする。この場合、特許文献1の関連文検索装置は、英語から日本語にいったん翻訳した後に日本語から中国語に翻訳することで、利用者に対して、あたかも英語-中国語の翻訳装置があるがごとく見せる。このような翻訳は、橋渡し言語(上記例では、日本語)を利用するために、ブリッジ翻訳とも呼ばれる。 Specifically, a translation device (previous translation search device) between English (first language) and Japanese (second language) and translation between Japanese (second language) and Chinese (third language) It is assumed that there is a device (second-stage parallel translation search device) and no English-Chinese translation device. In this case, the related sentence search device disclosed in Patent Document 1 has an English-Chinese translation device for users by translating from English to Japanese and then from Japanese to Chinese. Show it like that. Such translation is also called bridge translation because it uses a bridging language (in the above example, Japanese).
しかしながら、上述した先行技術文献に記載された技術においては、ブリッジ翻訳によって翻訳精度が低下するという問題点がある。 However, in the technique described in the above-described prior art document, there is a problem that translation accuracy is lowered by bridge translation.
その理由は、ブリッジ翻訳が橋渡し言語(第2言語)への翻訳を経由することにより、第1言語から第3言語へ直接翻訳する場合に比べて、翻訳回数が増えることによる誤訳発生の可能性が大きくなるからである。 The reason for this is that the bridge translation goes through the translation to the bridging language (second language), so there is a possibility of mistranslation due to an increase in the number of translations compared to the case of direct translation from the first language to the third language. This is because it becomes larger.
本発明の目的は、上述した問題点を解決できる情報処理システム、翻訳方法、及びそのためのプログラムを提供することにある。 The objective of this invention is providing the information processing system which can solve the problem mentioned above, the translation method, and the program for it.
本発明の一様態における情報処理システムは、第1の言語の語である第1の原語と第2の言語の語である第1の訳語とを入力とし、前記第1の言語から第3の言語への辞書である第1の辞書に含まれる、前記第1の原語と、前記第3の言語の語である、前記第1の原語の訳語である、第2の訳語と、前記第3の言語から前記第2の言語への辞書である第2の辞書に含まれる、前記第1の訳語と、前記第3の言語の語である、前記第1の訳語の原語である、第2の原語と、に基づいて、前記第1の原語と前記第1の訳語との組に対応する橋渡し語を選定する、パス推定手段と、前記橋渡し語に基づいて、前記第1の辞書における前記第2の訳語及び前記第2の辞書における前記第1の訳語のそれぞれの、選択優先順位を操作するための情報を含むパス制御情報を出力するパス制御手段と、を含む。 An information processing system according to one embodiment of the present invention receives a first original word that is a word in a first language and a first translated word that is a word in a second language as input, A first translated word that is a dictionary to a language, a second translated word that is a translated word of the first original word that is a word of the third language, and a third translated word The first translated word and the third language word included in the second dictionary which is a dictionary from the second language to the second language, the second translated word is the original word of the first translated word, And a path estimation means for selecting a bridging word corresponding to the set of the first original word and the first translated word based on the first word and the first dictionary in the first dictionary based on the bridging word Contains information for operating the selection priority of each of the second translation and the first translation in the second dictionary. Including a path control means for outputting the path control information.
本発明の一様態における翻訳方法は、コンピュータが、第1の言語の語である第1の原語と第2の言語の語である第1の訳語とを入力とし、前記第1の言語から第3の言語への辞書である第1の辞書に含まれる、前記第1の原語と、前記第3の言語の語である、前記第1の原語の訳語である、第2の訳語と、前記第3の言語から前記第2の言語への辞書である第2の辞書に含まれる、前記第1の訳語と、前記第3の言語の語である、前記第1の訳語の原語である、第2の原語と、に基づいて、前記第1の原語と前記第1の訳語との組に対応する橋渡し語を選定し、前記橋渡し語に基づいて、前記第1の辞書における前記第2の訳語及び前記第2の辞書における前記第1の訳語のそれぞれの、選択優先順位を操作するための情報を含むパス制御情報を出力する翻訳方法。 本発明の一様態におけるプログラムは、第1の言語の語である第1の原語と第2の言語の語である第1の訳語とを入力とし、前記第1の言語から第3の言語への辞書である第1の辞書に含まれる、前記第1の原語と、前記第3の言語の語である、前記第1の原語の訳語である、第2の訳語と、前記第3の言語から前記第2の言語への辞書である第2の辞書に含まれる、前記第1の訳語と、前記第3の言語の語である、前記第1の訳語の原語である、第2の原語と、に基づいて、前記第1の原語と前記第1の訳語との組に対応する橋渡し語を選定し、前記橋渡し語に基づいて、前記第1の辞書における前記第2の訳語及び前記第2の辞書における前記第1の訳語のそれぞれの、選択優先順位を操作するための情報を含むパス制御情報を出力する処理をコンピュータに実行させる。 In the translation method according to one embodiment of the present invention, a computer receives a first original word that is a word in a first language and a first translated word that is a word in a second language as input from the first language. The first original word that is included in the first dictionary that is a dictionary to three languages, the second translated word that is the translated word of the first original word that is the word of the third language, and The first translated word included in the second dictionary that is a dictionary from the third language to the second language and the original word of the first translated word that is the word of the third language. A bridging word corresponding to the set of the first original word and the first translated word is selected based on the second original word, and the second word in the first dictionary is selected based on the bridging word. Path control including information for operating the selection priority of each of the translation word and the first translation word in the second dictionary Translation how to output the broadcast. The program according to one embodiment of the present invention receives a first original word that is a word in a first language and a first translated word that is a word in a second language as input, from the first language to the third language. A first translated word, a second translated word that is a translated word of the first original word that is a word of the third language, and a third language that are included in a first dictionary that is a dictionary of The second original word, which is the original word of the first translated word and the first translated word, which is the word of the third language, included in the second dictionary which is a dictionary from the first language to the second language And selecting a bridging word corresponding to the set of the first original word and the first translated word, and, based on the bridging word, the second translated word and the first translated word in the first dictionary. Output path control information including information for operating the selection priority of each of the first translated words in the second dictionary To perform the management to the computer.
本発明は、ブリッジ翻訳における誤訳を低減することが可能になるという効果がある。 The present invention has an effect that it is possible to reduce mistranslation in bridge translation.
本発明を実施するための形態について図面を参照して詳細に説明する。尚、各図面及び明細書記載の各実施形態において、同様の構成要素には同様の符号を付与し、適宜説明を省略する。 Embodiments for carrying out the present invention will be described in detail with reference to the drawings. In each embodiment described in each drawing and specification, the same reference numerals are given to the same components, and the description thereof is omitted as appropriate.
<<<第1の実施形態>>>
図1は、本発明の第1の実施形態に係る情報処理システム100の構成を示すブロック図である。
<<<< first embodiment >>>>
FIG. 1 is a block diagram showing a configuration of an
図1に示すように、本実施形態に係る情報処理システム100は、パス推定部110と、パス制御部120とを含む。尚、図1に示す各構成要素は、ハードウエア単位の回路でも、マイクロチップに含まれるモジュールでも、コンピュータ装置の機能単位に分割された構成要素でもよい。ここでは、図1に示す構成要素は、コンピュータ装置の機能単位に分割された構成要素として説明する。
As illustrated in FIG. 1, the
また、図1に示す情報処理システム100は、あるサーバに実装され、ネットワークを介して利用可能にされてよいし、図1に示す各構成要素がネットワーク上に分散して設置されて利用可能にされてもよい。
Further, the
===パス推定部110===
図1に示すパス推定部110は、辞書データ800を入力として、受け付ける。その辞書データ800は、第1の言語の語である第1の原語と第2の言語の語である第1の訳語との組を含む。
===
The
パス推定部110は、第1の辞書に含まれるその第1の原語及び第2の訳語と、第2の辞書に含まれるその第1の訳語及び第2の原語と、に基づいて、その第1の原語とその第1の訳語との組に対応するブリッジ語(橋渡し語とも呼ばれる)を選定する。 Based on the first original word and the second translated word included in the first dictionary and the first translated word and the second original word contained in the second dictionary, the path estimating unit 110 A bridge word (also called a bridge word) corresponding to a set of one original word and its first translated word is selected.
ここで、その第1の辞書は、その第1の言語から第3の言語への辞書である。その第2の訳語は、その第3の言語の語であり、その第1の原語の訳語である。その第2の辞書は、その第3の言語からその第2の言語への辞書である。その第2の原語は、その第3の言語の語であり、その第1の訳語の原語である。 Here, the first dictionary is a dictionary from the first language to the third language. The second translated word is a word of the third language, and is a translated word of the first original language. The second dictionary is a dictionary from the third language to the second language. The second original language is a word of the third language, and is an original language of the first translated word.
===辞書データ800===
図2は、辞書データ800の一例を示す図である。図2に示すように、辞書データ800は、第1の言語の語である第1の原語と第2の言語の語である第1の訳語との組801を含む。辞書データ800は、任意の数の組801を含んでよい。
=== Dictionary Data 800 ===
FIG. 2 is a diagram illustrating an example of the dictionary data 800. As shown in FIG. 2, the dictionary data 800 includes a set 801 of a first original word that is a word in the first language and a first translated word that is a word in the second language. Dictionary data 800 may include any number of sets 801.
図2に示すように、組801は、第1の原語及び第1の訳語のそれぞれの品詞の種別を示す情報を含んでよい。更に、組801は、図2に示す例に係わらず、その第1の辞書及びその第2の辞書に登録するための、任意の情報を含んでよい。 As shown in FIG. 2, the set 801 may include information indicating the type of part of speech of each of the first original word and the first translated word. Furthermore, the set 801 may include arbitrary information to be registered in the first dictionary and the second dictionary regardless of the example illustrated in FIG.
===第1の辞書810及び第2の辞書820===
図3は、第1の辞書810と第2の辞書820との一例を示す図である。
=== First dictionary 810 and second dictionary 820 ===
FIG. 3 is a diagram illustrating an example of the first dictionary 810 and the second dictionary 820.
図3に示すように、第1の辞書810は、第1の言語の語である第1の原語と第3の言語の語である第2の訳語とのパス811を含む。第1の辞書810は、任意の数のパス811を含んでよい。ここで、「パス」とは、1つの原語と1つの訳語との対応関係を指す。即ち、1つの原語に対して複数の訳語が存在する場合、1つの原語に対して、少なくともその訳語の数だけパスが存在する。尚、パスは、一般的に、組とも呼ばれる。 As shown in FIG. 3, the first dictionary 810 includes a path 811 between a first original word that is a word in the first language and a second translated word that is a word in the third language. The first dictionary 810 may include any number of paths 811. Here, “path” refers to the correspondence between one original word and one translated word. That is, when there are a plurality of translated words for one original word, there are at least as many paths as the number of translated words for one original word. A path is generally called a set.
パス811は、第1の原語及び第2の訳語のそれぞれの品詞の種別を示す情報を含んでよい。更に、パス811は、図3に示す例に係わらず、任意の情報を含んでよい。 The path 811 may include information indicating the type of part of speech of each of the first original word and the second translated word. Further, the path 811 may include arbitrary information regardless of the example illustrated in FIG.
また、第2の辞書820は、第3の言語の語である第2の原語と第2の言語の語である第1の訳語とのパス821を含む。第2の辞書820は、任意の数のパス821を含んでよい。 The second dictionary 820 includes a path 821 between a second original word that is a word in the third language and a first translated word that is a word in the second language. The second dictionary 820 may include any number of paths 821.
パス821は、第2の原語及び第1の訳語のそれぞれの品詞の種別を示す情報を含んでよい。更に、パス821は、図3に示す例に係わらず、任意の情報を含んでよい。 The path 821 may include information indicating the type of part of speech of each of the second original word and the first translated word. Furthermore, the path 821 may include arbitrary information regardless of the example illustrated in FIG.
===パス制御部120===
図1に示すパス制御部120は、パス推定部110が選定したブリッジ語に基づいて、パス制御情報880を出力する。
===
The path control
パス制御情報880は、その第1の辞書810におけるその第2の訳語、及びその第2の辞書820におけるその第1の訳語のそれぞれの、選択優先順位を操作するための情報を含む。換言すると、その選択優先順位は、1つの原語に対応する複数のパスの利用優先順位を示す。従って、その選択優先順位は、パス順位とも呼ばれる。 The path control information 880 includes information for operating the selection priority of each of the second translated word in the first dictionary 810 and the first translated word in the second dictionary 820. In other words, the selection priority indicates the use priority of a plurality of paths corresponding to one original language. Therefore, the selection priority order is also called a path order.
図4は、第1の辞書810へ送信されるパス制御情報880の一例を示す図である。図4に示すように、パス制御情報880は、第1の辞書810のパス811を識別するためのパス識別情報と、そのパス811についての操作内容を含む。図4に示すパス制御情報880の場合、「第1の原語(品詞)−第2の訳語(品詞)」が「aaa(名詞)−bbb2(名詞)」であるパス811を、第1位の優先順位とすることを示す。 FIG. 4 is a diagram illustrating an example of the path control information 880 transmitted to the first dictionary 810. As shown in FIG. 4, the path control information 880 includes path identification information for identifying the path 811 of the first dictionary 810 and the operation content for the path 811. In the case of the path control information 880 shown in FIG. 4, the path 811 in which “first original word (part of speech) −second translation (part of speech)” is “aaa (noun) -bbb2 (noun)” is ranked first. Indicates the priority order.
以上が、情報処理システム100の機能単位の各構成要素についての説明である。
This completes the description of each component of the functional unit of the
次に、情報処理システム100のハードウエア単位の構成要素について説明する。
Next, components in hardware units of the
図5は、本実施形態における情報処理システム100を実現するコンピュータ700のハードウエア構成を示す図である。
FIG. 5 is a diagram illustrating a hardware configuration of a computer 700 that implements the
図5に示すように、コンピュータ700は、CPU(Central Processing Unit)701、記憶部702、記憶装置703、入力部704、出力部705及び通信部706を含む。更に、コンピュータ700は、外部から供給される記録媒体(または記憶媒体)707を含む。例えば、記録媒体707は、情報を非一時的に記憶する不揮発性記録媒体(非一時的記録媒体)である。また、記録媒体707は、情報を信号として保持する、一時的記録媒体であってもよい。
As illustrated in FIG. 5, the computer 700 includes a CPU (Central Processing Unit) 701, a
CPU701は、オペレーティングシステム(不図示)を動作させて、コンピュータ700の全体の動作を制御する。例えば、CPU701は、記憶装置703に装着された記録媒体707から、そのプログラムやデータを読み込み、読み込んだそのプログラムやそのデータを記憶部702に書き込む。ここで、そのプログラムは、例えば、後述の図6、図7及び図8に示すフローチャートの動作をコンピュータ700に実行させるためのプログラムである。
The
そして、CPU701は、その読み込んだプログラムに従って、またその読み込んだデータに基づいて、図1に示すパス推定部110及びパス制御部120として各種の処理を実行する。
The
尚、CPU701は、通信網(不図示)に接続される外部コンピュータ(不図示)から、記憶部702にそのプログラムやそのデータをダウンロードしてもよい。
The
記憶部702は、そのプログラムやそのデータを記憶する。記憶部702は、辞書データ800、パス制御情報880、第1の辞書810及び第2の辞書820を記憶してよい。記憶部702は、パス推定部110及びパス制御部120の一部として含まれてよい。
The
記憶装置703は、例えば、光ディスクや、フレキシブルディスク、磁気光ディスク、外付けハードディスク半導体メモリなどであって、記録媒体707を含む。記憶装置703(記録媒体707)は、そのプログラムをコンピュータ読み取り可能に記憶する。また、記憶装置703は、そのデータを記憶してもよい。記憶装置703は、辞書データ800、パス制御情報880、第1の辞書810及び第2の辞書820を記憶してよい。記憶装置703は、パス推定部110及びパス制御部120の一部として含まれてよい。
The
入力部704は、オペレータによる操作の入力や外部からの情報の入力を受け付ける。入力操作に用いられるデバイスは、例えば、マウスや、キーボード、内蔵のキーボタン及びタッチパネルなどである。入力部704は、パス推定部110及びパス制御部120の一部として含まれてよい。
The
出力部705は、例えばディスプレイで実現される。出力部705は、例えばGUI(GRAPHICAL User Interface)によるオペレータへの入力要求や、オペレータに対する出力提示などのために用いられる。出力部705は、パス推定部110及びパス制御部120の一部として含まれてよい。
The
通信部706は、外部とのインタフェースを実現する。通信部706は、パス推定部110及びパス制御部120の一部として含まれてよい。
The
以上説明したように、図1に示す情報処理システム100の機能単位のブロックは、図5に示すハードウエア構成のコンピュータ700によって実現される。但し、コンピュータ700が備える各部の実現手段は、上記に限定されない。すなわち、コンピュータ700は、物理的に結合した1つの装置により実現されてもよいし、物理的に分離した2つ以上の装置を有線または無線で接続し、これら複数の装置により実現されてもよい。
As described above, the functional unit block of the
尚、上述のプログラムのコードを記録した記録媒体707が、コンピュータ700に供給される場合、CPU701は、記録媒体707に格納されたそのプログラムのコードを読み出して実行してもよい。或いは、CPU701は、記録媒体707に格納されたそのプログラムのコードを、記憶部702、記憶装置703またはその両方に格納してもよい。すなわち、本実施形態は、コンピュータ700(CPU701)が実行するそのプログラム(ソフトウエア)を、一時的にまたは非一時的に、記憶する記録媒体707の実施形態を含む。尚、情報を非一時的に記憶する記憶媒体は、不揮発性記憶媒体とも呼ばれる。
When the
以上が、本実施形態における情報処理システム100を実現するコンピュータ700の、ハードウエア単位の各構成要素についての説明である。
The above is an explanation of each component of the computer 700 that implements the
次に本実施形態の動作について、図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
図6は、本実施形態の情報処理システム100の動作を示すフローチャートである。尚、このフローチャートによる処理は、前述したCPU701によるプログラム制御に基づいて、実行されてよい。また、処理のステップ名については、S601のように、記号で記載する。
FIG. 6 is a flowchart showing the operation of the
情報処理システム100は、図5に示す入力部704を介して操作者から辞書データ800を入力されたことを契機に、図6に示すフローチャートの動作を開始してもよい。情報処理システム100は、図5に示す通信部706を介して、外部から辞書データ800を受信したことを契機に、図6に示すフローチャートの動作を開始してもよい。或いは、情報処理システム100は、図5に示す記憶部702や記憶装置703などに予め記憶された辞書データ800を利用してよい。この場合、情報処理システム100は、操作者や外部などからの実行指示に基づいて、図6に示すフローチャートの動作を開始してもよい。
The
パス推定部110は、辞書データ800を受け付ける(ステップS610)。
The
次に、パス推定部110は、第1の辞書810と第2の辞書820とに基づいて、辞書データ800に含まれる組801のそれぞれに対応するブリッジ語を選定する(ステップS630)。
Next, the
次に、パス制御部120は、選定されたブリッジ語に基づいて、第1の辞書810と第2の辞書820とのそれぞれに対応するパス制御情報880を生成し、出力する(ステップS640)。
Next, the
例えば、パス制御部120は、パス制御情報880を図5に示す出力部705を介して出力する。また、パス制御部120は、図5に示す通信部706を介して、図示しない第1の辞書記憶装置及び第2の辞書記憶装置にパス制御情報880を送信してもよい。また、パス制御部120は、図5に示す記憶装置703を介して、記録媒体707にパス制御情報880を記録してもよい。
For example, the
或いは、パス制御部120は、図5に示す記憶装置703に記憶された第1の辞書(不図示)及び第2の辞書(不図示)を、パス制御情報880に基づいて、更新してもよい。
Alternatively, the
図7は、図6に示すステップ630の詳細な動作、即ちパス推定部110の詳細な動作を示すフローチャートである。
FIG. 7 is a flowchart showing the detailed operation of step 630 shown in FIG. 6, that is, the detailed operation of the
パス推定部110は辞書データ800に含まれる組801のそれぞれについて、以下のステップS631からステップS638の処理を実行する。
The
パス推定部110は、第1の辞書810から、組801に含まれる第1の原語を含む、パス811を抽出し、第2の辞書820から、その組801に含まれる第1の訳語を含む、パス821を抽出する(ステップS631)。
The
次に、パス推定部110は、パス811の第2の訳語とパス821の第2の原語とが一致する、パス811とパス821との存在について真偽を判定する(ステップS632)。真と判定した場合(ステップS632でYes)、処理はステップS633へ進む。偽と判定した場合(ステップS632でNo)、処理はステップS634へ進む。
Next, the
次に、パス推定部110は、その第2の訳語(第2の原語)をブリッジ語として選定する(ステップS633)。その後、処理は終了する。
Next, the
次に、パス推定部110は、組801に含まれる第1の原語を含むパス811の存在について真偽を判定する(ステップS634)。真と判定した場合(ステップS634でYes)、処理はステップS635へ進む。偽と判定した場合(ステップS634でNo)、処理はステップS636へ進む。
Next, the
次に、パス推定部110は、その第1の原語を含むパス811に含まれる、その第2の訳語をブリッジ語として選定する(ステップS635)。その後、処理は終了する。
Next, the
次に、パス推定部110は、組801に含まれる第1の訳語を含むパス821の存在について真偽を判定する(ステップS636)。真と判定した場合(ステップS636でYes)、処理はステップS637へ進む。偽と判定した場合(ステップS636でNo)、処理はステップS638へ進む。
Next, the
次に、パス推定部110は、その第1の訳語を含むパス821に含まれる、その第2の原語をブリッジ語として選定する(ステップS637)。その後、処理は終了する。
Next, the
次に、パス推定部110は、その第1の原語をブリッジ語として選定する(ステップS638)。その後、処理は終了する。
Next, the
図8は、図6に示すステップ640の詳細な動作、即ちパス制御部120の詳細な動作を示すフローチャートである。
FIG. 8 is a flowchart showing the detailed operation of step 640 shown in FIG. 6, that is, the detailed operation of the
パス制御部120は、選定されたブリッジ語のそれぞれについて、以下のステップS642からステップS648の処理を実行する。
The path control
パス制御部120は、「第1の原語‐ブリッジ語」であるパス811の存在について、真偽を判定する(ステップS642)。真と判定した場合(ステップS642でYes)、処理はステップS644へ進む。偽と判定した場合(ステップS642でNo)、処理はステップS643へ進む。
The path control
次に、パス制御部120は、「第1の原語‐ブリッジ語」であるパス811の追加を示すパス制御情報880を出力する(ステップS643)。換言すると、パス制御部120は、第1の原語とブリッジ語との組を、第1の言語の原語と、第3の言語の訳語の組として、第1の辞書810に追加することを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、「第1の原語‐ブリッジ語」であるパス811の優先度を上げることを示すパス制御情報880を出力する(ステップS644)。
Next, the
次に、パス制御部120は、「ブリッジ語‐第1の訳語」であるパス821の存在について、真偽を判定する(ステップS646)。真と判定した場合(ステップS646でYes)、処理はステップS648へ進む。偽と判定した場合(ステップS646でNo)、処理はステップS647へ進む。
Next, the
次に、パス制御部120は、「ブリッジ語‐第1の訳語」であるパス821の追加を示すパス制御情報880を出力する(ステップS647)。換言すると、パス制御部120は、ブリッジ語と第1の訳語との組を、第3の言語の原語と、第2の言語の訳語の組として、第2の辞書820に追加することを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、「ブリッジ語‐第1の訳語」であるパス821の優先度を上げることを示すパス制御情報880を出力する(ステップS648)。
Next, the
尚、パス制御部120は、ステップS642及びステップS646の判定がともにYESとなる場合にだけ、ステップS644及びステップS648の動作を実行するようにしてもよい。この場合、パス制御部120は、ステップS643及びステップS647の動作を実行しなくてよい。
Note that the
また、パス制御部120は、パス制御情報880を、上述のように遂次にではなく、任意にまとめて出力してもよい。更に、パス制御部120は、選定されたブリッジ語のそれぞれに対するパス制御情報880を任意にまとめて出力してもよい。
Further, the
また、パス(パス811及びパス821)を追加することを示すパス制御情報880は、原語及び訳語のそれぞれのスペル及び品詞のみを含む。従って、その他の辞書情報は定型的なデータが割り当てられてよい。また、その追加されるパスは、既存のパスよりも、信頼性が低い。そのため、その追加されるパスの優先度は既存のパスよりも低い状態とされてよい(例えば、ステップS643の後、処理がステップS646へ進み、ステップS647の後、処理が終了する)。そして、その追加されるパスは、辞書情報の1属性として「ある言語対のブリッジ翻訳を行うために利用するパスである」という情報を付与されてよい。この場合、翻訳装置が、その追加されるパスを優先させるかどうかを判断してもよい。 Further, the path control information 880 indicating that a path (path 811 and path 821) is added includes only the spelling and part of speech of each of the original word and the translated word. Therefore, typical data may be assigned to other dictionary information. In addition, the added path is less reliable than the existing path. Therefore, the priority of the added path may be lower than that of the existing path (for example, the process proceeds to step S646 after step S643, and the process ends after step S647). Then, the added path may be given information that “is a path used for performing bridge translation of a certain language pair” as one attribute of the dictionary information. In this case, the translation apparatus may determine whether to give priority to the added path.
次に、上述の動作について、より具体的に説明する。 Next, the above operation will be described more specifically.
第1に、図2に示す辞書データ800と、図3に示す第1の辞書810及び第2の辞書820の場合について説明する。 First, the case of the dictionary data 800 shown in FIG. 2 and the first dictionary 810 and the second dictionary 820 shown in FIG. 3 will be described.
この場合、図7に示すステップS631において、パス推定部110は、第1の辞書810から「aaa(名詞)‐bbb1(名詞)」及び「aaa(名詞)‐bbb2(名詞)」のパス811を抽出する。同時に、パス推定部110は、第2の辞書820から「bbb2(名詞)‐ccc(名詞)」のパス821を抽出する。
In this case, in step S631 shown in FIG. 7, the
その後、パス推定部110は、図7に示すステップS632において真と判定し、ステップS633において「bbb2」をブリッジ語として選定する。
Thereafter, the
次に、パス制御部120は、図8に示すステップS642において真と判定し、ステップS644において「aaa(名詞)‐bbb2(名詞)」であるパス811の優先度を上げることを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、図8に示すステップS646において真と判定し、ステップS648において「bbb2(名詞)‐ccc(名詞)」であるパス821の優先度を上げることを示すパス制御情報880を出力する。
Next, the
第2に、図2に示す辞書データ800と、図9に示す第1の辞書810及び第2の辞書820の場合について説明する。 Second, the case of the dictionary data 800 shown in FIG. 2 and the first dictionary 810 and the second dictionary 820 shown in FIG. 9 will be described.
この場合、図7に示すステップS631において、パス推定部110は、第1の辞書810から「aaa(名詞)‐bbb1(名詞)」及び「aaa(名詞)‐bbb2(名詞)」のパス811を抽出する。同時に、パス推定部110は、第2の辞書820から「bbb3(名詞)‐ccc(名詞)」のパス821を抽出する。
In this case, in step S631 shown in FIG. 7, the
その後、パス推定部110は、図7に示すステップS632において偽と判定し、ステップS634において真と判定し、図7に示すステップS635において「bbb1」をブリッジ語として選定する。
Thereafter, the
次に、パス制御部120は、図8に示すステップS642において真と判定し、ステップS644において、「aaa(名詞)‐bbb1(名詞)」であるパス811の優先度を上げることを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、図8に示すステップS646において偽と判定し、ステップS647において、「bbb1(名詞)‐ccc(名詞)」であるパス821を追加することを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、図8に示すステップS648において「bbb1(名詞)‐ccc(名詞)」であるパス821の優先度を上げることを示すパス制御情報880を出力する。
Next, the
第3に、図2に示す辞書データ800と、図10に示す第1の辞書810及び第2の辞書820の場合について説明する。 Third, the case of the dictionary data 800 shown in FIG. 2 and the first dictionary 810 and the second dictionary 820 shown in FIG. 10 will be described.
この場合、図7に示すステップS631において、パス推定部110は、第1の辞書810から「aaa(名詞)‐bbb1(名詞)」及び「aaa(名詞)‐bbb2(名詞)」のパス811を抽出する。また、パス推定部110は、第2の辞書820からパス821を抽出しない。
In this case, in step S631 shown in FIG. 7, the
その後、パス推定部110は、図7に示すステップS632において偽と判定し、ステップS634において真と判定し、図7に示すステップS635において「bbb1」をブリッジ語として選定する。
Thereafter, the
次に、パス制御部120は、図8に示すステップS642において真と判定し、ステップS644において、「aaa(名詞)‐bbb1(名詞)」であるパス811の優先度を上げることを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、図8に示すステップS646において偽と判定し、ステップS647において、「bbb1(名詞)‐ccc(名詞)」であるパス821を追加することを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、図8に示すステップS648において「bbb1(名詞)‐ccc(名詞)」であるパス821の優先度を上げることを示すパス制御情報880を出力する。
Next, the
第4に、図2に示す辞書データ800と、図11に示す第1の辞書810及び第2の辞書820の場合について説明する。 Fourthly, the case of the dictionary data 800 shown in FIG. 2 and the first dictionary 810 and the second dictionary 820 shown in FIG. 11 will be described.
この場合、図7に示すステップS631において、パス推定部110は、第1の辞書810からパス811を抽出しない。また、パス推定部110は、第2の辞書820から「bbb2(名詞)‐ccc(名詞)」のパス821を抽出する。
In this case, in step S631 illustrated in FIG. 7, the
その後、パス推定部110は、ステップS632及びステップS634において偽と判定し、図7に示すステップS636において真と判定し、図7に示すステップS637において「bbb2」をブリッジ語として選定する。
Thereafter, the
次に、パス制御部120は、図8に示すステップS642において偽と判定し、ステップS643において、「aaa(名詞)‐bbb2(名詞)」であるパス811を追加することを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、図8に示すステップS644において、「aaa(名詞)‐bbb2(名詞)」であるパス811の優先度を上げることを示すパス制御情報880を出力する。
Next, in step S644 shown in FIG. 8, the
次に、パス制御部120は、図8に示すステップS646において真と判定し、ステップS648において「bbb2(名詞)‐ccc(名詞)」であるパス821の優先度を上げることを示すパス制御情報880を出力する。
Next, the
第5に、図2に示す辞書データ800と、図12に示す第1の辞書810及び第2の辞書820の場合について説明する。 Fifth, the case of the dictionary data 800 shown in FIG. 2 and the first dictionary 810 and the second dictionary 820 shown in FIG. 12 will be described.
この場合、図7に示すステップS631において、パス推定部110は、第1の辞書810からパス811を抽出しない。また、パス推定部110は、第2の辞書820からパス821を抽出しない。
In this case, in step S631 illustrated in FIG. 7, the
その後、パス推定部110は、図7に示すステップS632、ステップS634及びステップS636において偽と判定し、図7に示すステップS638において「aaa」をブリッジ語として選定する。
Thereafter, the
次に、パス制御部120は、図8に示すステップS642において偽と判定し、ステップS643において、「aaa(名詞)‐aaa(名詞)」であるパス811を追加することを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、図8に示すステップS644において、「aaa(名詞)‐aaa(名詞)」であるパス811の優先度を上げることを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、図8に示すステップS646において偽と判定し、ステップS647において、「aaa(名詞)‐ccc(名詞)」であるパス811を追加することを示すパス制御情報880を出力する。
Next, the
次に、パス制御部120は、図8に示すステップS648において「aaa(名詞)‐ccc(名詞)」であるパス821の優先度を上げることを示すパス制御情報880を出力する。
Next, the
以上が、本実施形態の動作の説明である。 The above is the description of the operation of the present embodiment.
上述のパス制御情報880を任意に利用して、より好適な翻訳結果が得られるように、第1の辞書810及び第2の辞書820におけるパス順位を制御することができる。 The path order in the first dictionary 810 and the second dictionary 820 can be controlled so that a more preferable translation result can be obtained by arbitrarily using the path control information 880 described above.
上述した本実施形態における第1の効果は、ブリッジ翻訳における誤訳を低減することが可能になる点である。 The first effect of the present embodiment described above is that it is possible to reduce mistranslations in bridge translation.
その理由は、パス推定部110が辞書データ800の組801のそれぞれに対応するブリッジ語を選定し、パス制御部120がそのブリッジ語に基づいてパス制御情報880を出力するようにしたからである。
The reason is that the
<<<第1の実施形態の変形例>>>
図13は、第1の実施形態の変形例である情報処理システム101を示す図である。図13に示すように、情報処理システム101は、図1に示す情報処理システム100、第1の辞書記憶装置151、第2の辞書記憶装置152、文入力装置160、第1の翻訳装置171、第2の翻訳装置172及び文出力装置180を含む。情報処理システム100、第1の辞書記憶装置151、第2の辞書記憶装置152、文入力装置160、第1の翻訳装置171、第2の翻訳装置172及び文出力装置180は、ネットワーク109を介して接続されている。尚、情報処理システム100、第1の辞書記憶装置151、第2の辞書記憶装置152、文入力装置160、第1の翻訳装置171、第2の翻訳装置172及び文出力装置180の任意の組み合わせは、1台の図5に示すようなコンピュータ700であってよい。また、情報処理システム100、第1の辞書記憶装置151、第2の辞書記憶装置152、文入力装置160、第1の翻訳装置171、第2の翻訳装置172及び文出力装置180の任意のいずれかどうしは、ネットワークを介することなく直接接続されてもよい。即ち、情報処理システム100、第1の辞書記憶装置151、第2の辞書記憶装置152、文入力装置160、第1の翻訳装置171、第2の翻訳装置172及び文出力装置180とは、任意に、ネットワーク109を介して接続されてよい。
<<< Modification of First Embodiment >>>
FIG. 13 is a diagram illustrating an information processing system 101 that is a modification of the first embodiment. As illustrated in FIG. 13, the information processing system 101 includes the
===文入力装置160===
文入力装置160は、翻訳対象となる文を入力するための一般的な装置であり、具体的には、キーボードやファイル入力装置、ディスク、OCR(Optical Character Recognition)装置等であってよい。文入力装置160は、図5に示す入力部704であってもよい。
===
The
===第1の翻訳装置171===
第1の翻訳装置171は、第1の言語を第3の言語に翻訳するための装置である。
===
The
===第2の翻訳装置172===
第2の翻訳装置172は、第3の言語を第2の言語に翻訳するための装置である。
===
The
===文出力装置180===
文出力装置180は、翻訳された文を出力するための一般的な装置であり、具体的には、ディスプレイや、ファイル入力装置、プリンタ、ディスク、通信装置等であってよい。
===
The
文出力装置180は、図5に示す出力部705や、記憶装置703、記録媒体707、通信部706などであってもよい。
The
===第1の辞書記憶装置151、第2の辞書記憶装置152===
第1の辞書記憶装置151は、第1の翻訳装置171が利用するための辞書データベース装置である。第1の辞書記憶装置151は、例えば、第1の辞書810を記憶する。また、第1の辞書記憶装置151は、辞書データの登録、削除、追加、訳語優先度調整の機能を有している。これらの機能は、一般的な機械翻訳装置における辞書装置が有しているものである。第2の辞書記憶装置152は、第2の翻訳装置172が利用するための辞書データベース装置である。第2の辞書記憶装置152は、例えば、第2の辞書820を記憶し、第1の辞書記憶装置151と同等の機能を有する。
=== First
The first
本変形例において、第1の辞書記憶装置151及び第2の辞書記憶装置152は、情報処理システム100から受信するパス制御情報880に基づいて、第1の辞書810及び第2の辞書820の内容を更新する。
In the present modification, the first
尚、第1の辞書記憶装置151は、第1の言語と第3の言語との間の翻訳用と、ブリッジ翻訳(第1の言語と第2の言語との間の翻訳)用とに、2以上の第1の辞書810を記憶してよい。同様に、第2の辞書記憶装置152は、第3の言語と第2の言語との間の翻訳用と、ブリッジ翻訳用とに、2以上の第2の辞書820を記憶してよい。
The first
この場合、第1の翻訳装置171は、2以上の第1の辞書810から、翻訳対象の言語対に適した選択優先順位(パス順位)を含む第1の辞書810を選択してよい。同様に、第2の翻訳装置172は、2以上の第2の辞書820から、翻訳対象の言語対に適した選択優先順位を含む第2の辞書820を選択してよい。
In this case, the
また、第1の辞書記憶装置151は、第1の言語と第3の言語との間の翻訳用と、ブリッジ翻訳用とに共通に使用される、1つの第1の辞書810のみを記憶してもよい。第3の言語と第2の言語との間の翻訳用と、ブリッジ翻訳用とに共通に使用される、1つの第2の辞書820のみを記憶してもよい。
In addition, the first
上述した本実施形態における変形例の第1の効果は、情報処理システム101の構築を柔軟に実現することが可能になる点である。 The first effect of the modified example in the present embodiment described above is that the information processing system 101 can be flexibly realized.
その理由は、情報処理システム100、第1の辞書記憶装置151、第2の辞書記憶装置152、文入力装置160、第1の翻訳装置171、第2の翻訳装置172及び文出力装置180を、任意に、ネットワーク109を介して接続するからである。
The reason is that the
上述した本実施形態における変形例の第2の効果は、翻訳対象の言語対に適した選択優先順位(パス順位)を利用することが可能になる点である。 The second effect of the modification of the present embodiment described above is that a selection priority (pass order) suitable for the language pair to be translated can be used.
その理由は、以下の構成を含むからである。第1に、第1の辞書記憶装置151及び第2の辞書記憶装置152のそれぞれが、2以上の第1の辞書810及び2以上の第2の辞書820のそれぞれを記憶する。第2に、第1の翻訳装置171及び第2の翻訳装置172のそれぞれが、2以上の第1の辞書810及び2以上の第2の辞書820のそれぞれから、翻訳対象の言語対に適した第1の辞書810及び第2の辞書820のそれぞれを選択する。
This is because the following configuration is included. First, each of the first
<<<第2の実施形態>>>
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
<<< Second Embodiment >>>
Next, a second embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
図14は、本発明の第2の実施形態に係る情報処理システム200の構成を示すブロック図である。 FIG. 14 is a block diagram showing a configuration of an information processing system 200 according to the second embodiment of the present invention.
図14に示すように、本実施形態における情報処理システム200は、第1の実施形態の情報処理システム100と比べて、ブリッジ辞書管理部130及び辞書データ入力部140を更に含む点が異なる。
As illustrated in FIG. 14, the information processing system 200 according to the present embodiment is different from the
尚、図14に示す各構成要素は、ハードウエア単位の回路でも、マイクロチップに含まれるモジュールでも、コンピュータ装置の機能単位に分割された構成要素でもよい。ここでは、図1に示す構成要素は、コンピュータ装置の機能単位に分割された構成要素として説明する。 Each component shown in FIG. 14 may be a hardware unit circuit, a module included in a microchip, or a component divided into functional units of a computer device. Here, the components shown in FIG. 1 will be described as components divided into functional units of the computer apparatus.
また、図14に示す情報処理システム200は、あるサーバに実装され、ネットワークを介して利用可能にされてよいし、図1に示す各構成要素がネットワーク上に分散して設置されて利用可能にされてもよい。 Also, the information processing system 200 shown in FIG. 14 may be implemented on a server and made available via a network, or each component shown in FIG. 1 may be installed in a distributed manner on the network. May be.
===辞書データ入力部140===
辞書データ入力部140は、辞書(第1の辞書810及び第2の辞書820)に登録する原語と訳語との組や、その原語とその訳語との言語種別を示す言語対情報、辞書から削除する単語のリストなどの入力データを受け付ける。具体的には、辞書データ入力部140は、キーボード、ファイル入力装置、ディスク、OCR装置等であってよい。文入力装置160は、図5に示す入力部704であってもよい。
=== Dictionary
The dictionary
辞書データ入力部140は、その入力データが第1の言語と第3の言語との関係に係るデータならば、その入力データに基づいて、第1の辞書810を更新する。例えば、情報処理システム200が図13に示す情報処理システム101に接続されている場合、辞書データ入力部140は、その入力データを第1の辞書記憶装置151へ送信する。
If the input data is data related to the relationship between the first language and the third language, the dictionary
辞書データ入力部140は、その入力データが第2の言語と第3の言語との関係に係るデータならば、その入力データに基づいて、第2の辞書820を更新する。例えば、情報処理システム200が図13に示す情報処理システム101に接続されている場合、辞書データ入力部140は、その入力データを第2の辞書記憶装置152へ送信する。
If the input data is data related to the relationship between the second language and the third language, the dictionary
辞書データ入力部140は、入力されたデータが第1の言語と第2の言語との関係に係るデータ(例えば、図2に示す辞書データ800)ならば、ブリッジ言語とする第3の言語を選定する。次に、辞書データ入力部140は、選定したブリッジ言語の指定とその入力データとをブリッジ辞書管理部130に送信する。
If the input data is data related to the relationship between the first language and the second language (for example, the dictionary data 800 shown in FIG. 2), the dictionary
換言すると、辞書データ入力部140は、その入力データに含まれる原語と訳語との言語種別に基づいて、その入力データの処理分担を決定する。
In other words, the dictionary
===ブリッジ辞書管理部130===
ブリッジ辞書管理部130は、パス推定部110及びパス制御部120を制御し、第1の辞書810及び第2の辞書820を更新する。
=== Bridge
The bridge
ブリッジ辞書管理部130は、第3の言語が複数種類存在する場合、パス制御情報880に加え、第3の言語の指定を出力する。この場合、パス推定部110及びパス制御部120は、その第3の言語の指定に基づいて、パス制御情報880を出力する。
The bridge
ブリッジ辞書管理部130は、複数種類に第3の言語のそれぞれに対応するパス制御情報880について、比較評価を実施し、最適な第3の言語に対応するパス制御情報880を選択してもよい。ブリッジ辞書管理部130は、例えば、第3の言語の種類ごとの、図7に示すステップS633、ステップS635、ステップS637及びステップS638のそれぞれでブリッジ語を選定された、組801の数の比率に基づいて、その比較評価を実施してよい。ブリッジ辞書管理部130は、上記の例に係わらず、任意の手法を用いて、その比較評価を実施してよい。
The bridge
情報処理システム200は、情報処理システム100と同様に、図5に示すコンピュータ700によって実現されてよい。
Similar to the
この場合、CPU701は、その読み込んだプログラムに従って、またその読み込んだデータに基づいて、更に、図14に示すブリッジ辞書管理部130及び辞書データ入力部140としても、各種の処理を実行する。ここで、そのプログラムは、例えば、後述の図15及び図17に示すフローチャートの動作をコンピュータ700に実行させるためのプログラムである。
In this case, the
記憶部702は、更にその比較評価の内容や、後述する言語対表840などを記憶してよい。記憶部702は、更にブリッジ辞書管理部130及び辞書データ入力部140の一部としても含まれてよい。
The
記憶装置703は、更にその比較評価の内容や、後述する言語対表840などを記憶してよい。記憶装置703は、更にブリッジ辞書管理部130及び辞書データ入力部140の一部としても含まれてよい。
The
入力部704は、更にブリッジ辞書管理部130及び辞書データ入力部140の一部としても含まれてよい。
The
出力部705は、更にブリッジ辞書管理部130及び辞書データ入力部140の一部としても含まれてよい。
The
通信部706は、更にブリッジ辞書管理部130及び辞書データ入力部140の一部としても含まれてよい。
The
次に、本実施形態の動作について、図面を参照して詳細に説明する。 Next, the operation of the present embodiment will be described in detail with reference to the drawings.
ここでは、情報処理システム200が、図13に示す情報処理システム101に含まれる場合の動作を説明する。この場合、図13に示す例に係わらず、情報処理システム200、第1の辞書記憶装置151、第2の辞書記憶装置152、文入力装置160、第1の翻訳装置171、第2の翻訳装置172及び文出力装置180のそれぞれは、任意の台数であってよい。また、情報処理システム100は含まれていても、含まれていなくてもよい。即ち、第1の言語及び第2の言語のそれぞれは、複数の言語の任意のいずれかであってよい。
Here, the operation when the information processing system 200 is included in the information processing system 101 shown in FIG. 13 will be described. In this case, regardless of the example shown in FIG. 13, the information processing system 200, the first
図15は、本実施形態の辞書データ入力部140の動作を示すフローチャートである。
FIG. 15 is a flowchart showing the operation of the dictionary
辞書データ入力部140は、入力データを受け付ける(ステップS661)。
The dictionary
次に、辞書データ入力部140は、その言語対情報が示す原語対に対応する、辞書記憶装置と翻訳装置とが存在するか否かを判定する(ステップS662)。ここで、その辞書記憶装置は、例えば、第1の辞書記憶装置151や、第2の辞書記憶装置152などである。その翻訳装置は、例えば、第1の翻訳装置171や、第2の翻訳装置172などである。
Next, the dictionary
例えば、辞書データ入力部140は、図16に示すような言語対表840を内部に保持し、その言語対表840を参照して、その辞書記憶装置とその翻訳装置とが存在するか否かを判定よい。
For example, the dictionary
図16は、言語対表840の一例を示す。図16に示すように、言語対表840は、原文言語と訳文言語と辞書記憶装置識別子との組を含む。図16に示す言語対表840は、日本語-英語及び日本語-中国語のそれぞれの、辞書記憶装置及び翻訳装置が存在し、英語-中国語辞書記憶装置及び翻訳装置が存在しないことを示す。尚、辞書記憶装置識別子は、情報処理システム200が辞書記憶装置をアクセスするための識別子である。例えば、情報処理システム200は、その辞書記憶装置識別子に基づいて、辞書記憶装置を、所定のプロトコルでアクセスしてよい。 FIG. 16 shows an example of the language pair table 840. As shown in FIG. 16, the language pair table 840 includes a set of a source language, a target language, and a dictionary storage device identifier. The language pair table 840 shown in FIG. 16 indicates that there are dictionary storage devices and translation devices for Japanese-English and Japanese-Chinese, and that there are no English-Chinese dictionary storage devices and translation devices. . The dictionary storage device identifier is an identifier for the information processing system 200 to access the dictionary storage device. For example, the information processing system 200 may access the dictionary storage device using a predetermined protocol based on the dictionary storage device identifier.
その辞書記憶装置及びその翻訳装置が存在する場合(ステップS662でYES)、辞書データ入力部140は、その辞書記憶装置に、その入力データを送信する(ステップS663)。その後、処理は終了する。
If the dictionary storage device and the translation device exist (YES in step S662), the dictionary
その辞書記憶装置及びその翻訳装置が存在しない場合(ステップS662でNO)、辞書データ入力部140は、例えば言語対表840に基づいて、ブリッジ言語(第3の言語)を選定する(ステップS664)。
If the dictionary storage device and the translation device do not exist (NO in step S662), the dictionary
例えば、その言語対情報が示す原語対が、英語‐中国語である場合、英語からたどって中国語にたどり着ける経路を探す。図16に示す言語対表840の例では、「英語-日本語」、「日本語-中国語」の順でたどることができるので、辞書データ入力部140は、ブリッジ言語として日本語を選定する。複数のブリッジ言語が存在する場合、辞書データ入力部140は、所定の優先度に基づいて、1つのブリッジ言語を選定してよい。この場合、ブリッジ翻訳を実行するときの翻訳装置も、その所定の優先度に基づいて選定される。
For example, when the original language pair indicated by the language pair information is English-Chinese, a route that can be reached from English to Chinese is searched. In the example of the language pair table 840 shown in FIG. 16, it can be traced in the order of “English-Japanese” and “Japanese-Chinese”, so the dictionary
また、複数のブリッジ言語が存在する場合、辞書データ入力部140は、その複数のブリッジ言語のそれぞれを、ブリッジ言語として選定してもよい。
When there are a plurality of bridge languages, the dictionary
ブリッジ言語が選定された場合(ステップS664でYES)、辞書データ入力部140は、ブリッジ辞書管理部130へ選定されたブリッジ言語の指定とその入力データを送信する(ステップS665)。その後、処理は終了する。
When a bridge language is selected (YES in step S664), dictionary
ブリッジ言語が選定されなかった場合(ステップS664でNO)、辞書データ入力部140は、異常処理(例えば、異常終了報告の出力)を実行する(ステップS667)。その後、処理は終了する。
When the bridge language is not selected (NO in step S664), the dictionary
図17は、ブリッジ辞書管理部130の動作を示すフローチャートである。
FIG. 17 is a flowchart showing the operation of the bridge
ブリッジ辞書管理部130は、辞書データ入力部140から、そのブリッジ言語の指定とその入力データとを受信する(ステップS671)。
The bridge
次に、ブリッジ辞書管理部130は、パス推定部110へ、そのブリッジ言語の指定とその入力データに基づいて生成した辞書データ800とを送信する。その後、ブリッジ辞書管理部130は、パス推定部110から、ブリッジ語を受信する(ステップS672)。
Next, the bridge
次に、ブリッジ辞書管理部130は、そのブリッジ語をパス制御部120へ送信する。その後、ブリッジ辞書管理部130は、パス制御部120からパス制御情報880を受信する(ステップS673)。
Next, the bridge
次に、ブリッジ辞書管理部130は、パス制御情報880を第1の辞書記憶装置151及び第2の辞書記憶装置152へ送信する(ステップS674)。
Next, the bridge
以上が本実施形態の動作の説明である。 The above is the description of the operation of the present embodiment.
上述した本実施形態における第1の効果は、第1の実施形態の効果に加えて、情報処理システム101の運用を、より容易にすることを可能にする点である
その理由は、辞書データ入力部140が、入力データに含まれる原語と訳語との言語種別に基づいて、その入力データの処理分担を決定するからである。
The first effect of the present embodiment described above is that, in addition to the effect of the first embodiment, it is possible to make the operation of the information processing system 101 easier. This is because the
上述した本実施形態における第2の効果は、任意の言語間でのブリッジ翻訳において、第1の実施形態と同様の効果を得ることを可能にする点である。 The second effect in the present embodiment described above is that it is possible to obtain the same effect as in the first embodiment in bridge translation between arbitrary languages.
その理由は、辞書データ入力部140が、入力データに含まれる原語と訳語との言語種別に基づいて、ブリッジ言語を選定するからである。
The reason is that the dictionary
上述した本実施形態における第3の効果は、より好適に第1の辞書810及び第2の辞書820の選択優先順位を制御することを可能にする点である。 The third effect of the present embodiment described above is that the selection priority order of the first dictionary 810 and the second dictionary 820 can be controlled more suitably.
その理由は、辞書データ入力部140が複数のブリッジ言語を選定し、ブリッジ辞書管理部130がその複数のブリッジ言語について比較評価し、最適なブリッジ言語に対応するパス制御情報880を利用するからである。
The reason is that the dictionary
<<<第3の実施形態>>>
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
<<< Third Embodiment >>>
Next, a third embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
本実施形態の構成は、例えば、図1に示す情報処理システム100及び図14に示す情報処理システム200の構成と同様であってよい。
The configuration of the present embodiment may be the same as the configuration of the
本実施形態の情報処理システム100及び情報処理システム200は、3段階以上のブリッジ翻訳に対応する。3段階以上のブリッジ翻訳は、例えば、第1の言語から第2の言語への翻訳において、第1の言語から第1の「第3の言語」へ翻訳し、第1の「第3の言語」から第2の「第3の言語」へ翻訳し、第2の「第3の言語」から第2の言語へ翻訳する、翻訳である。尚、3段階以上の橋渡しをする複数段の第3の言語の数は、任意の数であってよい。
The
本実施形態の情報処理システム100のパス推定部110は、第1の原語と第1の訳語との組(組801)に対応する、複数段の第3の言語のそれぞれに対応する、ブリッジ語を選定する。
The
本実施形態の情報処理システム100のパス制御部120は、選定されたそのブリッジ語のそれぞれに基づいて、その各ブリッジ語に対応する第1の辞書及び第2の辞書のそれぞれにパス制御情報880を出力する。
The path control
例えば、第1の言語から第2の言語への翻訳において、第1の言語から第1の「第3の言語」へ翻訳し、第1の「第3の言語」から第2の「第3の言語」へ翻訳し、第2の「第3の言語」から第2の言語へ翻訳する場合について、説明する。 For example, in the translation from the first language to the second language, the translation from the first language to the first “third language” is performed, and from the first “third language” to the second “third language”. The case of translating to "Language of the second language" and translating from the second "Third language" to the second language will be described.
パス推定部110は、第1の言語から第1の「第3の言語」へ翻訳し、第1の「第3の言語」から第2の「第3の言語」へ翻訳する場合の、第1の「第3の言語」の語である第1のブリッジ語を選定する。また、パス推定部110は、第1の「第3の言語」から第2の「第3の言語」へ翻訳し、第2の「第3の言語」から第2の言語へ翻訳する場合の第2の「第3の言語」の語である第2のブリッジ語を選定する。
The
パス制御部120は、第1のブリッジ語に基づいて、第1の言語から第1の「第3の言語」へ翻訳するための辞書及び第1の「第3の言語」から第2の「第3の言語」へ翻訳するための辞書へパス制御情報880を出力する。第1の言語から第1の「第3の言語」へ翻訳するための辞書及び第1の「第3の言語」から第2の「第3の言語」へ翻訳するための辞書の組は、第1のブリッジ語に対応する第1の辞書及び第2の辞書の組である。また、パス制御部120は、第2のブリッジ語に基づいて、第1の「第3の言語」から第2の「第3の言語」へ翻訳するための辞書及び第2の「第3の言語」から第2の言語へ翻訳するための辞書へパス制御情報880を出力する。第1の「第3の言語」から第2の「第3の言語」へ翻訳するための辞書及び第2の「第3の言語」から第2の言語へ翻訳するための辞書の組は、第2のブリッジ語に対応する第1の辞書及び第2の辞書の組である。
Based on the first bridge word, the
本実施形態の情報処理システム200の辞書データ入力部140は、第1の原語と第1の訳語との組(組801)に対応する、3段階以上の翻訳を実行するための、複数段の第3の言語を選定する。
The dictionary
本実施形態の情報処理システム200のブリッジ辞書管理部130は、複数段の第3の言語のそれぞれに対応する第1の辞書及び第2の辞書のそれぞれにパス制御情報880を出力する。
The bridge
上述した本実施形態における第1の効果は、第1の実施形態の効果に加えて、可用性を向上させることを可能にする点である。 The 1st effect in this embodiment mentioned above is a point which makes it possible to improve availability in addition to the effect of 1st Embodiment.
その理由は、パス推定部110が複数段の第3の言語のそれぞれに対応するブリッジ語を選定し、パス制御部120がその各ブリッジ語に対応するパス制御情報880を出力するからである。
This is because the
上述した本実施形態における第2の効果は、第2の実施形態の効果に加えて、可用性を向上させることを可能にする点である。 The 2nd effect in this embodiment mentioned above is a point which makes it possible to improve availability in addition to the effect of 2nd Embodiment.
その理由は、辞書データ入力部140がブリッジ言語とする任意の複数段の第3の言語を決定し、ブリッジ辞書管理部130がその各ブリッジ言語に対応するパス制御情報880を出力するからである。
The reason is that the dictionary
以上の各実施形態で説明した各構成要素は、必ずしも個々に独立した存在である必要はない。例えば、複数個の任意のその構成要素が1個のモジュールとして実現されてよい。また、その構成要素の内の任意のひとつが複数のモジュールで実現されてもよい。また、その構成要素の内の任意のひとつがその構成要素の内の任意の他のひとつであってよい。また、その構成要素の内の任意のひとつの一部と、その構成要素の内の任意の他のひとつの一部とが重複してもよい。 Each component described in each of the above embodiments does not necessarily have to be individually independent. For example, a plurality of arbitrary constituent elements may be realized as one module. Any one of the constituent elements may be realized by a plurality of modules. Further, any one of the components may be any other one of the components. Further, any one part of the constituent elements may overlap with any other part of the constituent elements.
以上説明した各実施形態における各構成要素及び各構成要素を実現するモジュールは、必要に応じ、可能であれば、ハードウエア的に実現されてよい。また、各構成要素及び各構成要素を実現するモジュールは、コンピュータ及びプログラムで実現されてよい。また、各構成要素及び各構成要素を実現するモジュールは、ハードウエア的なモジュールとコンピュータ及びプログラムとの混在により実現されてもよい。 In the embodiments described above, each component and a module that realizes each component may be realized as hardware as necessary. Moreover, each component and the module which implement | achieves each component may be implement | achieved by a computer and a program. Each component and a module that realizes each component may be realized by a mixture of a hardware module, a computer, and a program.
そのプログラムは、例えば、磁気ディスクや半導体メモリなど、コンピュータが読み取り可能な非一時的記録媒体に記録され、コンピュータに提供される。そして、そのプログラムは、コンピュータの立ち上げ時などに、非一時的記録媒体からコンピュータに読み取られる。この読み取られたプログラムは、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施形態における構成要素として機能させる。 The program is recorded on a computer-readable non-transitory recording medium such as a magnetic disk or a semiconductor memory, and provided to the computer. The program is read from the non-transitory recording medium by the computer when the computer is started up. The read program causes the computer to function as a component in each of the above-described embodiments by controlling the operation of the computer.
また、以上説明した各実施形態では、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障のない範囲で変更することができる。 Further, in each of the embodiments described above, a plurality of operations are described in order in the form of a flowchart, but the described order does not limit the order in which the plurality of operations are executed. For this reason, when each embodiment is implemented, the order of the plurality of operations can be changed within a range that does not hinder the contents.
更に、以上説明した各実施形態では、複数の動作は個々に相違するタイミングで実行されることに限定されない。例えば、ある動作の実行中に他の動作が発生してよい。また、ある動作と他の動作との実行タイミングが部分的に乃至全部において重複してもよい。 Furthermore, in each embodiment described above, a plurality of operations are not limited to being executed at different timings. For example, other operations may occur during execution of an operation. In addition, the execution timing of one operation and another operation may partially or entirely overlap.
更に、以上説明した各実施形態では、ある動作が他の動作の契機になるように記載しているが、その記載はある動作と他の動作との関係を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の関係は内容的に支障のない範囲で変更することができる。また各構成要素の各動作の具体的な記載は、各構成要素の各動作を限定するものではない。このため、各構成要素の具体的な各動作は、各実施形態を実施する上で機能的、性能的、その他の特性に対して支障を来さない範囲内で変更されてよい。 Further, in each of the embodiments described above, it is described that a certain operation becomes a trigger for another operation, but the description does not limit the relationship between the certain operation and another operation. For this reason, when each embodiment is implemented, the relationship between the plurality of operations can be changed within a range that does not hinder the contents. The specific description of each operation of each component does not limit each operation of each component. For this reason, each specific operation | movement of each component may be changed in the range which does not cause trouble with respect to a functional, performance, and other characteristic in implementing each embodiment.
以上、各実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得るさまざまな変更をすることができる。 Although the present invention has been described with reference to each embodiment, the present invention is not limited to the above embodiment. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
本発明は、翻訳システム、多言語間にわたるテキストマイニング装置やタグの自動付与システムなどに適用できる。 The present invention can be applied to a translation system, a text mining device across multiple languages, an automatic tag assignment system, and the like.
100 情報処理システム
101 情報処理システム
109 ネットワーク
110 パス推定部
120 パス制御部
130 ブリッジ辞書管理部
140 辞書データ入力部
151 辞書記憶装置
152 辞書記憶装置
160 文入力装置
171 翻訳装置
172 翻訳装置
180 文出力装置
200 情報処理システム
700 コンピュータ
701 CPU
702 記憶部
703 記憶装置
704 入力部
705 出力部
706 通信部
707 記録媒体
800 辞書データ
801 組
810 辞書
811 パス
820 辞書
821 パス
840 言語対表
880 パス制御情報
DESCRIPTION OF
702
Claims (3)
前記橋渡し語に基づいて、前記第1の辞書における前記第2の訳語及び前記第2の辞書における前記第1の訳語のそれぞれの、選択優先順位を操作するための情報を含むパス制御情報を生成し、前記パス制御情報に基づいて前記第1の辞書及び前記第2の辞書の前記選択優先順位を制御するパス制御手段と、を含み、
前記パス推定手段は、
前記第2の訳語と前記第2の原語とが一致する場合に、前記第2の訳語を前記橋渡し語として選定し、
前記第2の訳語と前記第2の原語とが一致せず、且つ、前記第1の辞書に前記第1の原語が含まれる場合に、前記第2の訳語を前記橋渡し語として選定し、
前記第2の訳語と前記第2の原語とが一致せず、前記第1の辞書に前記第1の原語が含まれず、且つ、前記第2の辞書に前記第1の訳語が含まれる場合に、前記第2の原語を前記橋渡し語として選定し、
前記第2の訳語と前記第2の原語とが一致せず、前記第1の辞書に前記第1の原語が含まれず、且つ、前記第2の辞書に前記第1の訳語が含まれない場合に、前記第1の原語を前記橋渡し語として選定し、
前記パス制御手段は、前記第1の辞書が前記第1の原語と前記橋渡し語との組を、前記第1の言語の原語と前記第3の言語の訳語との組として含み、前記第2の辞書が前記橋渡し語と前記第1の訳語との組を、前記第3の言語の原語と前記第2の言語の訳語との組として含む場合、前記第1の辞書における前記第1の原語と前記橋渡し語との組の選択優先順位を上げること、及び前記第2の辞書における前記橋渡し語と前記第1の訳語との組の選択優先順位を上げることを示す前記パス制御情報を生成し、
前記パス制御手段は、前記第1の辞書が前記第1の原語を前記第1の言語の原語として含まない場合に、前記第1の原語と前記橋渡し語との組を、前記第1の言語の原語と前記第2の訳語との組として、前記第1の辞書に追加することを示す前記パス制御情報を出力し、前記第2の辞書が前記第1の訳語を前記第2の言語の訳語として含まない場合に、前記橋渡し語と前記第1の訳語との組を、前記第2の原語と前記第2の言語の訳語との組として、前記第2の辞書に追加することを示す前記パス制御情報を生成する
情報処理システム。 The first original word that is a word in the first language and the first translated word that is the word in the second language are input, and the first dictionary that is a dictionary from the first language to the third language is input to the first dictionary. A first translated word, a second translated word that is a translated word of the first original word that is a word in the third language, and a dictionary from the third language to the second language. Based on the first translated word and the second original word, which is the original word of the first translated word, which is the word of the third language, included in the second dictionary, Path estimation means for selecting a bridging word corresponding to a pair of the original word and the first translated word;
Based on the bridging word, generation of path control information including information for operating selection priorities of the second translated word in the first dictionary and the first translated word in the second dictionary and, looking contains and a path control means for controlling the selection priority of the first dictionary and said second dictionary on the basis of the path control information,
The path estimation means includes
If the second translated word and the second original word match, select the second translated word as the bridging word;
When the second translated word and the second original word do not match and the first original word is included in the first dictionary, the second translated word is selected as the bridging word;
The second translated word and the second original word do not match, the first dictionary does not contain the first original word, and the second dictionary contains the first translated word Selecting the second source language as the bridging language,
The second translated word and the second original word do not match, the first dictionary does not contain the first original word, and the second dictionary does not contain the first translated word And selecting the first source language as the bridging language,
In the path control means, the first dictionary includes a set of the first original word and the bridging word as a set of the original word of the first language and the translated word of the third language, The dictionary includes the set of the bridging word and the first translated word as the set of the third language original word and the second language translated word, the first original word in the first dictionary Generating the path control information indicating that the selection priority of the pair of the bridge word and the bridge word is increased, and the selection priority of the pair of the bridge word and the first translation word in the second dictionary is increased. ,
The path control means, when the first dictionary does not include the first original word as the first language original word, sets the first language and the bridging word as the first language. The path control information indicating that the original word and the second translated word are added to the first dictionary is output, and the second dictionary converts the first translated word into the second language. Indicates that a set of the bridging word and the first translated word is added to the second dictionary as a pair of the second original word and the translated word of the second language when not included as a translated word An information processing system for generating the path control information .
第1の言語の語である第1の原語と第2の言語の語である第1の訳語とを入力とし、前記第1の言語から第3の言語への辞書である第1の辞書に含まれる、前記第1の原語と、前記第3の言語の語である、前記第1の原語の訳語である、第2の訳語と、前記第3の言語から前記第2の言語への辞書である第2の辞書に含まれる、前記第1の訳語と、前記第3の言語の語である、前記第1の訳語の原語である、第2の原語と、に基づいて、前記第1の原語と前記第1の訳語との組に対応する橋渡し語を選定し、
前記橋渡し語に基づいて、前記第1の辞書における前記第2の訳語及び前記第2の辞書における前記第1の訳語のそれぞれの、選択優先順位を操作するための情報を含むパス制御情報を生成し、前記パス制御情報に基づいて前記第1の辞書及び前記第2の辞書の前記選択優先順位を制御し、
前記橋渡し語を選定する際に、
前記第2の訳語と前記第2の原語とが一致する場合に、前記第2の訳語を前記橋渡し語として選定し、
前記第2の訳語と前記第2の原語とが一致せず、且つ、前記第1の辞書に前記第1の原語が含まれる場合に、前記第2の訳語を前記橋渡し語として選定し、
前記第2の訳語と前記第2の原語とが一致せず、前記第1の辞書に前記第1の原語が含まれず、且つ、前記第2の辞書に前記第1の訳語が含まれる場合に、前記第2の原語を前記橋渡し語として選定し、
前記第2の訳語と前記第2の原語とが一致せず、前記第1の辞書に前記第1の原語が含まれず、且つ、前記第2の辞書に前記第1の訳語が含まれない場合に、前記第1の原語を前記橋渡し語として選定し、
パス制御情報を生成する際に、
前記第1の辞書が前記第1の原語と前記橋渡し語との組を、前記第1の言語の原語と前記第3の言語の訳語との組として含み、前記第2の辞書が前記橋渡し語と前記第1の訳語との組を、前記第3の言語の原語と前記第2の言語の訳語との組として含む場合、前記第1の辞書における前記第1の原語と前記橋渡し語との組の選択優先順位を上げること、及び前記第2の辞書における前記橋渡し語と前記第1の訳語との組の選択優先順位を上げることを示す前記パス制御情報を生成し、
前記第1の辞書が前記第1の原語を前記第1の言語の原語として含まない場合に、前記第1の原語と前記橋渡し語との組を、前記第1の言語の原語と前記第2の訳語との組として、前記第1の辞書に追加することを示す前記パス制御情報を出力し、前記第2の辞書が前記第1の訳語を前記第2の言語の訳語として含まない場合に、前記橋渡し語と前記第1の訳語との組を、前記第2の原語と前記第2の言語の訳語との組として、前記第2の辞書に追加することを示す前記パス制御情報を生成する
翻訳方法。 Computer
The first original word that is a word in the first language and the first translated word that is the word in the second language are input, and the first dictionary that is a dictionary from the first language to the third language is input to the first dictionary. A first translated word, a second translated word that is a translated word of the first original word that is a word in the third language, and a dictionary from the third language to the second language. Based on the first translated word and the second original word, which is the original word of the first translated word, which is the word of the third language, included in the second dictionary, Selecting a bridging word corresponding to the pair of the original word and the first translation,
Based on the bridging word, generation of path control information including information for operating selection priorities of the second translated word in the first dictionary and the first translated word in the second dictionary And controlling the selection priority of the first dictionary and the second dictionary based on the path control information,
When selecting the bridge word,
If the second translated word and the second original word match, select the second translated word as the bridging word;
When the second translated word and the second original word do not match and the first original word is included in the first dictionary, the second translated word is selected as the bridging word;
The second translated word and the second original word do not match, the first dictionary does not contain the first original word, and the second dictionary contains the first translated word Selecting the second source language as the bridging language,
The second translated word and the second original word do not match, the first dictionary does not contain the first original word, and the second dictionary does not contain the first translated word And selecting the first source language as the bridging language,
When generating path control information,
The first dictionary includes a set of the first original word and the bridging word as a set of the first language original word and the third language translated word, and the second dictionary includes the bridging word. And the first translated word as a pair of the original language of the third language and the translated word of the second language, the first original word and the bridging word in the first dictionary Generating the path control information indicating increasing the selection priority of a set, and increasing the selection priority of the set of the bridging word and the first translated word in the second dictionary;
When the first dictionary does not include the first original language as the original language of the first language, a set of the first original language and the bridging language is defined as the first language original language and the second language When the path control information indicating addition to the first dictionary is output as a pair with the translation of the first dictionary, and the second dictionary does not include the first translation as a translation of the second language Generating the path control information indicating that a set of the bridging word and the first translation is added to the second dictionary as a pair of the second original word and the translation of the second language How to translate.
前記橋渡し語に基づいて、前記第1の辞書における前記第2の訳語及び前記第2の辞書における前記第1の訳語のそれぞれの、選択優先順位を操作するための情報を含むパス制御情報を生成し、前記パス制御情報に基づいて前記第1の辞書及び前記第2の辞書の前記選択優先順位を制御し、
前記橋渡し語を選定する際に、
前記第2の訳語と前記第2の原語とが一致する場合に、前記第2の訳語を前記橋渡し語として選定し、
前記第2の訳語と前記第2の原語とが一致せず、且つ、前記第1の辞書に前記第1の原語が含まれる場合に、前記第2の訳語を前記橋渡し語として選定し、
前記第2の訳語と前記第2の原語とが一致せず、前記第1の辞書に前記第1の原語が含まれず、且つ、前記第2の辞書に前記第1の訳語が含まれる場合に、前記第2の原語を前記橋渡し語として選定し、
前記第2の訳語と前記第2の原語とが一致せず、前記第1の辞書に前記第1の原語が含まれず、且つ、前記第2の辞書に前記第1の訳語が含まれない場合に、前記第1の原語を前記橋渡し語として選定し、
パス制御情報を生成する際に、
前記第1の辞書が前記第1の原語と前記橋渡し語との組を、前記第1の言語の原語と前記第3の言語の訳語との組として含み、前記第2の辞書が前記橋渡し語と前記第1の訳語との組を、前記第3の言語の原語と前記第2の言語の訳語との組として含む場合、前記第1の辞書における前記第1の原語と前記橋渡し語との組の選択優先順位を上げること、及び前記第2の辞書における前記橋渡し語と前記第1の訳語との組の選択優先順位を上げることを示す前記パス制御情報を生成し、
前記第1の辞書が前記第1の原語を前記第1の言語の原語として含まない場合に、前記第1の原語と前記橋渡し語との組を、前記第1の言語の原語と前記第2の訳語との組として、前記第1の辞書に追加することを示す前記パス制御情報を出力し、前記第2の辞書が前記第1の訳語を前記第2の言語の訳語として含まない場合に、前記橋渡し語と前記第1の訳語との組を、前記第2の原語と前記第2の言語の訳語との組として、前記第2の辞書に追加することを示す前記パス制御情報を生成する
処理をコンピュータに実行させる
プログラム。 The first original word that is a word in the first language and the first translated word that is the word in the second language are input, and the first dictionary that is a dictionary from the first language to the third language is input to the first dictionary. A first translated word, a second translated word that is a translated word of the first original word that is a word in the third language, and a dictionary from the third language to the second language. Based on the first translated word and the second original word, which is the original word of the first translated word, which is the word of the third language, included in the second dictionary, Selecting a bridging word corresponding to the pair of the original word and the first translation,
Based on the bridging word, generation of path control information including information for operating selection priorities of the second translated word in the first dictionary and the first translated word in the second dictionary And controlling the selection priority of the first dictionary and the second dictionary based on the path control information,
When selecting the bridge word,
If the second translated word and the second original word match, select the second translated word as the bridging word;
When the second translated word and the second original word do not match and the first original word is included in the first dictionary, the second translated word is selected as the bridging word;
The second translated word and the second original word do not match, the first dictionary does not contain the first original word, and the second dictionary contains the first translated word Selecting the second source language as the bridging language,
The second translated word and the second original word do not match, the first dictionary does not contain the first original word, and the second dictionary does not contain the first translated word And selecting the first source language as the bridging language,
When generating path control information,
The first dictionary includes a set of the first original word and the bridging word as a set of the first language original word and the third language translated word, and the second dictionary includes the bridging word. And the first translated word as a pair of the original language of the third language and the translated word of the second language, the first original word and the bridging word in the first dictionary Generating the path control information indicating increasing the selection priority of a set, and increasing the selection priority of the set of the bridging word and the first translated word in the second dictionary;
When the first dictionary does not include the first original language as the original language of the first language, a set of the first original language and the bridging language is defined as the original language of the first language and the second language. When the path control information indicating addition to the first dictionary is output as a pair with the translation of the first dictionary, and the second dictionary does not include the first translation as a translation of the second language Generating the path control information indicating that a set of the bridging word and the first translation is added to the second dictionary as a pair of the second original word and the translation of the second language Yes A program that causes a computer to execute processing.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014177895A JP6492466B2 (en) | 2014-09-02 | 2014-09-02 | Information processing system, translation method, and program therefor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2014177895A JP6492466B2 (en) | 2014-09-02 | 2014-09-02 | Information processing system, translation method, and program therefor |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2016051433A JP2016051433A (en) | 2016-04-11 |
| JP6492466B2 true JP6492466B2 (en) | 2019-04-03 |
Family
ID=55658858
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2014177895A Active JP6492466B2 (en) | 2014-09-02 | 2014-09-02 | Information processing system, translation method, and program therefor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6492466B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101745316B1 (en) * | 2016-02-26 | 2017-06-09 | 린나이코리아 주식회사 | Automatic Language Conversion Method of Internet of Things products |
| KR101719107B1 (en) * | 2016-10-27 | 2017-04-06 | 박성국 | Server, and method for translation |
| KR102516363B1 (en) | 2018-01-26 | 2023-03-31 | 삼성전자주식회사 | Machine translation method and apparatus |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02301868A (en) * | 1989-05-17 | 1990-12-13 | Hitachi Ltd | How to create and maintain a dictionary for natural language processing |
| JP5008144B2 (en) * | 2008-02-13 | 2012-08-22 | 独立行政法人情報通信研究機構 | Parallel translation information generation apparatus, parallel translation information generation method, and program |
| JP5007977B2 (en) * | 2008-02-13 | 2012-08-22 | 独立行政法人情報通信研究機構 | Machine translation apparatus, machine translation method, and program |
-
2014
- 2014-09-02 JP JP2014177895A patent/JP6492466B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2016051433A (en) | 2016-04-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8990066B2 (en) | Resolving out-of-vocabulary words during machine translation | |
| JP3969628B2 (en) | Translation support apparatus, method, and translation support program | |
| JP3356536B2 (en) | Machine translation equipment | |
| JP4502615B2 (en) | Similar sentence search device, similar sentence search method, and program | |
| JP3963394B2 (en) | Device for reporting software fault information | |
| US20070244691A1 (en) | Translation of user interface text strings | |
| CN111176650B (en) | Parser generation method, search method, server, and storage medium | |
| CN111367595B (en) | Data processing method, program running method, device and processing equipment | |
| US12321423B2 (en) | Software license-based code suggestions | |
| JP4997966B2 (en) | Parallel translation example sentence search program, parallel translation example sentence search device, and parallel translation example sentence search method | |
| CN111729313A (en) | Language configuration method and device, storage medium, and electronic device | |
| JP6492466B2 (en) | Information processing system, translation method, and program therefor | |
| US20150106701A1 (en) | Input support method and information processing system | |
| JP2015060458A (en) | Machine translation apparatus, method, and program | |
| CN113495874A (en) | Information processing apparatus and computer readable medium | |
| JP6056489B2 (en) | Translation support program, method, and apparatus | |
| JP4734400B2 (en) | Document search apparatus and program | |
| JP4431759B2 (en) | Unregistered word automatic extraction device and program, and unregistered word automatic registration device and program | |
| US20050154579A1 (en) | Apparatus for and method of analyzing chinese | |
| JP6766384B2 (en) | Information processing equipment and programs | |
| CN112632109A (en) | Information extraction method and device, electronic equipment and readable storage medium | |
| CN119127359B (en) | Multilingual interface adaptation methods, devices, equipment, and computer program products | |
| JP6203083B2 (en) | Unknown word extraction device and unknown word extraction method | |
| JP7753067B2 (en) | Document processing program, document processing device, and document processing method | |
| KR20250146119A (en) | Method and system for real-time automatic translation of contents |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170809 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180618 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180626 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180824 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190205 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190218 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6492466 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |