Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0566630B2 - - Google Patents
[go: Go Back, main page]

JPH0566630B2 - - Google Patents

Info

Publication number
JPH0566630B2
JPH0566630B2 JP62272638A JP27263887A JPH0566630B2 JP H0566630 B2 JPH0566630 B2 JP H0566630B2 JP 62272638 A JP62272638 A JP 62272638A JP 27263887 A JP27263887 A JP 27263887A JP H0566630 B2 JPH0566630 B2 JP H0566630B2
Authority
JP
Japan
Prior art keywords
translation
mark
unit
rules
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62272638A
Other languages
Japanese (ja)
Other versions
JPH01113870A (en
Inventor
Yoji Fukumochi
Hitoshi Suzuki
Hidezo Kugimya
Ichiko Sada
Noryuki Hirai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP62272638A priority Critical patent/JPH01113870A/en
Priority to US07/262,313 priority patent/US5005127A/en
Priority to GB8825002A priority patent/GB2211639A/en
Publication of JPH01113870A publication Critical patent/JPH01113870A/en
Publication of JPH0566630B2 publication Critical patent/JPH0566630B2/ja
Granted legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E60/00Enabling technologies; Technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02E60/30Hydrogen technology
    • Y02E60/50Fuel cells

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】[Detailed description of the invention]

<産業上の利用分野> この発明は、入力される文章の任意の構文を区
分して翻訳することができる機械翻訳装置に関す
る。 <従来の技術> 従来、機械翻訳装置としては次のようなものが
ある。この機械翻訳装置は、キーボードから入力
されたソース言語を、メインCPUの制御により
翻訳モジユールに入力し、この入力されたソース
言語を、翻訳モジユールによつてメモリーに記憶
されている辞書、文法規則および木構造変換規則
を利用して、ターゲツト言語に翻訳するものであ
る。上記文法規則は、入力された文章(以下、原
文と言う)の構文の構造を決定する際に用いられ
る。 <発明が解決しようとする問題点> しかしながら、上記従来の機械翻訳装置で翻訳
する場合は、メモリーに記憶されている文法規則
に従つて原文の構文の構造を決定するようにして
いるので、上記メモリーに記憶されている文法規
則が原文中の特定の構文に対応していない場合、
原文の解釈を間違つたり翻訳不能になつたりする
という問題がある。また、上記文法規則が原文中
の特定の構文に対応しているとしても、係り受け
が非常に複雑な原文の場合に解釈を間違いやすい
という問題がある。さらに、係り受けが複雑な長
文が入力された場合は、文の長さに比例して処理
時間が長くなるという問題もある。 そこで、この発明の目的は、原文中に任意の構
文の箇所に分割翻訳部マークを付与することよつ
て、その箇所の構文のみを区分して翻訳可能にす
ることにより、文法規則が特定の構文に対応して
いない場合や係り受けが複雑な原文が入力されて
も、原文の希釈を正しく、しかも高速に行うこと
を可能にした機械翻訳装置を提供することにあ
る。 <問題点を解決するための手段> 上記目的を達成するため、この発明は、入力さ
れた文章を辞書を用いて形態素に分割して品詞等
の情報を得る形態素解析部と、上記形態素解析部
によつて分解された形態素列の構文を辞書と文法
規則を用いて解析する構文解析部と、上記構文解
析部で得られた構文の構造を目標言語における構
文に構造に交換する変換部と、上記変換部によつ
て得られた目標言語の構文構造に従つて翻訳文を
生成する翻訳文生成部を有する機械翻訳装置にお
いて、入力される文章の任意の構文を区分して翻
訳する分割翻訳部を指定するための分割翻訳部マ
ークを入力するマーク入力手段と、入力された単
語列中に上記分割翻訳部マークがあるか否かを判
別するマーク判別手段と、取り込まれた構文解析
用の上記文法規則が分割翻訳用規則か否かを判別
し、分割翻訳用規則でないときは、上記取り込ま
れた文法規則を使用することを可能にする一方、
分割翻訳用規則であるときは、上記マーク判別手
段が単語列中に分割翻訳部マークがあると判別し
た場合のみ上記分割翻訳用規則を使用することを
可能にする文法規則判別手段を備えたことを特徴
としている。 <作用> 入力される文章の任意の構文に、この構文が区
分して翻訳される分割翻訳部であることを指定す
るために、マーク入力手段から分割翻訳部マーク
が入力される。 分割翻訳部マーク判別手段に上記分割翻訳部マ
ークが付与された文章が入力されると、この入力
された文章の単語列中に分割翻訳部を指定するた
めの分割翻訳部マークがあるか否かが分割翻訳部
マーク判別手段によつて判別され、続いて、形態
素解析部で形態素に分割されて品詞等の情報が得
られ、この情報と文法規則に基づいて、構文解析
部で形態素列の構文解析が行なわれる。そして、
上記構文解析部で得られた構文の構造が変換部に
よつて目標言語の構文の構造に変換され、翻訳文
生成部によつてこの目標言語の構文の構造に従つ
て翻訳文が生成される。 このような翻訳処理において、上記構文解析を
実行する際に、取り込まれた構文解析用の上記文
法規則が分割翻訳用規則が否かが文法規則判別手
段によつて判別される。その結果、分割翻訳用規
則でないときは取り込まれた文法規則が使用可能
となる一方、分割翻訳用規則であるときは、上記
分割翻訳部マーク判別手段が単語列中に分割翻訳
部マークがあると判別した場合のみ上記分割翻訳
用規則が使用可能となる。したがつて、分割翻訳
部マークによつて、入力された単語列中の分割翻
訳部が指定された場合のみ分割翻訳用規則が使用
されて構文解析が行なわれ、上記分割翻訳が他と
区分されて翻訳される。 <実施例> 以下、この発明を図示の実施例により詳細に説
明する。 第1図はこの発明の機械翻訳装置における一実
施例のブロツグ図である。1はメインCPU(中央
処理装置)、2はメインメモリー、3はCRT(カ
ソード・レイ・チユーブ)、4はキーボード、5
は翻訳モジユール、6は翻訳用の辞書、文法規則
および木構造変換規則等を格納しているメモリー
である。 上記翻訳モジユール5は、ソース言語が入力さ
れると、それを翻訳してターゲツト言語を出力す
るものである。すなわち、キーボード4から入力
されたソース言語はメインCPU1の制御により
翻訳モジユール5に送られる。翻訳モジユール5
はメモリー6に記憶されている辞書、文法規則お
よび木構造変換規則等を用いて、後に詳述するよ
うにして入力されたソース言語をターゲツト言語
に翻訳する。その結果は、メインメモリー2に一
旦記憶されると共に、CRT3に表示される。 本実施例の翻訳モジユール5の具体的な構成を
第2図に示す。 以下、第1図、第2図を用いて翻訳モジユール
の動作を説明する。 まず、読み込まれた原文は辞書引き形態素解析
部11により、メモリー6の辞書を用いて、各形
態素列(単語列)に分割されてこの各単語に対す
る品詞等の文法情報および訳語を得、さらに、時
制・人称・数等が解析される。構文解析部12で
はメモリー6の辞書と文法規則にしたがつて、各
単語間の係り受け関係を示す構造解析木が後述す
るようにして第5図に示すように決定される。 変換部13では、メモリー6の木構造変換規則
を用いて、入力された原文に対する構文解析木の
構造が翻訳又に対する構文解析木の構造に変換さ
れる。そして、翻訳文生成部14でターゲツト言
語における翻訳として適切な助詞や助動詞をつけ
て、得らえた翻訳文は翻訳モジユール5から出力
され、メインメモリー2に格納されると共に、
CRT3に表示される。 次に、上記翻訳モジユールの動作において、入
力される文章の任意の構文を他と区分して翻訳す
る分割翻訳処理について詳細に説明する。ここ
で、上記メモリー6には第1表に示す文法規則の
みが格納されているものとする。
<Industrial Application Field> The present invention relates to a machine translation device that can classify and translate arbitrary syntax of an input sentence. <Prior Art> Conventionally, there are the following machine translation devices. This machine translation device inputs the source language input from the keyboard into the translation module under the control of the main CPU, and the input source language is transferred by the translation module to the dictionary, grammar rules, and It uses tree structure conversion rules to translate into the target language. The above grammar rules are used to determine the syntactic structure of an input sentence (hereinafter referred to as the original sentence). <Problems to be Solved by the Invention> However, when translating with the above-mentioned conventional machine translation device, the syntactic structure of the original text is determined according to the grammatical rules stored in memory. If the grammar rules stored in memory do not correspond to a particular construction in the source text,
There is a problem that the original text may be misinterpreted or become untranslatable. Furthermore, even if the above-mentioned grammar rules correspond to specific syntax in the original text, there is a problem that it is easy to misinterpret the original text if the dependency is very complicated. Furthermore, when a long sentence with complex dependencies is input, there is a problem that the processing time increases in proportion to the length of the sentence. Therefore, an object of the present invention is to attach a divided translation mark to a part of an arbitrary syntax in the original text, so that only the syntax in that part can be divided and translated. To provide a machine translation device which can dilute an original text correctly and at high speed even when the original text is not compatible with the original text or has complicated dependencies. <Means for Solving the Problems> In order to achieve the above object, the present invention includes a morphological analysis unit that divides an input sentence into morphemes using a dictionary and obtains information such as parts of speech, and the morphological analysis unit. a syntactic analysis unit that analyzes the syntax of the morpheme sequence decomposed by using a dictionary and grammar rules; a conversion unit that exchanges the syntactic structure obtained by the syntactic analysis unit into a syntax structure in the target language; In a machine translation device having a translated sentence generation section that generates a translated sentence according to the syntactic structure of the target language obtained by the conversion section, a divided translation section that divides and translates arbitrary syntax of an input sentence. a mark input means for inputting a divided translation part mark for specifying the divided translation part mark; a mark discrimination means for determining whether or not the divided translation part mark is present in the input word string; Determine whether the grammar rule is a rule for split translation, and if it is not a rule for split translation, enable the use of the imported grammar rule,
When the rule is for split translation, grammar rule discriminating means is provided that enables the use of the split translation rule only when the mark discriminating means determines that there is a split translation part mark in the word string. It is characterized by <Operation> A divided translation part mark is inputted from the mark input means to an arbitrary syntax of an input sentence to specify that this syntax is a divided translation part that is divided and translated. When a sentence to which the divided translation part mark has been given is input to the divided translation part mark determination means, it determines whether there is a divided translation part mark for specifying the divided translation part in the word string of the inputted sentence. is discriminated by the mark discrimination means of the divided translation unit, and then divided into morphemes by the morphological analysis unit to obtain information such as parts of speech.Based on this information and grammar rules, the syntactic analysis unit determines the syntax of the morpheme string. Analysis is performed. and,
The syntactic structure obtained by the syntactic analysis section is converted into the syntactic structure of the target language by the conversion section, and the translated sentence generation section generates a translated sentence according to the syntactic structure of the target language. . In such a translation process, when executing the syntactic analysis, the grammar rule determining means determines whether the imported grammar rule for syntactic analysis is a split translation rule. As a result, when the rules are not for split translation, the imported grammar rules can be used, but when the rules are for split translation, the split translation part mark discriminating means detects that there is a split translation part mark in the word string. The above divisional translation rule can be used only when it is determined. Therefore, only when a divided translation part in the input word string is specified by the divided translation part mark, the rules for divided translation are used to perform syntax analysis, and the divided translation is distinguished from others. It is translated as follows. <Examples> The present invention will be described in detail below with reference to illustrated examples. FIG. 1 is a blog diagram of an embodiment of the machine translation apparatus of the present invention. 1 is the main CPU (central processing unit), 2 is the main memory, 3 is the CRT (cathode ray tube), 4 is the keyboard, 5
6 is a translation module, and 6 is a memory that stores a translation dictionary, grammar rules, tree structure conversion rules, and the like. When a source language is input, the translation module 5 translates it and outputs a target language. That is, the source language input from the keyboard 4 is sent to the translation module 5 under the control of the main CPU 1. Translation module 5
uses the dictionary, grammar rules, tree structure conversion rules, etc. stored in the memory 6 to translate the input source language into the target language as will be detailed later. The results are temporarily stored in the main memory 2 and displayed on the CRT 3. The specific configuration of the translation module 5 of this embodiment is shown in FIG. The operation of the translation module will be explained below with reference to FIGS. 1 and 2. First, the read original text is divided into each morpheme string (word string) by the dictionary reference morphological analysis unit 11 using the dictionary in the memory 6, and grammatical information such as part of speech and translation for each word are obtained. Tense, person, number, etc. are analyzed. In the syntactic analysis unit 12, a structural analysis tree indicating the dependency relationship between each word is determined as shown in FIG. 5, as will be described later, according to the dictionary in the memory 6 and the grammar rules. The conversion unit 13 uses the tree structure conversion rules in the memory 6 to convert the structure of the parse tree for the input original text into the structure of the parse tree for the translation. Then, the translated sentence generation unit 14 adds particles and auxiliary verbs appropriate for translation in the target language, and the obtained translated sentence is output from the translation module 5 and stored in the main memory 2.
Displayed on CRT3. Next, in the operation of the above-mentioned translation module, a divisional translation process in which an arbitrary syntax of an input sentence is separated from others and translated will be explained in detail. Here, it is assumed that the memory 6 stores only the grammar rules shown in Table 1.

【表】【table】

【表】 上記第1表の文法規則は次のことを表わしてい
る。 すなわち、文法規則(a)は、前置詞句は前置詞と
名詞からできていることを表わす。文法規則(b)
は、名詞句は限定詞と名詞からできていることを
表わす。文法規則(c)は、同詞句はBE動詞と形容
詞からできていることを表わす。文法規則(d)は、
平叙文は名詞句と動詞句からできていることを表
わす。文法規則(e)は、THAT節はTHATと平叙
又からできていることを表わす。文法規則(f)は、
分は平叙分と文末からできていることを表わす。
文法規則(g)は、文は部分木と文末からできている
ことを表わす。文法規則(h)は、部分木は部分木と
二重スラツシユと部分木からできていることを表
わす。文法規則(i)は、部分木は前置詞句からでき
ていることを表わす。文法規則(j)は、部分木は
THAT節からできていることを表わす。文法規
則(k)は、部分木はBE動詞からできていることを
表わす。上記文法規則(a)〜(k)のうち、文法規則(g)
〜(k)が分割翻訳処理に用いられる分割翻訳用規則
である。 第3図は、本実施例による翻訳処理のフローチ
ヤートである。以下、第3図に従つて翻訳処理の
動作を説明する。 ステツプS1で、分割翻訳処理の実行を表示する
分割翻訳フラグがリセツトされる。 ステツプS2で、入力単語列中に、分割翻訳部を
指定する分割翻訳部マークである二重スラツシユ
“”があるか否かが判別される。その結果、
“”があればステツプS3に進み、そうでなけれ
ば上記ステツプS3をスキツプする。 ステツプS3で、分割翻訳処理の実行を表示する
ために、分割翻訳フラグがオンにされる。 ステツプS4で、辞書引き形態素解析部11によ
る辞書引き処理が実行されて、品詞等の文法情報
および訳語が得られ、さらに、時制・人称・数等
の解析が行われる。 ステツプS5で、構文解析部12による構文解析
が行われ、構文解析木の構造が決定される。 ステツプS6で、変換部13によるソース言語の
構文解析木の構造からターゲツト言語の構文解析
木の構造への変換が行われる。 ステツプS7で、翻訳文生成部14による適切な
翻訳文の生成が行われる。 次に、上記ステツプS5の構文の解析処理を第4
図にフローチヤートに従つて、さらに詳細に説明
する。 ステツプS51で、第1表に示した文法規則の中
から次の文法規則を取り込む。 ステツプS52で、取り込んだ文法規則が分割翻
訳用規則か否かが判別される。その結果、分割翻
訳用規則であればステツプS54に進み、そうでな
ければステツプS53に進む。 ステツプS53で、取り込んだ文法規則を使用し
て構文解析が行われてステツプS56に進む。 ステツプS54で、上記分割翻訳フラグがオンで
あるか否かが判別される。その結果、オンであれ
ばステツプS55に進み、そうでなければステツプ
S56に進む。 ステツプS55で、取り込んだ文法規則(すなわ
ち、分割翻訳用規則)を使用して構文解析が行わ
れる。 ステツプS56で、入力単語列中に構文解析未処
理の単語列があるか否かが判別される。その結
果、未処理の単語列があればステツプS51に戻り、
そうでなければ構文の解析処理を終了する。 上述の翻訳処理動作を具体的な入力文によりさ
らに説明する。まず入力文(a)「Among those
advantages is that instrument is efficinet.」
が入力されたものと仮定する。この入力文(a)は倒
置の構文であり、通常の語順は、「That the
instrumet is efficient is among those
advantages.」である。 入力文(a)が入力されると、第3図のフローチヤ
ートにおいて、入力単語列中に“”がないの
で、ステツプS1、S2、S4を介してステツプS5に至
り、第4図のフローチヤートに従つて解析処理が
実行される。しかしながら、第1表に示すように
本実施例の文法規則には倒置の構文を扱える文法
規則が欠如しているため通常の翻訳処理では構文
解析に失敗する。 そこで、次にキーボード4より上記入力文(a)に
二重スラツシユを挿入した入力文(b)「Among
those advantagesisthat the instrument is
efficient.」が入力される。そうすると、第3図
のフローチヤートにおいて、入力単語列中に
“”があるので、ステツプS1、S2を介してステ
ツプS3で分割翻訳フラグをオンにする。そして、
さらにステツプS4を介してステツプS5に至り、第
4図のフローチヤートに従つて構文の解析処理が
次のように実行される。 すなわち、まず第1表の文法規則(g)が取り込ま
れたとする。この文法規則(g)は上述のように分割
翻訳用規則であり、また、第3図のステツプS3
分割翻訳フラグがすでにオンになつている。そこ
で、ステツプS51、S52、S54を介してステツプS55
で文法規則(g)を用いて、第5図の最上段に示すよ
うに入力文(b)が部分木+文末に区分される。次に
第1表の文法規則(h)が取り込まれたとする。この
文法規則(h)は上述のように分割翻訳用規則があ
り、また、上述と同様に分割翻訳フラグがすでに
オンになつている。そこで、ステツプS51、S52
S54を介してステツプS55で文法規則(h)を用いて、
第5図の二段目に示すように上記部分木がさらに
部分木+二重スラツシユ+部分木に区分される。
以下、同様にして入力文(b)の構文解析が実行さ
れ、構文解析が成功すると第5図に示すようにソ
ース言語の構文解析木が決定される。以後、この
構文解析木に基づいて、“”と“”との間の
分割翻訳部は他と区分されて変換処理および生成
処理が実行される。その結果、第6図に示すよう
に原文の“”と“”との間の分割翻訳部が他
と区分されて翻訳されて、出力文「それらの利点
の間にあるその器具が効率が高いこと」が
CRT3に出力される。 このように、係り受けが複雑な長文でも“”
でブロツクに分割して、このブロツクごとに翻訳
することができ、倒置構造等の特殊な構文に対し
ても特別な文法規則を備えておく必要がなく、文
法規則全体の見通しが良くなる。したがつて、原
文の解釈を正しく、高速に行うことが可能とな
る。また、特殊な構文でも解析できることから、
入力単語列の品詞の同定ができ、単語の訳の入れ
換えが容易となる。 <発明の効果> 以上より明らかなように、この発明は、形態素
解析部、構文解析部、変換部および翻訳文生成部
を備えた機械翻訳装置に、分割翻訳部マークを入
力するマーク入力手段と、入力単語列中に上記分
割翻訳部マークがあるか否かを判別するマーク判
別手段と、取り込まれた構文解析用の文法規則が
分割翻訳用規則か否かを判別して、入力単語列中
に分割翻訳マークがある場合のみ上記分割翻訳用
規則を用いて構文解析を行うことを可能にする文
法規則判別手段を設けて、上記分割翻訳部マーク
で指定された分割翻訳部を他と区分して翻訳可能
にしたので、文法規則が測定の構文に対応してい
ない場合や、係り受けが複雑な長文が入力された
場合であつても、原文の解釈を正しく、高速に行
うことが可能になる。
[Table] The grammar rules in Table 1 above represent the following. In other words, grammar rule (a) indicates that a prepositional phrase is made up of a preposition and a noun. Grammar rules (b)
indicates that a noun phrase is made up of a determiner and a noun. Grammar rule (c) states that a synonymous phrase is made up of a BE verb and an adjective. Grammar rule (d) is
A declarative sentence is made up of a noun phrase and a verb phrase. Grammar rule (e) indicates that a THAT clause consists of THAT and a declarative clause. Grammar rule (f) is
The minute indicates that it is made up of a declarative minute and the end of a sentence.
Grammar rule (g) indicates that a sentence is made up of a subtree and the end of the sentence. Grammar rule (h) indicates that a subtree is made up of subtrees, double slashes, and subtrees. Grammar rule (i) indicates that a subtree is made up of prepositional phrases. Grammar rule (j) is that a subtree is
Indicates that it is made up of a THAT clause. Grammar rule (k) indicates that the subtree is made up of BE verbs. Among the grammar rules (a) to (k) above, grammar rule (g)
~(k) is the split translation rule used in the split translation process. FIG. 3 is a flowchart of translation processing according to this embodiment. The operation of the translation process will be explained below with reference to FIG. In step S1 , a split translation flag indicating execution of split translation processing is reset. In step S2 , it is determined whether or not there is a double slash "" in the input word string, which is a divided translation part mark that designates a divided translation part. the result,
If "" is present, proceed to step S3 ; otherwise, skip step S3 . In step S3 , the split translation flag is turned on to indicate the execution of the split translation process. In step S4 , dictionary lookup processing is executed by the dictionary lookup morphological analysis unit 11 to obtain grammatical information such as parts of speech and translated words, and further analysis of tense, person, number, etc. is performed. In step S5 , the syntax analysis unit 12 performs syntax analysis and determines the structure of the syntax analysis tree. In step S6 , the conversion unit 13 converts the structure of the parse tree of the source language into the structure of the parse tree of the target language. In step S7 , the translated text generating section 14 generates an appropriate translated text. Next, the syntax analysis process in step S5 above is performed in the fourth step.
A more detailed explanation will be given according to the flowchart shown in the figure. In step S51 , the next grammar rule is imported from among the grammar rules shown in Table 1. In step S52 , it is determined whether the imported grammar rule is a rule for split translation. As a result, if the rule is for split translation, the process proceeds to step S54 ; otherwise, the process proceeds to step S53 . In step S53 , parsing is performed using the captured grammar rules and the process proceeds to step S56 . In step S54 , it is determined whether the divided translation flag is on. If the result is on, proceed to step S55 , otherwise proceed to step S55.
Proceed to S 56 . In step S55 , parsing is performed using the captured grammar rules (ie, rules for segmented translation). In step S56 , it is determined whether or not there is a word string that has not been parsed in the input word string. As a result, if there is an unprocessed word string, the process returns to step S51 .
Otherwise, the syntax analysis process ends. The above translation processing operation will be further explained using a specific input sentence. First, input sentence (a) “Among those
advantages are that instruments are effective.”
Assume that . This input sentence (a) has an inverted construction, and the normal word order is "That the
instrument is efficient is among those
advantages.” When the input sentence (a) is input, in the flowchart of FIG. 3, since there is no "" in the input word string, the process goes through steps S 1 , S 2 , and S 4 and reaches step S 5 . Analysis processing is executed according to the flowchart shown in the figure. However, as shown in Table 1, the grammar rules of this embodiment lack a grammar rule that can handle inverted syntax, so that syntactic analysis fails in normal translation processing. Then, from the keyboard 4, input sentence (b) with a double slash inserted into the above input sentence (a), ``Among
those advantages are that the instrument is
"efficient." is input. Then, in the flowchart of FIG. 3, since there is "" in the input word string, the divided translation flag is turned on in step S3 via steps S1 and S2 . and,
Further, the process goes to step S5 via step S4 , and the syntax analysis process is executed as follows according to the flowchart of FIG. That is, let us first assume that the grammar rule (g) in Table 1 is imported. This grammar rule (g) is a rule for split translation as described above, and the split translation flag has already been turned on in step S3 of FIG. Therefore, step S 55 is passed through steps S 51 , S 52 , and S 54 .
Using the grammar rule (g), the input sentence (b) is divided into a subtree and the end of the sentence, as shown in the top row of FIG. Next, assume that the grammar rule (h) in Table 1 is imported. As mentioned above, this grammar rule (h) has a rule for split translation, and the split translation flag is already turned on as described above. Therefore, steps S 51 , S 52 ,
Using grammar rule (h) in step S 55 via S 54 ,
As shown in the second row of FIG. 5, the above subtree is further divided into subtree+double slash+subtree.
Thereafter, the input sentence (b) is parsed in the same manner, and if the parsing is successful, a parsing tree of the source language is determined as shown in FIG. Thereafter, based on this parse tree, the split translation part between "" and "" is separated from the others, and conversion processing and generation processing are executed. As a result, as shown in Figure 6, the divided translation part between "" and "" in the original sentence is separated from others and translated, and the output sentence "The device between these advantages is highly efficient. “That” is
Output to CRT3. In this way, even in long sentences with complicated dependencies, “”
It is possible to divide the text into blocks and translate each block separately.There is no need to prepare special grammar rules even for special constructions such as inverted structures, and the overview of the grammar rules as a whole becomes better. Therefore, it becomes possible to interpret the original text correctly and quickly. Also, since it can parse even special syntax,
It is possible to identify the part of speech of an input word string, making it easy to change translations of words. <Effects of the Invention> As is clear from the above, the present invention provides a mark input means for inputting a divided translation unit mark into a machine translation device including a morphological analysis unit, a syntactic analysis unit, a conversion unit, and a translated sentence generation unit. , a mark determining means for determining whether or not the divided translation section mark is present in the input word string; and a mark determining means for determining whether or not the divided translation section mark is present in the input word string; A grammar rule determination means is provided that enables parsing to be performed using the above-mentioned rules for split translation only when there is a split translation mark, and the split translation part specified by the split translation part mark is distinguished from other parts. This makes it possible to interpret the original text correctly and quickly even when the grammar rules do not correspond to the measurement syntax or when a long sentence with complex dependencies is input. Become.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の機械翻訳装置の一実施例の
ブロツク図、第2図は上記実施例における翻訳モ
ジユールの作用構成図、第3図は上記実施例によ
る翻訳処理のフローチヤート、第4図は構文解析
処理のフローチヤート、第5図は決定された構文
解析木の一例を示す図、第6図は第1の機械翻訳
装置への入力文例と、それに対する出力文(翻訳
文)例を示す図である。 1……メインCPU、2……メインメモリー、
3……CRT、4……キーボード、5……翻訳モ
ジユール、6……メモリー、11……辞書引き形
態素解析部、12……構文解析部、13……変換
部、14……翻訳文生成部。
Fig. 1 is a block diagram of an embodiment of the machine translation device of the present invention, Fig. 2 is a functional block diagram of the translation module in the above embodiment, Fig. 3 is a flowchart of translation processing according to the above embodiment, and Fig. 4 is a flowchart of the parsing process, Fig. 5 is a diagram showing an example of a determined parsing tree, and Fig. 6 is an example of an input sentence to the first machine translation device and an example of an output sentence (translated sentence) for it. FIG. 1...Main CPU, 2...Main memory,
3...CRT, 4...Keyboard, 5...Translation module, 6...Memory, 11...Dictionary lookup morphological analysis section, 12...Syntax analysis section, 13...Conversion section, 14...Translation sentence generation section .

Claims (1)

【特許請求の範囲】 1 入力された文章を辞書を用いて形態素に分割
して品詞等の情報を得る形態素解析部と、上記形
態素解析部によつて分割された形態素列の構文を
辞書と文法規則を用いて解析する構文解析部と、
上記構文解析部で得られた構文の構造を目標言語
における構文の構造に交換する交換部と、上記変
換部によつて得られた目標言語の構文構造に従つ
て翻訳文を生成する翻訳文生成部を有する機械翻
訳装置において、 入力される文章の任意の構文を区分して翻訳す
る分割翻訳部を指定するための、分割翻訳部マー
クを入力するマーク入力手段と、 入力された単語列中に上記分割翻訳部マークが
あるか否かを判別するマーク判別手段と、 取り込まれた構文解析用の上記文法規則が分割
翻訳用規則か否かを判別し、分割翻訳用規則でな
いときは、上記取り込まれた文法規則を使用する
ことを可能にする一方、分割翻訳用規則であると
きは、上記マーク判別手段が単語列中に分割翻訳
部マークがあると判別した場合のみ上記分割翻訳
用規則を使用することを可能にする文法規則判別
手段を備えたことを特徴とする機械翻訳装置。
[Scope of Claims] 1. A morphological analysis unit that divides an input sentence into morphemes using a dictionary and obtains information such as parts of speech; a parsing unit that parses using rules;
an exchange unit that exchanges the syntactic structure obtained by the syntactic analysis unit into a syntactic structure in the target language; and a translated sentence generation unit that generates a translated sentence according to the syntactic structure of the target language obtained by the conversion unit. In a machine translation device having a division, a mark input means for inputting a division translation unit mark for specifying a division translation unit that divides and translates arbitrary syntax of an input sentence; mark discriminating means for determining whether or not the above-mentioned divided translation part mark is present; On the other hand, when the rules are for split translation, the split translation rules are used only when the mark discrimination means determines that there is a split translation part mark in the word string. A machine translation device characterized by comprising a grammar rule discriminating means that makes it possible to
JP62272638A 1987-10-26 1987-10-28 Mechanical translating device Granted JPH01113870A (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP62272638A JPH01113870A (en) 1987-10-28 1987-10-28 Mechanical translating device
US07/262,313 US5005127A (en) 1987-10-26 1988-10-25 System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
GB8825002A GB2211639A (en) 1987-10-26 1988-10-26 Machine translation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62272638A JPH01113870A (en) 1987-10-28 1987-10-28 Mechanical translating device

Publications (2)

Publication Number Publication Date
JPH01113870A JPH01113870A (en) 1989-05-02
JPH0566630B2 true JPH0566630B2 (en) 1993-09-22

Family

ID=17516712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62272638A Granted JPH01113870A (en) 1987-10-26 1987-10-28 Mechanical translating device

Country Status (1)

Country Link
JP (1) JPH01113870A (en)

Also Published As

Publication number Publication date
JPH01113870A (en) 1989-05-02

Similar Documents

Publication Publication Date Title
US5005127A (en) System including means to translate only selected portions of an input sentence and means to translate selected portions according to distinct rules
JP2892548B2 (en) Automatic translation device
JPH0335354A (en) Proper noun processing method with abbreviation for mechanical translation device
JP2004355625A (en) Method and system for training machine translator
JP2004070928A (en) Method and system for developing transition dictionary for use in machine translation system of transition base
JPH0261763A (en) Mechanical translation equipment
JPH0344764A (en) Mechanical translation device
JPH03222065A (en) machine translation device
JPH0566630B2 (en)
JP2632806B2 (en) Language analyzer
JPS6337471A (en) Method and device for translation
JP3174664B2 (en) Machine translation equipment
JPH0682380B2 (en) Machine translation device
JP2719453B2 (en) Machine translation equipment
JP3197110B2 (en) Natural language analyzer and machine translator
JPH01166258A (en) Mechanical translation device
JP3353873B2 (en) Machine translation equipment
JPH1166069A (en) Machine translation equipment
JPH04296969A (en) Mechanical translation device
JPH02281373A (en) Hyphen generating method in machine translation equipment
JPH05225232A (en) Automatic text pre-editor
JPH01112367A (en) Machine translator
JPH02281374A (en) Hyphenated word processing method in machine translation equipment
JPH03222066A (en) Machine translation device
JPH01112368A (en) Machine translator

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees