JP7789084B2 - String output device - Google Patents
String output deviceInfo
- Publication number
- JP7789084B2 JP7789084B2 JP2023564743A JP2023564743A JP7789084B2 JP 7789084 B2 JP7789084 B2 JP 7789084B2 JP 2023564743 A JP2023564743 A JP 2023564743A JP 2023564743 A JP2023564743 A JP 2023564743A JP 7789084 B2 JP7789084 B2 JP 7789084B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- character string
- determination
- string
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
本開示の一側面は、順次取得した文字列について文末までの文字列を出力する文字列出力装置に関する。 One aspect of the present disclosure relates to a character string output device that outputs character strings acquired sequentially up to the end of a sentence.
下記特許文献1では、ユーザの発話を順次取得して音声認識し、音声認識結果としてユーザの発話内容を表す文字列を生成する検出装置が開示されている。 Patent document 1 below discloses a detection device that sequentially acquires and recognizes a user's speech, and generates a string of characters representing the content of the user's speech as the speech recognition result.
一般的に、音声認識では無音区間が一定時間継続すると、そこを文区切り位置と判定し、無音区間までの発話に対応する文字列が1つの音声認識結果として出力される。そのため、話し方によっては、本来1文となってほしい文の途中で文が区切られることがある。例えば、上記検出装置によって生成される文字列を順次取得した場合、取得した文字列が文末で終わっていない可能性がある。 In general, when a silent section continues for a certain period of time in speech recognition, it is determined to be a sentence boundary, and the string of characters corresponding to the speech up to the silent section is output as a single speech recognition result. Therefore, depending on the speaking style, a sentence may be broken up in the middle of what should be a complete sentence. For example, if character strings generated by the above detection device are acquired sequentially, there is a possibility that the acquired character string does not end at the end of the sentence.
文の意味としては1文として処理すべきだが、音声認識の仕組みなどによって、文末で終わっていないなどの不適切な文字列は解釈しづらく、例えば翻訳をする場合には翻訳結果が意図しないものとなる。そこで、順次取得した文字列について文末までの文字列を出力することが望まれている。 The meaning of a sentence should be processed as one sentence, but due to the mechanisms of speech recognition, inappropriate characters that do not end at the end of the sentence can be difficult to interpret, and when translating, for example, the translation results may not be what was intended. Therefore, it is desirable to output the characters up to the end of the sentence for each character that is acquired sequentially.
本開示の一側面に係る文字列出力装置は、文字列を順次取得する取得部と、判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う判定部であって、初回の判定において、取得部によって最初に取得された文字列を対象文字列として判定を行い、初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、取得部によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、判定部と、判定部によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列を出力する出力部と、を備える。 A character string output device according to one aspect of the present disclosure includes an acquisition unit that sequentially acquires character strings; a determination unit that repeatedly determines whether a target character string, which is a character string to be determined, contains an ending of a sentence, wherein in the first determination, the determination is made on the character string first acquired by the acquisition unit as the target string; and in subsequent determinations, if it is determined in the previous determination that the target string does not contain an ending of a sentence, the determination unit determines a new target string that contains the target string and a character string subsequently acquired by the acquisition unit; and an output unit that, if the determination unit determines that the target string contains an ending of a sentence, outputs the character string up to the ending of the target string.
このような側面においては、順次取得される文字列が含まれる対象文字列について文末が含まれるか否かの判定が行われ、対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列が出力される。すなわち、順次取得した文字列について文末までの文字列を出力することができる。In this aspect, a determination is made as to whether a target string containing sequentially acquired character strings contains an end of a sentence, and if it is determined that the target string contains an end of a sentence, the target string up to the end of the sentence is output. In other words, it is possible to output sequentially acquired character strings up to the end of the sentence.
本開示の一側面によれば、順次取得した文字列について文末までの文字列を出力することができる。 According to one aspect of the present disclosure, it is possible to output the strings acquired sequentially up to the end of the sentence.
以下、図面を参照しながら本開示での実施形態を詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。また、以下の説明における本開示での実施形態は、本発明の具体例であり、特に本発明を限定する旨の記載がない限り、これらの実施形態に限定されないものとする。 Embodiments of the present disclosure will be described in detail below with reference to the drawings. Note that in the description of the drawings, identical elements will be given the same reference numerals, and duplicate explanations will be omitted. Furthermore, the embodiments of the present disclosure in the following description are specific examples of the present invention, and unless otherwise specified, the present invention is not limited to these embodiments.
実施形態に係る文字列出力装置1は、文字列を出力するコンピュータ装置である。文字列は、1つ以上の文字で構成される。実施形態において、文字列は日本語を想定するが、これに限るものではなく、英語などの日本語以外の言語であってもよい。 The character string output device 1 according to the embodiment is a computer device that outputs a character string. The character string is composed of one or more characters. In the embodiment, the character string is assumed to be in Japanese, but is not limited to this and may be in a language other than Japanese, such as English.
文字列出力装置1は、音声認識を行う音声認識装置又は文字認識を行う文字認識装置から、認識結果である文字列を取得する。音声認識装置又は文字認識装置では、順次入力される音声又は文字に対してリアルタイムに音声認識又は文字認識が行われる。それゆえ、文字列出力装置1は、認識結果である文字列を、音声認識又は文字認識が行われるたびに順次取得する。 The character string output device 1 acquires character strings that are the recognition results from a voice recognition device that performs voice recognition or a character recognition device that performs character recognition. The voice recognition device or character recognition device performs voice recognition or character recognition in real time on sequentially input voice or characters. Therefore, the character string output device 1 acquires character strings that are the recognition results sequentially each time voice recognition or character recognition is performed.
ここで、順次取得した文字列は、上述したように、音声認識又は文字認識の仕組みなどによって、文末で終わっていない可能性がある。文末とは、文の終わりの部分である。文末は、文末を示す記号である文末記号で表される場合もある。文末記号の一例として、日本語の場合、「。」、「!」及び「?」などが挙げられる。文字列出力装置1は、順次取得した文字列が文末で終わっていない場合でも、文末までの文字列を出力する。文字列出力装置1の機能の詳細については以降で説明する。 As mentioned above, the sequentially acquired character strings may not end at the end of a sentence due to the voice recognition or character recognition mechanism. The end of a sentence is the final part of a sentence. The end of a sentence may also be represented by an end-of-sentence symbol, which is a symbol indicating the end of a sentence. Examples of end-of-sentence symbols in Japanese include ".", "!", and "?". The character string output device 1 outputs the character strings up to the end of the sentence, even if the sequentially acquired character strings do not end at the end of a sentence. Details of the functions of the character string output device 1 will be explained below.
図1は、文字列出力装置1の機能構成の一例を示す図である。図1に示す通り、文字列出力装置1は、格納部10、学習部11、取得部12(取得部)、判定部13(判定部)、出力部14(出力部)及び翻訳部15(翻訳部)を含んで構成される。 Figure 1 is a diagram showing an example of the functional configuration of the character string output device 1. As shown in Figure 1, the character string output device 1 is configured to include a storage unit 10, a learning unit 11, an acquisition unit 12 (acquisition unit), a judgment unit 13 (judgment unit), an output unit 14 (output unit), and a translation unit 15 (translation unit).
文字列出力装置1の各機能ブロックは、文字列出力装置1内にて機能することを想定しているが、これに限るものではない。例えば、文字列出力装置1の機能ブロックの一部は、文字列出力装置1とは異なるコンピュータ装置であって、文字列出力装置1とネットワーク接続されたコンピュータ装置内において、文字列出力装置1と情報を適宜送受信しつつ機能してもよい。また、文字列出力装置1の一部の機能ブロックは無くてもよいし、複数の機能ブロックを一つの機能ブロックに統合してもよいし、一つの機能ブロックを複数の機能ブロックに分解してもよい。 It is assumed that each functional block of the character string output device 1 functions within the character string output device 1, but this is not limited to this. For example, some of the functional blocks of the character string output device 1 may function within a computer device different from the character string output device 1, and connected to the character string output device 1 via a network, while appropriately sending and receiving information with the character string output device 1. Furthermore, some functional blocks of the character string output device 1 may be absent, multiple functional blocks may be integrated into a single functional block, or one functional block may be broken down into multiple functional blocks.
以下、図1に示す文字列出力装置1の各機能について説明する。 Below, we will explain each function of the string output device 1 shown in Figure 1.
格納部10は、文字列出力装置1における算出などで利用される任意の情報及び文字列出力装置1における算出の結果などを格納する。格納部10によって格納された情報は、文字列出力装置1の各機能によって適宜参照されてもよい。 The storage unit 10 stores any information used in calculations, etc. in the character string output device 1, as well as the results of calculations in the character string output device 1. The information stored by the storage unit 10 may be referenced as appropriate by each function of the character string output device 1.
格納部10は、文を区切る記号である文区切り記号(又は文末記号)のない文字列を入力すると文区切り記号(又は文末記号)が挿入された文字列を出力する文末記号挿入モデルを格納してもよい。文区切り記号の一例として、「、」、「。」、「!」及び「?」などが挙げられる。例えば、文末記号挿入モデルは、文区切り記号のない文字列「さて会議を始めます」を入力すると文区切り記号が挿入された文字列「さて、会議を始めます。」を出力する。文末記号挿入モデルは、既存技術によって生成されてもよい。 The storage unit 10 may store a sentence-ending symbol insertion model that, when a string without a sentence delimiter (or sentence-ending symbol), which is a symbol that separates sentences, is input, outputs a string with a sentence delimiter (or sentence-ending symbol) inserted. Examples of sentence delimiters include ",", ".", "!", and "?". For example, when the sentence-ending symbol insertion model receives the string without a sentence delimiter, "Let's start the meeting," it outputs the string with the sentence delimiter inserted, "Let's start the meeting." The sentence-ending symbol insertion model may be generated using existing technology.
文末記号挿入モデルは、文区切り記号(又は文末記号)のない文字列と文区切り記号(又は文末記号)のある文字列との組である学習データに基づいて(機械)学習された学習済みモデルであってもよい。 The sentence-ending symbol insertion model may be a trained model (machine-trained) based on training data that is a pair of strings without sentence delimiters (or sentence-ending symbols) and strings with sentence delimiters (or sentence-ending symbols).
図2は、学習データの一例を示す図である。図2に示す学習データでは、文区切り記号のない文字列と文区切り記号のある文字列とが組として対応付いている。なお、図2に示す学習データでは、1つの文(文章)の全部又は一部の例を挙げているが、これに限るものではなく、例えば2つ以上の文の全部又は一部であってもよい。学習データにおいて、文区切り記号のない文字列を入力データとして捉え、文区切り記号のある文字列を教師データとして捉えることができる。 Figure 2 is a diagram showing an example of training data. In the training data shown in Figure 2, strings without sentence delimiters and strings with sentence delimiters are paired together. Note that the training data shown in Figure 2 shows an example of all or part of one sentence (text), but this is not limited to this and may also be all or part of two or more sentences, for example. In the training data, strings without sentence delimiters can be regarded as input data, and strings with sentence delimiters can be regarded as training data.
学習データは、文区切り記号(又は文末記号)のある文字列の中から取り出した一部の文字列である取出文字列から文区切り記号(又は文末記号)を除去した文字列と当該取出文字列との組であってもよい。取出文字列は、例えば、文区切り記号(又は文末記号)のある文字列を単語単位で区切り、ランダムな位置で分割することで得られる一部の文字列であってもよい。 The training data may be pairs of extracted strings, which are portions of strings extracted from strings containing sentence delimiters (or sentence-ending symbols), with the extracted strings themselves, after removing the sentence delimiters (or sentence-ending symbols). The extracted strings may be, for example, portions of strings obtained by dividing a string containing sentence delimiters (or sentence-ending symbols) into words and splitting them at random positions.
図3は、学習データの生成方法の一例を示す図である。図3に示すように、文区切り記号のある文字列である元データ「さて、会議を始めます。」から、4つの取出文字列「さて、会議を始めます。」、「さて、」、「会議を」及び「始めます。」が取り出されている。そして、4つの取出文字列それぞれに対して、文区切り記号を除去した文字列「さて会議を始めます」、「さて」、「会議を」及び「始めます」が生成されている。図3において、「さて会議を始めます」と「さて、会議を始めます。」との組、「さて」と「さて、」との組、「会議を」と「会議を」との組、及び、「始めます」と「始めます。」との組が学習データである。 Figure 3 is a diagram showing an example of a method for generating training data. As shown in Figure 3, four extracted strings, "Now, the meeting will begin.", "Now," "The meeting" and "Begin.", are extracted from the original data, which is a string with sentence delimiters, "Now, the meeting will begin." Then, for each of the four extracted strings, strings with the sentence delimiters removed are generated: "Now, the meeting will begin," "Now," "The meeting" and "Begin." In Figure 3, the pair of "Now, the meeting will begin" and "Now, the meeting will begin.", the pair of "Now" and "Now," the pair of "Meeting" and "Meeting," and the pair of "Begin" and "Begin." are training data.
学習データに含まれる文区切り記号(又は文末記号)のある文字列は、当該文字列を構成する単語ごとに、次に文区切り記号(又は文末記号)が来るか否かを示す系列ラベリングにおけるラベルが付与されていてもよい。その場合、学習データに含まれる文区切り記号(又は文末記号)のない文字列は、単語単位で分割されていてもよい。系列ラベリングにおけるラベルが付与された学習データを用いることで、どの単語の後にどの文区切り記号が入るかを予測する系列ラベリングタスクとして機械学習を行うことができる。 Strings containing sentence separators (or sentence-ending symbols) included in the training data may be given a sequence labeling label indicating whether a sentence separator (or sentence-ending symbol) follows each word in the string. In this case, strings without sentence separators (or sentence-ending symbols) included in the training data may be split into words. By using training data that has been given sequence labeling labels, machine learning can be performed as a sequence labeling task to predict which sentence separator will follow which word.
図4は、系列ラベリングにおけるラベルが付与されている学習データの一例を示す図である。図4において、例えば、文区切り記号のある文字列「さて、会議を始めます。」について、単語「さて」には次に読点が来ることを示すラベル「<COMMA>」が付与され、単語「会議」及び「を」にはそれぞれ次に文区切り記号が来ないことを示すラベル「<O>」が付与され、単語「始めます」には次に句点が来ることを示すラベル「<PERIOD>」が付与されている。 Figure 4 shows an example of training data to which labels are assigned in sequence labeling. In Figure 4, for example, for the string "Sate, Kaigi o Hajimaru" (let's start the meeting), which contains a sentence delimiter, the word "sate" is assigned the label "<COMMA>" indicating that a comma follows, the words "kaigi" and "wo" are each assigned the label "<O>" indicating that a sentence delimiter does not follow, and the word "hajimaru" is assigned the label "<PERIOD>" indicating that a period follows.
学習部11は、文末記号挿入モデルを生成する。より具体的には、学習部11は、文区切り記号(又は文末記号)のない文字列と文区切り記号(又は文末記号)のある文字列との組である学習データに基づいて(機械)学習を行い、学習済みモデルとして文末記号挿入モデルを生成する。その他に、学習部11は、上記で説明した各種の学習データに基づいて(機械)学習を行って文末記号挿入モデルを生成してもよい。また、学習部11は、上記で説明した学習データの生成方法などに基づいて学習データ自体を生成してもよい。 The learning unit 11 generates a sentence-end symbol insertion model. More specifically, the learning unit 11 performs (machine) learning based on training data that is a pair of strings without sentence delimiters (or sentence-end symbols) and strings with sentence delimiters (or sentence-end symbols), and generates a sentence-end symbol insertion model as a trained model. Alternatively, the learning unit 11 may perform (machine) learning based on the various types of training data described above to generate a sentence-end symbol insertion model. The learning unit 11 may also generate the training data itself based on the training data generation method described above.
学習部11は、生成した文末記号挿入モデルを格納部10によって格納させる。なお、格納部10によって格納された文末記号挿入モデルは、学習部11によって生成されたものではなく、他の装置で同様に生成されたものをネットワークを介して取得したものであってもよい。The learning unit 11 stores the generated sentence-final symbol insertion model in the storage unit 10. Note that the sentence-final symbol insertion model stored by the storage unit 10 may not be generated by the learning unit 11, but may be a model similarly generated by another device and acquired via a network.
取得部12は、文字列を順次取得する。取得部12は、文字列出力装置1とネットワークなどで接続された他の装置から、ネットワークを介して文字列を順次取得してもよい。取得部12は、文字列出力装置1のユーザがキーボードなどの入力装置1005(後述)を利用して順次入力した文字列を順次取得してもよい。取得部12は、文末で終わっていない(可能性のある)文字列、又は、文の区切りが誤っている文区切り誤りの(可能性のある)文字列を順次取得してもよい。The acquisition unit 12 sequentially acquires character strings. The acquisition unit 12 may sequentially acquire character strings via a network from another device connected to the character string output device 1 via a network or the like. The acquisition unit 12 may sequentially acquire character strings input sequentially by a user of the character string output device 1 using an input device 1005 (described below) such as a keyboard. The acquisition unit 12 may sequentially acquire character strings that (may) not end at the end of a sentence, or character strings that (may) have incorrect sentence divisions.
取得部12は、音声認識又は文字認識の認識結果である文字列を順次取得してもよい。例えば上述した通り、取得部12は、音声認識装置又は文字認識装置にてリアルタイムに行われている音声認識又は文字認識の認識結果である文字列を順次取得してもよい。 The acquisition unit 12 may sequentially acquire character strings that are the recognition results of speech recognition or character recognition. For example, as described above, the acquisition unit 12 may sequentially acquire character strings that are the recognition results of speech recognition or character recognition performed in real time by a speech recognition device or a character recognition device.
取得部12は、順次取得した文字列を、格納部10によって格納させてもよいし、判定部13に出力してもよい。 The acquisition unit 12 may store the sequentially acquired strings in the storage unit 10 or output them to the determination unit 13.
判定部13は、判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う。判定部13は、初回の判定において、取得部12によって最初に取得(出力)された文字列を対象文字列として判定を行ってもよい。判定部13は、初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、取得部12によって続いて取得(出力)された文字列とを含む新たな対象文字列(当該対象文字列と、取得部12によって続いて取得(出力)された文字列とが(その順で)結合した文字列)について判定を行ってもよい。判定部13は、初回以降の判定において、前回の判定において対象文字列に文末が含まれると判定された場合は、当該対象文字列のうち文末より後の文字列と、取得部12によって続いて取得(出力)された文字列とを含む新たな対象文字列(当該対象文字列のうち文末より後の文字列と、取得部12によって続いて取得(出力)された文字列とが(その順で)結合した文字列)について判定を行ってもよい。The determination unit 13 repeatedly determines whether a target string, which is a string to be determined, contains an end of a sentence. In the initial determination, the determination unit 13 may use the string first acquired (output) by the acquisition unit 12 as the target string. In subsequent determinations, if the previous determination determined that the target string does not contain an end of a sentence, the determination unit 13 may determine a new target string that includes the target string and a string subsequently acquired (output) by the acquisition unit 12 (a string formed by combining the target string and a string subsequently acquired (output) by the acquisition unit 12 (in that order)). In subsequent determinations, if the previous determination determined that the target string contains an end of a sentence, the determination unit 13 may determine a new target string that includes a string from the target string after the end of the sentence and a string subsequently acquired (output) by the acquisition unit 12 (a string formed by combining a string from the target string after the end of the sentence and a string subsequently acquired (output) by the acquisition unit 12 (in that order).
判定部13は、対象文字列の末尾が文末であれば文末が含まれると判定し、対象文字列の末尾が文末でなければ文末が含まれないと判定してもよい。 The determination unit 13 may determine that the target string contains a sentence ending if the end of the target string is a sentence ending, and may determine that the target string does not contain a sentence ending if the end of the target string is not a sentence ending.
判定部13は、文末記号挿入モデルに、文末記号を除去した対象文字列を入力して得られる文字列に文末記号があるか否かに基づいて、文末が含まれるか否かを判定してもよい。判定部13は、判定を行った際に対象文字列を、文末記号挿入モデルに文末記号を除去した対象文字列を入力して得られる文字列に置き換えてもよい。 The determination unit 13 may determine whether a sentence ending is included based on whether a sentence ending symbol is present in a string obtained by inputting the target string from which the sentence ending symbols have been removed into the sentence ending symbol insertion model. When making the determination, the determination unit 13 may replace the target string with a string obtained by inputting the target string from which the sentence ending symbols have been removed into the sentence ending symbol insertion model.
判定部13の処理の具体例については後述する。 Specific examples of the processing by the judgment unit 13 will be described later.
判定部13は、判定結果を格納部10によって格納させてもよいし、出力部14に出力してもよい。 The judgment unit 13 may store the judgment result in the storage unit 10 or output it to the output unit 14.
出力部14は、判定部13によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち(文頭から)文末までの文字列を出力する。出力部14は、ディスプレイなどの出力装置1006(後述)に出力(表示)してもよいし、翻訳部15に出力してもよいし、ネットワークを介して他の装置に出力(送信)してもよい。 When the determination unit 13 determines that the target character string contains the end of a sentence, the output unit 14 outputs the character string of the target character string (from the beginning of the sentence to the end of the sentence). The output unit 14 may output (display) the character string to an output device 1006 (described below) such as a display, may output to the translation unit 15, or may output (transmit) the character string to another device via a network.
翻訳部15は、出力部14によって出力された文字列を機械翻訳した結果を出力する。機械翻訳は、既存技術を用いる。翻訳部15は、ディスプレイなどの出力装置1006(後述)に出力(表示)してもよいし、ネットワークを介して他の装置に出力(送信)してもよい。 The translation unit 15 outputs the results of machine translation of the character string output by the output unit 14. The machine translation uses existing technology. The translation unit 15 may output (display) the result on an output device 1006 (described below) such as a display, or may output (transmit) the result to another device via a network.
続いて、図5~図8を参照しながら、文字列出力装置1が実行する各種の文字列出力処理の例を説明する。 Next, with reference to Figures 5 to 8, examples of various string output processes performed by the string output device 1 will be explained.
図5は、文字列出力装置1が実行する文字列出力処理の一例(その1)を示すフローチャートである。まず、ユーザが「したがって、こうなります。よって、雨が降ります。」と発話する。次に、音声認識装置が音声認識を順次行った結果、音声認識結果A「したがって。」をまず出力する。次に、取得部12が、音声認識結果A「したがって。」をまず取得する。音声認識結果A「したがって。」は、取得部12によって最初に取得された文字列である。次に、判定部13が、取得された音声認識結果A「したがって。」について文区切り記号を除去し、文区切り記号除去文字列「したがって」を生成する(ステップS1a)。次に、判定部13が、文末記号挿入モデルに、生成された文区切り記号除去文字列「したがって」を入力することで、文区切り記号が挿入された文区切り記号挿入文字列「したがって、」を生成する(ステップS2a)。 Figure 5 is a flowchart showing an example (part 1) of the character string output process executed by the character string output device 1. First, the user utters "Therefore, this happens. Therefore, it will rain." Next, the speech recognition device sequentially performs speech recognition and outputs speech recognition result A "Therefore." Next, the acquisition unit 12 first acquires speech recognition result A "Therefore." Speech recognition result A "Therefore." is the character string first acquired by the acquisition unit 12. Next, the determination unit 13 removes the sentence delimiter from the acquired speech recognition result A "Therefore," to generate a sentence delimiter-removed character string "Therefore" (step S1a). Next, the determination unit 13 inputs the generated sentence delimiter-removed character string "Therefore" into the sentence-end symbol insertion model, thereby generating a sentence delimiter-inserted character string "Therefore," in which a sentence delimiter is inserted (step S2a).
次に、判定部13が、生成された文区切り記号挿入文字列「したがって、」に文末が含まれるか否かの判定(初回の判定)を行い、文末が含まれないと判定する(ステップS3a)。次に、判定部13が、文末が含まれないと判定されたことに伴い、次の音声認識結果を待つ(ステップS3a)。次に、取得部12が、音声認識結果B「こうなりますよって、雨が。」を(音声認識結果A「したがって。」に)続いて取得する。次に、判定部13が、(判定部13が初回の判定を行った際に置き換えた、文末記号挿入モデルに文末記号を除去した文区切り記号除去文字列「したがって」を入力して得られる文字列である)文区切り記号挿入文字列「したがって、」と、取得部12によって続いて取得された音声認識結果B「こうなりますよって、雨が。」とをその順で結合した結合文字列「したがって、こうなりますよって、雨が。」を生成する(ステップS3a)。Next, the determination unit 13 determines whether the generated sentence delimiter insertion string "Therefore," contains a sentence ending (initial determination), and determines that it does not (step S3a). Next, upon determining that it does not contain a sentence ending, the determination unit 13 waits for the next speech recognition result (step S3a). Next, the acquisition unit 12 acquires speech recognition result B "This is what will happen, rain." (following speech recognition result A "Therefore."). Next, the determination unit 13 generates a combined string "Therefore, it will happen, rain." by combining, in that order, the sentence delimiter insertion string "Therefore," (which is a string obtained by inputting the sentence delimiter removal string "Therefore," with the sentence-ending symbol removed, into the sentence-ending symbol insertion model that was replaced by the determination unit 13 when making the initial determination) and speech recognition result B "This is what will happen, rain." subsequently acquired by the acquisition unit 12 (step S3a).
次に、判定部13が、生成された結合文字列「したがって、こうなりますよって、雨が。」について文区切り記号を除去し、文区切り記号除去文字列「したがってこうなりますよって雨が」を生成する(ステップS4a)。次に、判定部13が、文末記号挿入モデルに、生成された文区切り記号除去文字列「したがってこうなりますよって雨が」を入力することで、文区切り記号が挿入された文区切り記号挿入文字列「したがって、こうなります。よって、雨が」を生成する(ステップS5a)。Next, the determination unit 13 removes the sentence delimiter from the generated combined string "Therefore, this is what happens, so it rains" to generate a sentence delimiter-removed string "Therefore, this is what happens, so it rains" (step S4a). Next, the determination unit 13 inputs the generated sentence delimiter-removed string "Therefore, this is what happens, so it rains" into the sentence-end symbol insertion model to generate a sentence delimiter-inserted string "Therefore, this is what happens, so it rains" in which the sentence delimiter has been inserted (step S5a).
次に、判定部13が、生成された文区切り記号挿入文字列「したがって、こうなります。よって、雨が」に文末が含まれるか否かの判定(2回目の判定)を行い、文末が含まれると判定する。次に、出力部14が、判定部13によって文末が含まれると判定されたことに伴い、(判定部13が2回目の判定を行った際に置き換えた、文末記号挿入モデルに文末記号を除去した文区切り記号除去文字列「したがってこうなりますよって雨が」を入力して得られる文字列である)文区切り記号挿入文字列「したがって、こうなります。よって、雨が」のうち(文頭から)文末までの文字列「したがって、こうなります。」を、音声認識修正結果として出力する(ステップS6a)。一方、判定部13が2回目の判定で文末が含まれると判定した際に、判定部13が、文区切り記号挿入文字列「したがって、こうなります。よって、雨が」のうち文末より後の文字列「よって、雨が」と、取得部12によって(音声認識結果B「こうなりますよって、雨が。」に)続いて取得(出力)された文字列とをその順で結合した文字列について引き続き(繰り返し)判定を行う(ステップS7a)。Next, the determination unit 13 determines (second determination) whether the generated sentence delimiter insertion string "Therefore, this is what happens. Therefore, it rains" contains a sentence end, and determines that it does. Next, in response to the determination by the determination unit 13 that a sentence end is included, the output unit 14 outputs the string "Therefore, this is what happens" (from the beginning of the sentence to the end of the sentence) from the sentence delimiter insertion string "Therefore, this is what happens. Therefore, it rains" (the string obtained by inputting the sentence delimiter removal string "Therefore, this is what happens. Therefore, it rains" from which the sentence end symbols have been removed into the sentence end symbol insertion model replaced by the determination unit 13 when making the second determination) as the speech recognition correction result (step S6a). On the other hand, when the determination unit 13 determines in the second determination that the end of the sentence is included, the determination unit 13 continues (repeatedly) making a determination on the string obtained by combining, in the order, the string "Therefore, it will be like this. Therefore, it will rain" that comes after the end of the sentence in the sentence delimiter insertion string "Therefore, it will be like this. Therefore, it will rain," and the string obtained (output) by the obtaining unit 12 (after the speech recognition result B "It will be like this, so it will rain.") (step S7a).
図6は、文字列出力装置1が実行する文字列出力処理の一例(その2)を示すフローチャートである。まず、ユーザが「したがって、こうなります。よって、雨が降ります。」と発話する。次に、音声認識装置が音声認識を順次行った結果、音声認識結果C「したがって。」をまず出力する。次に、取得部12が、音声認識結果C「したがって。」をまず取得する。音声認識結果C「したがって。」は、取得部12によって最初に取得された文字列である。次に、判定部13が、取得された音声認識結果C「したがって。」について文区切り記号を除去し、文区切り記号除去文字列「したがって」を生成する(ステップS1b)。次に、判定部13が、文末記号挿入モデルに、生成された文区切り記号除去文字列「したがって」を入力することで、文区切り記号が挿入された文区切り記号挿入文字列「したがって、」を生成する(ステップS2b)。 Figure 6 is a flowchart showing an example (part 2) of the character string output process executed by the character string output device 1. First, the user utters "Therefore, this happens. Therefore, it will rain." Next, the speech recognition device sequentially performs speech recognition and outputs the speech recognition result C "Therefore." Next, the acquisition unit 12 first acquires the speech recognition result C "Therefore." The speech recognition result C "Therefore." is the character string first acquired by the acquisition unit 12. Next, the determination unit 13 removes the sentence delimiter from the acquired speech recognition result C "Therefore," to generate the sentence delimiter-removed character string "Therefore" (step S1b). Next, the determination unit 13 inputs the generated sentence delimiter-removed character string "Therefore" into the sentence-end symbol insertion model, thereby generating the sentence delimiter-inserted character string "Therefore," in which the sentence delimiter is inserted (step S2b).
次に、判定部13が、生成された文区切り記号挿入文字列「したがって、」の末尾が文末であるか否かの判定(初回の判定)を行い、末尾が文末ではない、すなわち文末が含まれないと判定する(ステップS3b)。次に、判定部13が、文末が含まれないと判定されたことに伴い、次の音声認識結果を待つ(ステップS3b)。次に、取得部12が、音声認識結果D「こうなりますよって、雨が降ります。」を(音声認識結果C「したがって。」に)続いて取得する。次に、判定部13が、(判定部13が初回の判定を行った際に置き換えた、文末記号挿入モデルに文末記号を除去した文区切り記号除去文字列「したがって」を入力して得られる文字列である)文区切り記号挿入文字列「したがって、」と、取得部12によって続いて取得された音声認識結果D「こうなりますよって、雨が降ります。」とをその順で結合した結合文字列「したがって、こうなりますよって、雨が降ります。」を生成する(ステップS3b)。Next, the determination unit 13 determines whether the generated sentence delimiter insertion string "Therefore," ends with a sentence end (initial determination), and determines that the end does not, i.e., does not contain a sentence end (step S3b). Next, upon determining that the generated sentence delimiter insertion string does not contain a sentence end, the determination unit 13 waits for the next speech recognition result (step S3b). Next, the acquisition unit 12 acquires the speech recognition result D "This is how it will turn out, so it will rain." (following the speech recognition result C "Therefore."). Next, the determination unit 13 generates a combined string "Therefore, this is how it will turn out, so it will rain." by combining, in that order, the sentence delimiter insertion string "Therefore," (which is the string obtained by inputting the sentence delimiter removal string "Therefore," with the sentence-end symbol removed, into the sentence-end symbol insertion model that the determination unit 13 replaced when making the initial determination), and the speech recognition result D "This is how it will turn out, so it will rain." subsequently acquired by the acquisition unit 12 (step S3b).
次に、判定部13が、生成された結合文字列「したがって、こうなりますよって、雨が降ります。」について文区切り記号を除去し、文区切り記号除去文字列「したがってこうなりますよって雨が降ります」を生成する(ステップS4b)。次に、判定部13が、文末記号挿入モデルに、生成された文区切り記号除去文字列「したがってこうなりますよって雨が降ります」を入力することで、文区切り記号が挿入された文区切り記号挿入文字列「したがって、こうなります。よって、雨が降ります。」を生成する(ステップS5b)。Next, the determination unit 13 removes the sentence delimiter from the generated combined string "Therefore, this is how it will turn out, and therefore it will rain" to generate a sentence delimiter-removed string "Therefore, this is how it will turn out, and therefore it will rain" (step S4b). Next, the determination unit 13 inputs the generated sentence delimiter-removed string "Therefore, this is how it will turn out, and therefore it will rain" into the sentence-end symbol insertion model to generate a sentence delimiter-inserted string "Therefore, this is how it will turn out, and therefore it will rain" in which the sentence delimiter has been inserted (step S5b).
次に、判定部13が、生成された文区切り記号挿入文字列「したがって、こうなります。よって、雨が降ります。」の末尾が文末であるか否かの判定(2回目の判定)を行い、末尾が文末である、すなわち文末が含まれると判定する。次に、出力部14が、判定部13によって文末が含まれると判定されたことに伴い、(判定部13が2回目の判定を行った際に置き換えた、文末記号挿入モデルに文末記号を除去した文区切り記号除去文字列「したがってこうなりますよって雨が降ります」を入力して得られる文字列である)文区切り記号挿入文字列「したがって、こうなります。よって、雨が降ります。」のうち(文頭から最後の)文末までの文字列「したがって、こうなります。よって、雨が降ります。」を、音声認識修正結果として出力する(ステップS6b)。なお、判定部13が2回目以降の判定で末尾が文末ではない、すなわち文末が含まれないと判定した場合は、判定部13が、文区切り記号挿入文字列と、取得部12によって(音声認識結果D「こうなりますよって、雨が降ります。」に)続いて取得(出力)された文字列とをその順で結合した文字列について引き続き(繰り返し)判定を行う(ステップS7b)。Next, the determination unit 13 determines (a second determination) whether the generated sentence delimiter insertion string "Therefore, this happens. Therefore, it will rain." ends with the end of the sentence, and determines that the end of the sentence is the end of the sentence, i.e., that the end of the sentence is included. Next, in response to the determination by the determination unit 13 that the end of the sentence is included, the output unit 14 outputs the string "Therefore, this happens. Therefore, it will rain." (obtained by inputting the sentence delimiter removal string "Therefore, this happens. Therefore, it will rain" from the beginning to the end of the sentence, from the beginning of the sentence to the end, into the sentence-end symbol insertion model replaced by the determination unit 13 when making the second determination) as the speech recognition correction result (step S6b). If the judgment unit 13 judges in the second or subsequent judgment that the end is not the end of a sentence, i.e., that the end of a sentence is not included, the judgment unit 13 continues (repeatedly) judging the string obtained by combining, in that order, the sentence delimiter insertion string and the string subsequently acquired (output) by the acquisition unit 12 (for the speech recognition result D "This is what will happen, it will rain.") (step S7b).
図7は、文字列出力装置1が実行する文字列出力処理の一例(その3)を示すフローチャートである。まず、ユーザが「したがって、こうなります。よって、雨が降ります。」と発話する。次に、音声認識装置が音声認識を順次行った結果、音声認識結果E「したがって。」をまず出力する。次に、取得部12が、音声認識結果E「したがって。」をまず取得する。音声認識結果E「したがって。」は、取得部12によって最初に取得された文字列である。次に、判定部13が、取得された音声認識結果E「したがって。」について句読点を除去し、句読点除去文字列「したがって」を生成する(ステップS1c)。次に、判定部13が、句読点挿入モデル(機能的に文末記号挿入モデルと同様)に、生成された句読点除去文字列「したがって」を入力することで、句読点が挿入された句読点挿入文字列「したがって、」を生成する(ステップS2c)。 Figure 7 is a flowchart showing an example (part 3) of the character string output process executed by the character string output device 1. First, the user utters "Therefore, this happens. Therefore, it will rain." Next, the speech recognition device sequentially performs speech recognition and outputs the speech recognition result E "Therefore." Next, the acquisition unit 12 first acquires the speech recognition result E "Therefore." The speech recognition result E "Therefore." is the character string first acquired by the acquisition unit 12. Next, the determination unit 13 removes punctuation from the acquired speech recognition result E "Therefore," to generate the punctuation-removed character string "Therefore" (step S1c). Next, the determination unit 13 inputs the generated punctuation-removed character string "Therefore" into a punctuation insertion model (functionally similar to a sentence-end symbol insertion model) to generate the punctuation-inserted character string "Therefore," in which the punctuation is inserted (step S2c).
次に、判定部13が、生成された句読点挿入文字列「したがって、」の末尾が句点であるか否かの判定(初回の判定)を行い、末尾が句点ではない、すなわち文末が含まれないと判定する(ステップS3c)。次に、判定部13が、文末が含まれないと判定されたことに伴い、次の音声認識結果を待つ(ステップS3c)。次に、取得部12が、音声認識結果F「こうなりますよって、雨が降ります。」を(音声認識結果E「したがって。」に)続いて取得する。次に、判定部13が、(判定部13が初回の判定を行った際に置き換えた、句読点挿入モデルに句読点を除去した句読点除去文字列「したがって」を入力して得られる文字列である)句読点挿入文字列「したがって、」と、取得部12によって続いて取得された音声認識結果F「こうなりますよって、雨が降ります。」とをその順で結合した結合文字列「したがって、こうなりますよって、雨が降ります。」を生成する(ステップS3c)。Next, the determination unit 13 determines whether the generated punctuation-inserted string "Therefore," ends with a period (initial determination), and determines that the end is not a period, i.e., that the string does not contain a sentence end (step S3c). Next, upon determining that the string does not contain a sentence end, the determination unit 13 waits for the next speech recognition result (step S3c). Next, the acquisition unit 12 acquires the speech recognition result F "This is how it will be, so it will rain." (following the speech recognition result E "Therefore."). Next, the determination unit 13 generates a combined string "Therefore, it will be, so it will rain." by combining, in that order, the punctuation-inserted string "Therefore," (which is the string obtained by inputting the punctuation-removed string "Therefore," into the punctuation insertion model that the determination unit 13 replaced when making the initial determination), and the speech recognition result F "This is how it will be, so it will rain." subsequently acquired by the acquisition unit 12 (step S3c).
次に、判定部13が、生成された結合文字列「したがって、こうなりますよって、雨が降ります。」について句読点を除去し、句読点除去文字列「したがってこうなりますよって雨が降ります」を生成する(ステップS4c)。次に、判定部13が、句読点挿入モデルに、生成された句読点除去文字列「したがってこうなりますよって雨が降ります」を入力することで、句読点が挿入された句読点挿入文字列「したがって、こうなります。よって、雨が降ります。」を生成する(ステップS5c)。Next, the determination unit 13 removes punctuation from the generated combined string "Therefore, this is how it will turn out, so it will rain" to generate a punctuation-removed string "Therefore, this is how it will turn out, so it will rain" (step S4c). Next, the determination unit 13 inputs the generated punctuation-removed string "Therefore, this is how it will turn out, so it will rain" into the punctuation insertion model to generate a punctuation-inserted string "Therefore, this is how it will turn out, so it will rain" (step S5c).
次に、判定部13が、生成された句読点挿入文字列「したがって、こうなります。よって、雨が降ります。」の末尾が句点であるか否かの判定(2回目の判定)を行い、末尾が句点である、すなわち文末が含まれると判定する。次に、出力部14が、判定部13によって文末が含まれると判定されたことに伴い、(判定部13が2回目の判定を行った際に置き換えた、句読点挿入モデルに句読点を除去した句読点除去文字列「したがってこうなりますよって雨が降ります」を入力して得られる文字列である)句読点挿入文字列「したがって、こうなります。よって、雨が降ります。」のうち(文頭から最後の)句点までの文字列「したがって、こうなります。よって、雨が降ります。」を、音声認識修正結果として出力する(ステップS6c)。次に、翻訳部15が、出力部14によって出力された音声認識修正結果を機械翻訳した結果である音声翻訳結果「Therefore, this happens. Therefore, it will rain.」を出力する。Next, the determination unit 13 determines (a second determination) whether the generated punctuation-inserted string "Therefore, this happens. Therefore, it will rain." ends with a period, determining that the string is a period, i.e., that the string contains a sentence end. Next, in response to the determination unit 13's determination that the string contains a sentence end, the output unit 14 outputs the string (from the beginning of the sentence to the last period) of the punctuation-inserted string "Therefore, this happens. Therefore, it will rain." (the string obtained by inputting the punctuation-removed string "Therefore, this happens. Therefore, it will rain" into the punctuation insertion model replaced by the determination unit 13 when making the second determination) as the speech recognition correction result (step S6c). Next, the translation unit 15 outputs the speech translation result "Therefore, this happens. Therefore, it will rain.", which is the result of machine-translating the speech recognition correction result output by the output unit 14.
図8は、図7の音声認識結果に対する従来技術による音声翻訳結果の一例を示す図である。図8に示す通り、音声認識結果E「したがって。」及び音声認識結果F「こうなりますよって、雨が降ります。」を、従来技術によりそのまま音声翻訳した場合、音声翻訳結果「Therefore. This is what will happen, and it will rain.」が出力される。 Figure 8 is a diagram showing an example of a speech translation result using conventional technology for the speech recognition result of Figure 7. As shown in Figure 8, when speech recognition result E "Therefore." and speech recognition result F "This is what will happen, and it will rain." are directly speech translated using conventional technology, the speech translation result output is "Therefore. This is what will happen, and it will rain."
続いて、実施形態に係る文字列出力装置1の作用効果について説明する。 Next, we will explain the effects of the character string output device 1 of the embodiment.
文字列出力装置1によれば、文字列を順次取得する取得部12と、判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う判定部13であって、初回の判定において、取得部12によって最初に取得された文字列を対象文字列として判定を行い、初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、取得部12によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、判定部13と、判定部13によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列を出力する出力部14と、を備える。この構成により、順次取得される文字列が含まれる対象文字列について文末が含まれるか否かの判定が行われ、対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列が出力される。すなわち、順次取得した文字列について文末までの文字列を出力することができる。 The character string output device 1 includes an acquisition unit 12 that sequentially acquires character strings, and a determination unit 13 that repeatedly determines whether a target character string, which is a character string to be determined, contains an ending sentence. In the initial determination, the determination is made on the character string first acquired by the acquisition unit 12 as the target character string. In subsequent determinations, if the previous determination determined that the target character string did not contain an ending sentence, the determination unit 13 determines a new target character string that contains the target character string and a character string subsequently acquired by the acquisition unit 12. The output unit 14 outputs the target character string up to the ending sentence if the determination unit 13 determines that the target character string contains an ending sentence. With this configuration, a determination is made on whether a target character string containing sequentially acquired character strings contains an ending sentence, and if it is determined that the target character string contains an ending sentence, the target character string up to the ending sentence is output. In other words, it is possible to output the sequentially acquired character strings up to the ending sentence.
また、文字列出力装置1によれば、判定部13は、対象文字列の末尾が文末であれば文末が含まれると判定し、対象文字列の末尾が文末でなければ文末が含まれないと判定してもよい。この構成により、対象文字列の末尾のみが判定対象となるため、処理が単純化され、処理を高速化することができる。 Furthermore, according to the character string output device 1, the determination unit 13 may determine that a sentence ending is included if the target character string ends with the sentence ending, and may determine that a sentence ending is not included if the target character string does not end with the sentence ending. With this configuration, only the end of the target character string is subject to determination, which simplifies and speeds up processing.
また、文字列出力装置1によれば、判定部13は、初回以降の判定において、前回の判定において対象文字列に文末が含まれると判定された場合は、当該対象文字列のうち文末より後の文字列と、取得部12によって続いて取得された文字列とを含む新たな対象文字列について判定を行ってもよい。この構成により、取得部12により順次取得された文字列について、取りこぼすこと無く確実に処理することができる。 Furthermore, according to the character string output device 1, in a judgment after the first judgment, if the previous judgment determined that the target character string includes the end of a sentence, the judgment unit 13 may make a judgment on a new target character string that includes the character string after the end of the sentence in the target character string and the character string subsequently acquired by the acquisition unit 12. This configuration allows the character strings acquired sequentially by the acquisition unit 12 to be processed reliably without missing any.
また、文字列出力装置1によれば、判定部13は、文末記号のない文字列を入力すると文末記号が挿入された文字列を出力する文末記号挿入モデルに、文末記号を除去した対象文字列を入力して得られる文字列に文末記号があるか否かに基づいて、文末が含まれるか否かを判定してもよい。この構成により、文末記号挿入モデルに基づいて修正された、より正確な文字列に対して判定を行うことができるので、より精度が高い処理を行うことができる。 Furthermore, according to the character string output device 1, the determination unit 13 may determine whether a sentence ending is included based on whether a character string obtained by inputting a target character string from which a sentence ending symbol has been removed contains a sentence ending symbol into a sentence ending symbol insertion model that outputs a character string with a sentence ending symbol inserted when a character string without a sentence ending symbol is input. This configuration allows determination to be made on a more accurate character string corrected based on the sentence ending symbol insertion model, thereby enabling more accurate processing.
また、文字列出力装置1によれば、判定部13は、判定を行った際に対象文字列を、文末記号挿入モデルに文末記号を除去した対象文字列を入力して得られる文字列に置き換えてもよい。この構成により、文末記号挿入モデルに基づいて修正された、より正確な文字列を最終的に出力することができる。 Furthermore, according to the character string output device 1, the determination unit 13 may replace the target character string when making a determination with a character string obtained by inputting the target character string from which the sentence-final symbols have been removed into a sentence-final symbol insertion model. This configuration makes it possible to ultimately output a more accurate character string that has been corrected based on the sentence-final symbol insertion model.
また、文字列出力装置1によれば、文末記号挿入モデルは、文末記号のない文字列と文末記号のある文字列との組である学習データに基づいて学習された学習済みモデルであってもよい。この構成により、より正確な出力を行う文末記号挿入モデルをより確実に生成することができる。 Furthermore, according to the character string output device 1, the sentence-end symbol insertion model may be a trained model trained based on training data that is a pair of character strings without sentence-end symbols and character strings with sentence-end symbols. This configuration makes it possible to more reliably generate a sentence-end symbol insertion model that produces more accurate output.
また、文字列出力装置1によれば、学習データは、文末記号のある文字列の中から取り出した一部の文字列である取出文字列から文末記号を除去した文字列と当該取出文字列との組であってもよい。この構成により、容易に学習データを生成することができる。 Furthermore, according to the character string output device 1, the training data may be a pair of a string obtained by removing a sentence-ending symbol from a extracted string, which is a portion of a string extracted from a string containing a sentence-ending symbol. This configuration makes it easy to generate training data.
また、文字列出力装置1によれば、学習データに含まれる文末記号のある文字列は、当該文字列を構成する単語ごとに、次に文末記号が来るか否かを示す系列ラベリングにおけるラベルが付与されていてもよい。この構成により、系列ラベリングタスクとして機械学習を行うことができるため、より精度の高い処理を行うことができる。 Furthermore, according to the character string output device 1, character strings containing sentence-final symbols included in the training data may be assigned a label in sequence labeling indicating whether or not a sentence-final symbol follows each word that makes up the character string. This configuration enables machine learning to be performed as a sequence labeling task, thereby enabling more accurate processing.
また、文字列出力装置1によれば、取得部12は、音声認識又は文字認識の認識結果である文字列を順次取得してもよい。この構成により、音声認識又は文字認識の認識結果を対象とすることができる。 Furthermore, according to the character string output device 1, the acquisition unit 12 may sequentially acquire character strings that are the recognition results of speech recognition or character recognition. With this configuration, the recognition results of speech recognition or character recognition can be targeted.
また、文字列出力装置1によれば、出力部14によって出力された文字列を機械翻訳した結果を出力する翻訳部15をさらに備えてもよい。この構成により、実世界で応用できる範囲を広げることができる。 The character string output device 1 may further include a translation unit 15 that outputs the results of machine translation of the character string output by the output unit 14. This configuration can expand the range of applications in the real world.
文字列出力装置1は、文区切り位置判定による音声認識結果修正技術である。 The string output device 1 is a technology for correcting speech recognition results by determining sentence break positions.
従来の課題について説明する。音声認識では無音区間が一定時間継続すると、そこを文区切り位置と判定し、無音区間までの発話が1つの音声認識結果として出力される。そのため、話し方によって、本来1文となってほしい文の途中で文が区切られることがある。また、文区切りの際に、区切られた文の末尾には句点が挿入されることが多い。このような「文の意味としては1文として処理すべきだが、音声認識の仕組みによって複数文に分かれてしまっており、句読点位置も不適切な音声認識結果」は解釈しづらく、例えば翻訳をする場合には翻訳結果が意図しないものとなる。したがって、音声認識システムにおいて、複数文に分かれてしまった音声認識結果を1文に結合し、かつ句読点を正しく挿入し直す技術が望まれる。また、音声翻訳システムなどにおいては、遅延を発生させずに逐次的に音声認識結果を翻訳して翻訳結果を出力する必要があり、結合が必要な文かどうかの判定のために次にくる音声認識結果を待って利用することは望ましくない(次の音声認識結果を待つ間、現在の音声認識結果及び翻訳結果を出力できないため)。したがって、現在の音声認識結果1文のみを利用し、次に来る音声認識結果と結合すべきか(本来1文とすべきだが複数文に分かれてしまった文かどうか)を判定し、結合が必要な場合のみ次の音声認識結果を待って結合する技術が望まれる。 Explaining the challenges of the prior art. In speech recognition, when a silent interval continues for a certain period of time, it is determined to be a sentence boundary, and the speech up to the silent interval is output as a single speech recognition result. Therefore, depending on the speaking style, a sentence may be broken into parts that should be a single sentence. Furthermore, when a sentence is broken into parts, periods are often inserted at the end of the broken sentences. Such speech recognition results, in which the meaning of a sentence should be processed as a single sentence but the speech recognition mechanism has split it into multiple sentences and the punctuation is inappropriately placed, are difficult to interpret and, for example, can result in unintended translations. Therefore, a technology is needed in speech recognition systems that can combine speech recognition results that have been split into multiple sentences into a single sentence and reinsert punctuation correctly. Furthermore, speech translation systems, for example, must translate speech recognition results sequentially without delay and output the translation results. Therefore, it is undesirable to wait for the next speech recognition result to determine whether a sentence needs to be combined (because the current speech recognition result and translation results cannot be output while waiting for the next speech recognition result). Therefore, what is needed is a technology that uses only one sentence from the current speech recognition result, determines whether it should be combined with the next speech recognition result (whether it is a sentence that should have been one sentence but has been split into multiple sentences), and waits for the next speech recognition result to combine them only if combining is necessary.
例えば、「したがって、こうなります。」という発話を音声翻訳する場合の具体例について説明する。従来技術では、「音声認識の仕組みによって複数文に分かれてしまっており、句読点位置も不適切な音声認識結果」を機械翻訳した結果、意図しない結果が得られてしまう(図9参照)。一方、文字列出力装置1によれば(図10参照)、音声認識結果Gのみを利用し、文区切りではない(次に来る音声認識結果と結合すべき)と判定し、次の音声認識結果との結合および句読点などの文区切り記号を正しく挿入し直す処理を行う。これにより、ユーザの意図した音声認識結果および機械翻訳結果が得られる。音声認識結果Gで文区切りであると判定された場合には、次に来る音声認識結果を待つ必要がなく、遅延が発生しない。文区切り判定は、文区切り挿入モデルにより、句読点などの文区切り記号を挿入し直し、末尾が文末記号(句点など)になるかどうかによって判定を行う。For example, let us consider a specific example of translating the utterance "Therefore, this is what happens." Conventional technology machine-translates speech recognition results that are split into multiple sentences due to the speech recognition mechanism and have inappropriate punctuation, resulting in unintended results (see Figure 9). On the other hand, character string output device 1 (see Figure 10) uses only speech recognition result G to determine that the result is not a sentence break (it should be combined with the next speech recognition result), and then combines it with the next speech recognition result and correctly reinserts sentence break symbols such as punctuation marks. This allows for the speech recognition and machine translation results intended by the user to be obtained. If speech recognition result G is determined to be a sentence break, there is no need to wait for the next speech recognition result, and no delay occurs. Sentence break determination is performed by reinserting sentence break symbols such as punctuation marks using a sentence break insertion model, and determining whether the end of the result is a sentence-ending symbol (such as a period).
従来技術として、音声認識結果が話し終わりかどうか(文区切りかどうか)を自動判定する技術が存在する。この技術では、音声認識結果を句読点単位で分割し、話終わり判定モデルによって判定を行う。この技術では、文区切り位置の判定はできるが、以下の2つの課題がある。
(1)音声認識エンジンが挿入する句読点の位置に依存し、うまく文区切り位置を判定できないことがある。
(2)音声認識エンジンが挿入する句読点の位置に依存し、文結合時に句読点位置が不適切になることがある。
There is a conventional technology that automatically determines whether a speech recognition result indicates the end of a speech (whether it is a sentence break). This technology divides the speech recognition result into punctuation marks and performs the end-of-speech determination using an end-of-speech determination model. While this technology can determine the position of a sentence break, it has the following two problems.
(1) The voice recognition engine may not be able to properly determine the position of a sentence break depending on the position of the punctuation marks inserted.
(2) Depending on the position of punctuation marks inserted by the speech recognition engine, the positions of punctuation marks may be inappropriate when joining sentences.
上記課題(1)について説明する(図11参照)。音声認識結果の句読点に誤りがあり、1音声認識結果中に2つの文が含まれる場合、正しい文区切り位置を推測できない。例えば、図11の通り、「したがって、こうなります。」及び「よって、雨が降ります。」の2文が含まれることを判定できない。「こうなります」の後ろで区切って判定できない。すなわち、音声認識エンジンが挿入する句読点位置に依存している。 The above issue (1) will be explained (see Figure 11). If there is an error in the punctuation in the speech recognition results and two sentences are included in one speech recognition result, the correct sentence division position cannot be inferred. For example, as shown in Figure 11, it cannot be determined that the two sentences "Therefore, this is what happens" and "Therefore, it will rain" are included. It cannot be determined that the division occurs after "This is what happens." In other words, it depends on the position of the punctuation inserted by the speech recognition engine.
上記課題(2)について説明する(図12参照)。音声認識結果の句読点に誤りがあると結合時に句読点位置が適切な位置ではない文となる。図12の通り、結合後の句読点位置が不適切である。すなわち、音声認識エンジンが挿入する句読点位置に依存している。 The above issue (2) will now be explained (see Figure 12). If there is an error in the punctuation in the speech recognition results, the sentence will have punctuation marks in inappropriate positions when combined. As shown in Figure 12, the punctuation marks after combining are inappropriate. In other words, it depends on the position of the punctuation marks inserted by the speech recognition engine.
文字列出力装置1によれば、音声認識エンジンが挿入する句読点を全て削除し、自作のモデルにより句読点を挿入し直して文区切り判定をするため、音声認識エンジンが挿入する句読点の位置に依存せずに処理することができ、上記の課題を解決することができる。 The string output device 1 deletes all punctuation marks inserted by the speech recognition engine, reinserts punctuation marks using a custom model, and then determines sentence boundaries, allowing processing to be performed independently of the position of punctuation marks inserted by the speech recognition engine, thereby solving the above-mentioned problem.
従来技術として、句読点位置を予測する技術が存在する。この技術では、句読点位置の予測ができるが、以下の課題がある。
(1)対象が音声認識結果のような順次入力される誤りの含まれることが多いデータではない(途中切れとなっている学習データを利用していない)。
(2)句読点のみの位置を予測する技術であり、その他の記号に対応していない(「!」「?」などへの対応)。
(3)句読点処理のみであり、文区切り判定や、文の結合などは行わない。
There is a conventional technique for predicting the position of punctuation marks. This technique can predict the position of punctuation marks, but it has the following problems.
(1) The target data is not sequentially input data that often contains errors, such as voice recognition results (no training data that is cut off in the middle is used).
(2) This technology predicts the position of only punctuation marks and does not support other symbols (such as "!" and "?").
(3) Only punctuation processing is performed, and sentence boundary determination and sentence joining are not performed.
文字列出力装置1によれば、途中切れとなっている文を学習データとして利用するため、途中切れとなっている文の句読点位置の予測に強い。また、句読点に加え、その他の文区切り記号も挿入することが可能である(「!」「?」など)。また、句読点挿入を応用し、文区切りの判定や文の結合を行う技術である。 The character string output device 1 uses broken sentences as learning data, making it highly effective at predicting the position of punctuation marks in broken sentences. It is also possible to insert other sentence delimiters in addition to punctuation marks (such as "!" and "?"). It is also a technology that applies punctuation mark insertion to determine sentence delimiters and combine sentences.
従来技術として、句読点位置予測技術が存在する。この技術では、2文間の句点位置の正しさを判定することができるが、以下の課題がある。
(1)2文を入力して2文の間に句点が必要かどうかを判定する技術であり、次の入力を待つ必要があるため遅延が発生する。
(2)2文間の句点以外の記号や位置に対応していない。
(3)句点処理のみであり、文区切り判定や、文の結合などは行わない。
A conventional technique exists for predicting the position of punctuation marks. This technique can determine the correct position of punctuation marks between two sentences, but it has the following problems.
(1) This is a technology that involves inputting two sentences and determining whether a period is needed between the two sentences. This technology causes delays because it must wait for the next input.
(2) It does not correspond to any symbols or positions other than periods between two sentences.
(3) Only punctuation processing is performed, and sentence break determination and sentence joining are not performed.
文字列出力装置1によれば、1文のみで判定が可能であり、遅延が発生しない。また、句点に加え、その他の文区切り記号も挿入することが可能である(「、」「!」「?」など)。また、句読点挿入を応用し、文区切りの判定や文の結合を行う技術である。 The character string output device 1 can make a judgment based on just one sentence, eliminating delays. It is also possible to insert other sentence delimiters in addition to periods (such as ",", "!", and "?"). It is also a technology that applies punctuation mark insertion to judge sentence delimiters and combine sentences.
以上の通り、文字列出力装置1には以下の利点がある。
(1)音声認識結果1文のみを利用して文区切り判定(結合が必要かどうかの判定)を行うことが可能である。すなわち、次の音声認識結果を待つための遅延が発生しない。
(2)音声認識エンジンが挿入する句読点などの文区切り記号に依存せず、文区切り位置の判定が可能である。すなわち、文区切り判定の精度が高い。
(3)音声認識エンジンが挿入する句読点などの文区切り記号に依存せず、文結合後の文に対して、文区切り記号を適切な位置に挿入し直すことが可能である。すなわち、文結合後の文をより自然な文に修正することができる。
(4)句読点のみではなく、「?」「!」といった文区切り記号を挿入することが可能である。すなわち、文区切り判定の精度が高い、かつ、文結合後の文をより自然な文に修正することができる。
As described above, the character string output device 1 has the following advantages.
(1) It is possible to determine whether a sentence needs to be joined or not using only one speech recognition result. In other words, there is no delay while waiting for the next speech recognition result.
(2) It is possible to determine the position of a sentence break without relying on punctuation marks or other sentence break symbols inserted by the speech recognition engine. In other words, the accuracy of sentence break determination is high.
(3) It is possible to insert sentence delimiters such as punctuation marks into the combined sentence in an appropriate position, without relying on the sentence delimiters inserted by the speech recognition engine. In other words, it is possible to correct the combined sentence into a more natural sentence.
(4) It is possible to insert not only punctuation marks but also sentence delimiters such as "?" and "!". This means that the accuracy of sentence delimitation determination is high, and the sentences after joining can be corrected to be more natural.
文字列出力装置1は以下の構成としてもよい。 The string output device 1 may have the following configuration.
[項番1]
音声認識結果に対して、全ての文区切り記号(「、」「。」「!」「?」など)を取り除き、文区切り記号のある文とそれを取り除いた文をペアとする学習データの機械学習により生成された文区切り記号挿入モデルを用いて文区切り記号を挿入するステップと、
前記文区切り記号挿入音声認識結果の末尾が文末記号(「。」「!」「?」)でなければ文末ではないと判定し、次の音声認識結果と結合するステップと、
前記結合済み音声認識結果に対して再度文区切り記号を全て取り除き、文区切り記号挿入モデルを用いて文区切り記号を挿入するステップと、
前記文区切り記号挿入音声認識結果の末尾が文末記号となるまでこれを繰り返すステップと、
末尾が文末記号となった文を音声認識修正結果とするステップと、
を備えることを特徴とする音声認識結果修正方法。
[Item number 1]
A step of removing all sentence delimiters (such as ","".","!", and "?") from the speech recognition results and inserting sentence delimiters using a sentence delimiter insertion model generated by machine learning of training data that pairs sentences with sentence delimiters with sentences from which the sentence delimiters have been removed;
a step of determining that the end of the sentence delimiter inserted speech recognition result is not the end of a sentence if the end of the sentence delimiter inserted speech recognition result is not a sentence end symbol (".", "!", or "?"), and combining the result with the next speech recognition result;
removing all sentence delimiters from the combined speech recognition results again and inserting sentence delimiters using a sentence delimiter insertion model;
repeating this process until the end of the sentence delimiter symbol insertion speech recognition result becomes a sentence end symbol;
a step of determining the sentence ending with the sentence end symbol as a speech recognition correction result;
A method for correcting a speech recognition result, comprising:
[項番2]
前記の文末判定のステップにおいて、文末が文末記号ではないが、文中に文末記号を含む場合、文頭から文末記号までを音声認識修正結果として出力し、文中の文末記号から文末までを次音声認識結果と結合することを特徴とする、
項番1に記載の音声認識結果修正方法。
[Item number 2]
In the step of determining the end of the sentence, if the end of the sentence is not a sentence end symbol but the sentence contains a sentence end symbol, the part from the beginning of the sentence to the sentence end symbol is output as a speech recognition correction result, and the part from the sentence end symbol to the end of the sentence is combined with the next speech recognition result.
2. The method for correcting a speech recognition result according to claim 1.
[項番3]
前記の機械学習による文区切り記号挿入モデルの生成のステップにおいて、文区切り記号のある文を元データとし、「文を単語単位で区切り、ランダムな位置で分割する処理(音声認識の不適切な文区切りに対応するため)」と「文区切り記号を削除する処理」を行い、ペアとなる文区切り記号除去文を生成することを特徴とする、
項番1に記載の音声認識結果修正方法。
[Item number 3]
In the step of generating a sentence delimiter insertion model by machine learning, a sentence with a sentence delimiter is used as the original data, and a process of "dividing the sentence into words and dividing it at random positions (to deal with inappropriate sentence divisions in speech recognition)" and a process of "removing the sentence delimiter" are performed to generate a pair of sentences with the sentence delimiter removed.
2. The method for correcting a speech recognition result according to claim 1.
[項番4]
前記の機械学習による文区切り記号挿入モデルの生成のステップにおいて、単語単位で分割された「文区切り記号除去文」に対して、「文区切り記号のある文」の文区切り記号位置を教師データとして、どの単語の後にどの文区切り記号が入るかを予測する系列ラベリングタスクとして機械学習を行うことを特徴とする、
項番1に記載の音声認識結果修正方法。
[Item number 4]
In the step of generating a sentence delimiter insertion model by machine learning, machine learning is performed on the "sentences with sentence delimiters removed" divided into words as a sequence labeling task to predict which sentence delimiter will be inserted after which word, using sentence delimiter positions in the "sentences with sentence delimiters" as training data.
2. The method for correcting a speech recognition result according to claim 1.
[項番5]
前記音声認識結果修正方法を応用し、会議や電話等を音声認識し、その音声認識結果を適切な文区切り及び記号となるよう修正した結果を機械翻訳し、音声翻訳結果とすることを特徴とする、
項番1に記載の音声翻訳方法。
文字列出力装置1は以下の構成としてもよい。
[項番11]
文字列を順次取得する取得部と、
判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う判定部であって、
初回の判定において、前記取得部によって最初に取得された文字列を対象文字列として判定を行い、
初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、前記取得部によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、判定部と、
前記判定部によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列を出力する出力部と、
を備える文字列出力装置。
[項番12]
前記判定部は、対象文字列の末尾が文末であれば文末が含まれると判定し、対象文字列の末尾が文末でなければ文末が含まれないと判定する、
項番11に記載の文字列出力装置。
[項番13]
前記判定部は、初回以降の判定において、前回の判定において対象文字列に文末が含まれると判定された場合は、当該対象文字列のうち文末より後の文字列と、前記取得部によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、
項番11に記載の文字列出力装置。
[項番14]
前記判定部は、文末記号のない文字列を入力すると文末記号が挿入された文字列を出力する文末記号挿入モデルに、文末記号を除去した対象文字列を入力して得られる文字列に文末記号があるか否かに基づいて、文末が含まれるか否かを判定する、
項番11~13の何れか一項に記載の文字列出力装置。
[項番15]
前記判定部は、判定を行った際に対象文字列を、文末記号挿入モデルに文末記号を除去した対象文字列を入力して得られる文字列に置き換える、
項番14に記載の文字列出力装置。
[項番16]
文末記号挿入モデルは、文末記号のない文字列と文末記号のある文字列との組である学習データに基づいて学習された学習済みモデルである、
項番14又は15に記載の文字列出力装置。
[項番17]
学習データは、文末記号のある文字列の中から取り出した一部の文字列である取出文字列から文末記号を除去した文字列と当該取出文字列との組である、
項番16に記載の文字列出力装置。
[項番18]
学習データに含まれる文末記号のある文字列は、当該文字列を構成する単語ごとに、次に文末記号が来るか否かを示す系列ラベリングにおけるラベルが付与されている、
項番16又は17に記載の文字列出力装置。
[項番19]
前記取得部は、音声認識又は文字認識の認識結果である文字列を順次取得する、
項番11~18の何れか一項に記載の文字列出力装置。
[項番20]
前記出力部によって出力された文字列を機械翻訳した結果を出力する翻訳部をさらに備える、
項番11~19の何れか一項に記載の文字列出力装置。
[Item number 5]
The method for correcting speech recognition results is applied to recognize speech from meetings, telephone calls, etc., and the speech recognition results are corrected to have appropriate sentence divisions and symbols, which are then machine-translated to produce speech translation results.
2. The speech translation method according to claim 1.
The character string output device 1 may have the following configuration.
[Item No. 11]
an acquisition unit that sequentially acquires character strings;
A determination unit that repeatedly determines whether a target character string that is a character string to be determined includes an end of a sentence,
In the initial determination, the character string acquired first by the acquisition unit is used as a target character string for determination;
a determination unit that, in a determination after the first time, if it is determined in the previous determination that the target character string does not include a sentence ending, performs a determination on a new target character string that includes the target character string and a character string subsequently acquired by the acquisition unit;
an output unit that outputs a character string up to the end of the sentence from the target character string when the determination unit determines that the target character string includes an end of the sentence;
A character string output device comprising:
[Item No. 12]
the determination unit determines that a sentence ending is included if the target character string ends at the end of a sentence, and determines that a sentence ending is not included if the target character string ends at a non-end of a sentence;
Item 12. The character string output device according to item 11.
[Item No. 13]
In a determination after the first determination, if it is determined in the previous determination that the target character string includes an end of a sentence, the determination unit performs a determination on a new target character string that includes a character string after the end of the sentence in the target character string and a character string subsequently acquired by the acquisition unit.
Item 12. The character string output device according to item 11.
[Item No. 14]
the determination unit determines whether a sentence ending is included based on whether a sentence ending symbol is present in a character string obtained by inputting a target character string from which a sentence ending symbol has been removed into a sentence ending symbol insertion model that outputs a character string in which a sentence ending symbol is inserted when a character string without a sentence ending symbol is input;
14. The character string output device according to any one of items 11 to 13.
[Item No. 15]
the determination unit replaces the target character string with a character string obtained by inputting the target character string from which the sentence-final symbol has been removed into a sentence-final symbol insertion model when the determination is made;
Item 15. The character string output device according to item 14.
[Item No. 16]
The sentence-final symbol insertion model is a trained model trained based on training data that is a pair of strings without sentence-final symbols and strings with sentence-final symbols.
16. The character string output device according to item 14 or 15.
[Item number 17]
The training data is a set of a string obtained by removing a sentence-ending symbol from a string that is extracted from a string containing a sentence-ending symbol, and the extracted string.
Item 17. The character string output device according to item 16.
[Item No. 18]
For strings containing sentence-final symbols included in the training data, a label is assigned in sequence labeling to indicate whether or not a sentence-final symbol follows each word in the string.
18. The character string output device according to item 16 or 17.
[Item No. 19]
the acquiring unit sequentially acquires character strings that are recognition results of speech recognition or character recognition;
19. The character string output device according to any one of items 11 to 18.
[Item No. 20]
a translation unit that outputs a result of machine translation of the character string output by the output unit,
20. The character string output device according to any one of items 11 to 19.
実施形態において、言語は日本語を例に記載しているが、日本語以外の言語にも使える技術である。実施形態において、「音声認識」を対象として記載しているが、音声認識に限った技術ではなく、「順次入力される、文区切り誤りの含まれるテキスト」に対して有効な技術である。 In the embodiments, Japanese is used as an example language, but the technology can also be used for languages other than Japanese. In the embodiments, "speech recognition" is described as the target, but the technology is not limited to speech recognition; it is effective for "sequentially input text containing sentence segmentation errors."
なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。 Note that the block diagrams used to explain the above embodiments show functional blocks. These functional blocks (components) are realized by any combination of hardware and/or software. Furthermore, there are no particular limitations on the method of realizing each functional block. That is, each functional block may be realized using a single device that is physically or logically coupled, or may be realized using two or more physically or logically separated devices that are connected directly or indirectly (for example, using wires, wirelessly, etc.) and these multiple devices. A functional block may also be realized by combining software with the single device or multiple devices.
機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)や送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。 Functions include, but are not limited to, judgment, determination, assessment, calculation, computation, processing, derivation, investigation, search, confirmation, reception, transmission, output, access, resolution, selection, election, establishment, comparison, assumption, expectation, regard, broadcasting, notifying, communicating, forwarding, configuring, reconfiguring, allocating, mapping, and assignment. For example, a functional block (component) that performs transmission functions is called a transmitting unit or transmitter. As mentioned above, there are no particular limitations on how these functions are implemented.
例えば、本開示の一実施の形態における文字列出力装置1などは、本開示の文字列出力方法の処理を行うコンピュータとして機能してもよい。図13は、本開示の一実施の形態に係る文字列出力装置1のハードウェア構成の一例を示す図である。上述の文字列出力装置1は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。For example, the character string output device 1 according to an embodiment of the present disclosure may function as a computer that performs processing of the character string output method of the present disclosure. FIG. 13 is a diagram showing an example of the hardware configuration of the character string output device 1 according to an embodiment of the present disclosure. The above-described character string output device 1 may be physically configured as a computer device including a processor 1001, memory 1002, storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, etc.
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。文字列出力装置1のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。 In the following description, the term "device" can be interpreted as a circuit, device, unit, etc. The hardware configuration of the character string output device 1 may be configured to include one or more of the devices shown in the figure, or may be configured to exclude some of the devices.
文字列出力装置1における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。 Each function of the character string output device 1 is realized by loading specified software (programs) onto hardware such as the processor 1001 and memory 1002, causing the processor 1001 to perform calculations, control communication via the communication device 1004, and control at least one of reading and writing data in the memory 1002 and storage 1003.
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述の学習部11、取得部12、判定部13、出力部14及び翻訳部15などは、プロセッサ1001によって実現されてもよい。 The processor 1001, for example, runs an operating system to control the entire computer. The processor 1001 may be configured as a central processing unit (CPU) including an interface with peripheral devices, a control unit, an arithmetic unit, registers, etc. For example, the learning unit 11, acquisition unit 12, judgment unit 13, output unit 14, and translation unit 15 described above may be realized by the processor 1001.
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、学習部11、取得部12、判定部13、出力部14及び翻訳部15は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。 The processor 1001 also reads programs (program code), software modules, data, etc. from at least one of the storage 1003 and the communication device 1004 into the memory 1002 and executes various processes in accordance with these. The programs used are those that cause a computer to execute at least some of the operations described in the above-described embodiments. For example, the learning unit 11, acquisition unit 12, judgment unit 13, output unit 14, and translation unit 15 may be implemented by a control program stored in the memory 1002 and running on the processor 1001, and similar implementations may be made for other functional blocks. While the above-described various processes have been described as being executed by one processor 1001, they may also be executed simultaneously or sequentially by two or more processors 1001. The processor 1001 may be implemented by one or more chips. The programs may also be transmitted from a network via telecommunications lines.
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る無線通信方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。 Memory 1002 is a computer-readable recording medium and may be composed of, for example, at least one of ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), RAM (Random Access Memory), etc. Memory 1002 may also be called a register, cache, main memory (primary storage device), etc. Memory 1002 can store executable programs (program code), software modules, etc. for implementing a wireless communication method relating to one embodiment of the present disclosure.
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。 Storage 1003 is a computer-readable recording medium and may be composed of, for example, at least one of an optical disk such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disk, a magneto-optical disk (e.g., a compact disk, a digital versatile disk, a Blu-ray (registered trademark) disk), a smart card, a flash memory (e.g., a card, a stick, a key drive), a floppy (registered trademark) disk, a magnetic strip, etc. Storage 1003 may also be referred to as an auxiliary storage device. The above-mentioned storage medium may be, for example, a database, a server, or other suitable medium including at least one of memory 1002 and storage 1003.
通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)及び時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、上述の学習部11、取得部12、判定部13、出力部14及び翻訳部15などは、通信装置1004によって実現されてもよい。 The communication device 1004 is hardware (transmission/reception device) for communicating between computers via at least one of a wired network and a wireless network, and is also referred to as, for example, a network device, network controller, network card, or communication module. The communication device 1004 may be configured to include a high-frequency switch, duplexer, filter, frequency synthesizer, etc. to realize at least one of frequency division duplex (FDD) and time division duplex (TDD). For example, the above-mentioned learning unit 11, acquisition unit 12, determination unit 13, output unit 14, and translation unit 15 may be realized by the communication device 1004.
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。 The input device 1005 is an input device (e.g., a keyboard, mouse, microphone, switch, button, sensor, etc.) that accepts input from the outside. The output device 1006 is an output device (e.g., a display, speaker, LED lamp, etc.) that outputs to the outside. Note that the input device 1005 and the output device 1006 may be integrated into one structure (e.g., a touch panel).
また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。 Furthermore, each device such as the processor 1001 and memory 1002 is connected by a bus 1007 for communicating information. The bus 1007 may be configured using a single bus, or may be configured using different buses between each device.
また、文字列出力装置1は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。 The character string output device 1 may also be configured to include hardware such as a microprocessor, a digital signal processor (DSP), an application specific integrated circuit (ASIC), a programmable logic device (PLD), or a field programmable gate array (FPGA), and some or all of the functional blocks may be realized by the hardware. For example, the processor 1001 may be implemented using at least one of these pieces of hardware.
情報の通知は、本開示において説明した態様/実施形態に限られず、他の方法を用いて行われてもよい。 Notification of information is not limited to the aspects/embodiments described in this disclosure and may be performed using other methods.
本開示において説明した各態様/実施形態は、LTE(Long Term Evolution)、LTE-A(LTE-Advanced)、SUPER 3G、IMT-Advanced、4G(4th generation mobile communication system)、5G(5th generation mobile communication system)、FRA(Future Radio Access)、NR(new Radio)、W-CDMA(登録商標)、GSM(登録商標)、CDMA2000、UMB(Ultra Mobile Broadband)、IEEE 802.11(Wi-Fi(登録商標))、IEEE 802.16(WiMAX(登録商標))、IEEE 802.20、UWB(Ultra-WideBand)、Bluetooth(登録商標)、その他の適切なシステムを利用するシステム及びこれらに基づいて拡張された次世代システムの少なくとも一つに適用されてもよい。また、複数のシステムが組み合わされて(例えば、LTE及びLTE-Aの少なくとも一方と5Gとの組み合わせ等)適用されてもよい。 Each aspect/embodiment described in this disclosure may be applied to at least one of systems utilizing LTE (Long Term Evolution), LTE-Advanced (LTE-A), SUPER 3G, IMT-Advanced, 4G (4th generation mobile communication system), 5G (5th generation mobile communication system), FRA (Future Radio Access), NR (new Radio), W-CDMA (registered trademark), GSM (registered trademark), CDMA2000, UMB (Ultra Mobile Broadband), IEEE 802.11 (Wi-Fi (registered trademark)), IEEE 802.16 (WiMAX (registered trademark)), IEEE 802.20, UWB (Ultra-WideBand), Bluetooth (registered trademark), or other suitable systems, and next generation systems enhanced based on these. In addition, multiple systems may be combined (for example, a combination of at least one of LTE and LTE-A with 5G, etc.).
本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。 The order of the procedures, sequences, flowcharts, etc. of each aspect/embodiment described in this disclosure may be changed unless inconsistent. For example, the methods described in this disclosure present elements of various steps using an example order and are not limited to the particular order presented.
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。 Input and output information may be stored in a specific location (e.g., memory) or may be managed using a management table. Input and output information may be overwritten, updated, or added to. Output information may be deleted. Input information may be sent to another device.
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。 The determination may be made based on a value represented by a single bit (0 or 1), a Boolean value (true or false), or a numerical comparison (e.g., comparison with a predetermined value).
本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。 Each aspect/embodiment described in this disclosure may be used alone, in combination, or switched between depending on the implementation. Furthermore, notification of specified information (e.g., notification that "X is true") is not limited to being done explicitly, but may also be done implicitly (e.g., not notifying the specified information).
以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。 Although the present disclosure has been described in detail above, it will be clear to those skilled in the art that the present disclosure is not limited to the embodiments described herein. The present disclosure can be implemented in modified and altered forms without departing from the spirit and scope of the present disclosure as defined by the claims. Therefore, the description of the present disclosure is intended to be illustrative and does not have any limiting meaning on the present disclosure.
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。 Software shall be construed broadly to mean instructions, instruction sets, code, code segments, program code, programs, subprograms, software modules, applications, software applications, software packages, routines, subroutines, objects, executable files, threads of execution, procedures, functions, etc., whether referred to as software, firmware, middleware, microcode, hardware description language, or otherwise.
また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。 Software, instructions, information, etc. may also be transmitted and received via a transmission medium. For example, if software is transmitted from a website, server, or other remote source using wired technologies (such as coaxial cable, fiber optic cable, twisted pair, Digital Subscriber Line (DSL)), and/or wireless technologies (such as infrared, microwave), these wired and/or wireless technologies are included within the definition of transmission media.
本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。The information, signals, etc. described in this disclosure may be represented using any of a variety of different technologies. For example, data, instructions, commands, information, signals, bits, symbols, chips, etc. that may be referred to throughout the above description may be represented by voltages, currents, electromagnetic waves, magnetic fields or magnetic particles, optical fields or photons, or any combination thereof.
なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。 Note that terms explained in this disclosure and terms necessary for understanding this disclosure may be replaced with terms having the same or similar meaning.
本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。 As used in this disclosure, the terms "system" and "network" are used interchangeably.
また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。 Furthermore, the information, parameters, etc. described in this disclosure may be expressed using absolute values, relative values from a predetermined value, or corresponding other information.
上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。The names used for the parameters described above are not limiting in any way. Furthermore, the formulas and the like using these parameters may differ from those explicitly disclosed in this disclosure.
本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。As used in this disclosure, the terms "determining" and "determining" may encompass a wide variety of actions. "Determining" and "determining" may include, for example, judging, calculating, computing, processing, deriving, investigating, looking up, searching, inquiring (e.g., searching a table, database, or other data structure), and ascertaining, all of which are considered to be "judging" or "determining." "Determining" and "determining" may also include receiving (e.g., receiving information), transmitting (e.g., sending information), input, output, and accessing (e.g., accessing data in memory), all of which are considered to be "judging" or "determining." "Determining" and "determining" may also include resolving, selecting, choosing, establishing, comparing, and other actions, all of which are considered to be "judging" or "determining." In other words, "judgment" and "decision" can include regarding some action as having been "judged" or "decided." Also, "judgment (decision)" can be interpreted as "assuming," "expecting," "considering," etc.
「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。The terms "connected," "coupled," or any variation thereof, refer to any direct or indirect connection or coupling between two or more elements, and may include the presence of one or more intermediate elements between two elements that are "connected" or "coupled" to each other. The coupling or connection between elements may be physical, logical, or a combination thereof. For example, "connected" may be read as "access." As used in this disclosure, two elements may be considered to be "connected" or "coupled" to each other using one or more wires, cables, and/or printed electrical connections, as well as electromagnetic energy having wavelengths in the radio frequency range, microwave range, and optical (both visible and invisible) range, as some non-limiting and non-exhaustive examples.
本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。 As used in this disclosure, the phrase "based on" does not mean "based only on," unless expressly stated otherwise. In other words, the phrase "based on" means both "based only on" and "based at least on."
本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。As used in this disclosure, any reference to an element using a designation such as "first," "second," etc. does not generally limit the quantity or order of those elements. These designations may be used in this disclosure as a convenient method of distinguishing between two or more elements. Thus, a reference to a first and a second element does not imply that only two elements may be employed or that the first element must in some way precede the second element.
上記の各装置の構成における「手段」を、「部」、「回路」、「デバイス」等に置き換えてもよい。 The "means" in the configuration of each of the above devices may be replaced with "part," "circuit," "device," etc.
本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。 When the terms "include," "including," and variations thereof are used in this disclosure, these terms are intended to be inclusive, similar to the term "comprising." Furthermore, when the term "or" is used in this disclosure, it is not intended to be an exclusive or.
本開示において、例えば、英語でのa、an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。 In this disclosure, where articles are added by translation, such as a, an, and the in English, this disclosure may include the noun following these articles being plural.
本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。 In this disclosure, the term "A and B are different" may mean "A and B are different from each other." The term may also mean "A and B are each different from C." Terms such as "separate" and "combined" may also be interpreted in the same way as "different."
1…文字列出力装置、10…格納部、11…学習部、12…取得部、13…判定部、14…出力部、15…翻訳部、1001…プロセッサ、1002…メモリ、1003…ストレージ、1004…通信装置、1005…入力装置、1006…出力装置、1007…バス。 1...character string output device, 10...storage unit, 11...learning unit, 12...acquisition unit, 13...determination unit, 14...output unit, 15...translation unit, 1001...processor, 1002...memory, 1003...storage, 1004...communication device, 1005...input device, 1006...output device, 1007...bus.
Claims (10)
判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う判定部であって、
初回の判定において、前記取得部によって最初に取得された文字列を対象文字列として判定を行い、
初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、前記取得部によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、判定部と、
前記判定部によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列を出力する出力部と、
を備え、
前記判定部は、初回以降の判定において、前回の判定において対象文字列に文末が含まれると判定された場合は、当該対象文字列のうち文末より後の文字列と、前記取得部によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、
文字列出力装置。 an acquisition unit that sequentially acquires character strings;
A determination unit that repeatedly determines whether a target character string that is a character string to be determined includes an end of a sentence,
In the initial determination, the character string acquired first by the acquisition unit is used as a target character string for determination;
a determination unit that, in a determination after the first time, if it is determined in the previous determination that the target character string does not include a sentence ending, performs a determination on a new target character string that includes the target character string and a character string subsequently acquired by the acquisition unit;
an output unit that outputs a character string up to the end of the sentence from the target character string when the determination unit determines that the target character string includes an end of the sentence;
Equipped with
In a determination after the first determination, if it is determined in the previous determination that the target character string includes an end of a sentence, the determination unit performs a determination on a new target character string that includes a character string after the end of the sentence in the target character string and a character string subsequently acquired by the acquisition unit.
A string output device.
判定対象の文字列である対象文字列について文末が含まれるか否かの判定を繰り返し行う判定部であって、
初回の判定において、前記取得部によって最初に取得された文字列を対象文字列として判定を行い、
初回以降の判定において、前回の判定において対象文字列に文末が含まれないと判定された場合は、当該対象文字列と、前記取得部によって続いて取得された文字列とを含む新たな対象文字列について判定を行う、判定部と、
前記判定部によって対象文字列に文末が含まれると判定された場合、当該対象文字列のうち文末までの文字列を出力する出力部と、
を備え、
前記判定部は、文末記号のない文字列を入力すると文末記号が挿入された文字列を出力する文末記号挿入モデルに、文末記号を除去した対象文字列を入力して得られる文字列に文末記号があるか否かに基づいて、文末が含まれるか否かを判定する、
文字列出力装置。 an acquisition unit that sequentially acquires character strings;
A determination unit that repeatedly determines whether a target character string that is a character string to be determined includes an end of a sentence,
In the initial determination, the character string acquired first by the acquisition unit is used as a target character string for determination;
a determination unit that, in a determination after the first time, if it is determined in the previous determination that the target character string does not include a sentence ending, performs a determination on a new target character string that includes the target character string and a character string subsequently acquired by the acquisition unit;
an output unit that outputs a character string up to the end of the sentence from the target character string when the determination unit determines that the target character string includes an end of the sentence;
Equipped with
the determination unit determines whether a sentence ending is included or not based on whether a sentence ending symbol is present in a string obtained by inputting a target string from which a sentence ending symbol has been removed to a sentence ending symbol insertion model that outputs a string in which a sentence ending symbol is inserted when a string without a sentence ending symbol is input;
A string output device.
請求項2に記載の文字列出力装置。 the determination unit determines that a sentence ending is included if the target character string ends at the end of a sentence, and determines that a sentence ending is not included if the target character string ends at a non-end of a sentence;
3. The character string output device according to claim 2 .
請求項2に記載の文字列出力装置。 In a determination after the first determination, if it is determined in the previous determination that the target character string includes an end of a sentence, the determination unit performs a determination on a new target character string that includes a character string after the end of the sentence in the target character string and a character string subsequently acquired by the acquisition unit.
3. The character string output device according to claim 2 .
請求項2に記載の文字列出力装置。 the determination unit replaces the target character string with a character string obtained by inputting the target character string from which the sentence-final symbol has been removed into a sentence-final symbol insertion model when the determination is made;
3. The character string output device according to claim 2 .
請求項2に記載の文字列出力装置。 The sentence-final symbol insertion model is a trained model trained based on training data that is a pair of strings without sentence-final symbols and strings with sentence-final symbols.
3. The character string output device according to claim 2 .
請求項6に記載の文字列出力装置。 The training data is a set of a string obtained by removing a sentence-ending symbol from a string that is extracted from a string containing a sentence-ending symbol, and the extracted string.
7. The character string output device according to claim 6.
請求項6に記載の文字列出力装置。 For strings containing sentence-final symbols included in the training data, a label is assigned in sequence labeling to indicate whether or not a sentence-final symbol follows each word that makes up the string.
7. The character string output device according to claim 6.
請求項1又は2に記載の文字列出力装置。 the acquiring unit sequentially acquires character strings that are recognition results of speech recognition or character recognition;
3. The character string output device according to claim 1.
請求項1又は2に記載の文字列出力装置。
a translation unit that outputs a result of machine translation of the character string output by the output unit,
3. The character string output device according to claim 1.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021194136 | 2021-11-30 | ||
| JP2021194136 | 2021-11-30 | ||
| PCT/JP2022/033330 WO2023100433A1 (en) | 2021-11-30 | 2022-09-05 | Character string output device |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2023100433A1 JPWO2023100433A1 (en) | 2023-06-08 |
| JPWO2023100433A5 JPWO2023100433A5 (en) | 2024-05-08 |
| JP7789084B2 true JP7789084B2 (en) | 2025-12-19 |
Family
ID=86611889
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023564743A Active JP7789084B2 (en) | 2021-11-30 | 2022-09-05 | String output device |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7789084B2 (en) |
| WO (1) | WO2023100433A1 (en) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009101837A1 (en) | 2008-02-13 | 2009-08-20 | Nec Corporation | Mark insertion device and mark insertion method |
| JP2017187797A (en) | 2017-06-20 | 2017-10-12 | 株式会社東芝 | Text generating apparatus, method, and program |
| JP6605105B1 (en) | 2018-10-15 | 2019-11-13 | 株式会社野村総合研究所 | Sentence symbol insertion apparatus and method |
| WO2021019965A1 (en) | 2019-07-31 | 2021-02-04 | 東洋紡株式会社 | Biaxially oriented polyester film |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3009642B2 (en) * | 1997-10-22 | 2000-02-14 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | Spoken language processing unit converter |
| US12400464B2 (en) * | 2020-04-02 | 2025-08-26 | Ntt Docomo, Inc. | System for dividing a character string in a machine translation process |
-
2022
- 2022-09-05 WO PCT/JP2022/033330 patent/WO2023100433A1/en not_active Ceased
- 2022-09-05 JP JP2023564743A patent/JP7789084B2/en active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2009101837A1 (en) | 2008-02-13 | 2009-08-20 | Nec Corporation | Mark insertion device and mark insertion method |
| JP2017187797A (en) | 2017-06-20 | 2017-10-12 | 株式会社東芝 | Text generating apparatus, method, and program |
| JP6605105B1 (en) | 2018-10-15 | 2019-11-13 | 株式会社野村総合研究所 | Sentence symbol insertion apparatus and method |
| WO2021019965A1 (en) | 2019-07-31 | 2021-02-04 | 東洋紡株式会社 | Biaxially oriented polyester film |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2023100433A1 (en) | 2023-06-08 |
| JPWO2023100433A1 (en) | 2023-06-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7222082B2 (en) | Recognition error correction device and correction model | |
| CN108549538B (en) | Code detection method and device, storage medium and test terminal | |
| US11994980B2 (en) | Method, device and computer program product for application testing | |
| US20140096027A1 (en) | Method and device for synchronizing a gui operation among machines using different languages | |
| JP7522060B2 (en) | Voice Recognition Device | |
| US20090018821A1 (en) | Language processing device, language processing method, and language processing program | |
| CN102955773B (en) | For identifying the method and system of chemical name in Chinese document | |
| WO2018186445A1 (en) | Dialogue system | |
| US20210312919A1 (en) | Conversation device | |
| US12248758B2 (en) | Generation device and normalization model | |
| US12400464B2 (en) | System for dividing a character string in a machine translation process | |
| JP7789084B2 (en) | String output device | |
| JP7682862B2 (en) | Punctuation deletion model learning device, punctuation deletion model and determination device | |
| CN110806896B (en) | Method for realizing internationalized information extraction in software development based on maven extension plug-in | |
| CN115658653B (en) | Method, device and medium for migrating data files to a target database | |
| JP2021136008A (en) | Method of tagging summary text, apparatus, device, and computer storage medium | |
| JP7477359B2 (en) | Writing device | |
| US20210142007A1 (en) | Entity identification system | |
| JP7836795B2 (en) | question generator | |
| WO2020054244A1 (en) | Conversation information generation device | |
| WO2023135963A1 (en) | Translation device | |
| JP7547077B2 (en) | Text translation device and translation model | |
| JP2022164001A (en) | Monolingual conversion device | |
| JP7601649B2 (en) | Voice synthesis adjustment device | |
| JP2018084939A (en) | Correction support program, correction support method, correction support device, and compiler |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240209 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240209 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250415 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250805 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250916 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20251202 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20251209 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7789084 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |