JP4535804B2 - Spoken dialogue sequence state notation method, program, and spoken dialogue apparatus - Google Patents
Spoken dialogue sequence state notation method, program, and spoken dialogue apparatus Download PDFInfo
- Publication number
- JP4535804B2 JP4535804B2 JP2004236510A JP2004236510A JP4535804B2 JP 4535804 B2 JP4535804 B2 JP 4535804B2 JP 2004236510 A JP2004236510 A JP 2004236510A JP 2004236510 A JP2004236510 A JP 2004236510A JP 4535804 B2 JP4535804 B2 JP 4535804B2
- Authority
- JP
- Japan
- Prior art keywords
- slot
- input
- state
- information
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
本発明は音声対話装置に関し、特に対話シーケンスの状態の表記方法に関する。 The present invention relates to a voice interaction device, and more particularly to a method for expressing a state of a conversation sequence.
従来のCTI(Computer Telephony Integration)などの音声対話システムでは、対話自体をプログラムとして記述する例が多い。各音声入力に対して、応答処理をコードで書き下ろすことにより、様々な記述が可能なのが特徴である。 In a speech dialogue system such as a conventional CTI (Computer Telephony Integration), there are many examples where the dialogue itself is described as a program. The feature is that various descriptions can be made by writing down the response process with a code for each voice input.
また、VoiceXML(eXtensible Markup Language)では、各状態毎にスクリプトを記述し、ブラウザがそれを解析することで、対話処理を行っている(非特許文献1)。VoiceXMLでは、可読性の高いXMLを活用することで、コンテンツ生産性の向上を狙っている。
音声ポータルやカーナビゲーション装置などのユビキタス環境からの情報アクセスにおいては、音声対話インタフェースが提供されることが多くなってきている。将来的に様々な音声サービスの追加や状況に応じた音声サービスの修正を適宜行うためには、音声対話シナリオ作成・修正の容易性が必要となる。しかし、従来の状態遷移を記述する技術では、音声入力に対する応答や状態遷移をプログラムとしてコーディングしていたり、VoiceXMLなどでは一状態毎にシナリオを書き下ろしているため、専門的なプログラミングスキルが必要であったり、一部の修正がプログラム全体に及ぼす影響を推定することが困難(些細なサービスの修正を行うために、プログラム全体の多数箇所の修正が必要)であったりした。 For information access from a ubiquitous environment such as a voice portal or a car navigation device, a voice dialogue interface is often provided. In order to add various voice services in the future and to modify voice services according to the situation as needed, it is necessary to facilitate the creation and correction of voice conversation scenarios. However, with the conventional technology for describing state transitions, response and state transitions to voice input are coded as programs, and VoiceXML and the like write down scenarios for each state, so specialized programming skills are required. , It was difficult to estimate the effect of some modifications on the entire program (in order to make minor service modifications, it was necessary to modify many parts of the entire program).
また、カーナビゲーション装置のように高速移動環境での利用においては、センタサーバとクライアント端末との回線が切断されることがある。従来のwebを用いたテレマティクスサービスでは、cookieを利用することでユーザIDなどのパラメータ保持を行ってはいるが、状態遷移の管理は行っておらず、再接続時にはメインメニュー(トップメニュー)から再び階層をたどることが必要となっている。また、CTIなどの音声対話システムにおいても、VoiceXMLなどを用いることによって記述の容易性は高めているが、依然、状態ごとにXMLファイルを切り替えているために再接続時の状態復帰を十分にサポートしているとは言い難い。 In addition, when used in a high-speed moving environment such as a car navigation device, the line between the center server and the client terminal may be disconnected. In the conventional telematics service using web, parameters such as user ID are retained by using cookie, but state transition is not managed, and when reconnecting, the main menu (top menu) is used again. It is necessary to follow. In addition, in voice dialogue systems such as CTI, the ease of description is enhanced by using VoiceXML, but since the XML file is still switched for each state, state restoration at reconnection is fully supported. It ’s hard to say.
本発明の目的は、シナリオの追加や修正が容易な、音声対話シーケンス状態表記方法および音声対話装置を提供することにある。 An object of the present invention is to provide a spoken dialogue sequence state notation method and a spoken dialogue apparatus in which scenarios can be easily added and modified.
本発明は、音声対話シーケンス(音声対話をある目的に利用するために、音声対話開始時から目的が達成された状態に至るまでの音声のやりとり)の状態を、目的を達成するために必要な情報が格納されているスロットの状態と一意に関連づけて表現するものである。 The present invention requires a state of a voice conversation sequence (speech exchange from the start of a voice conversation to a state where the purpose is achieved in order to use the voice conversation for a certain purpose) to achieve the purpose. The information is uniquely associated with the state of the slot in which the information is stored.
ここで、スロットの状態は、スロットの中に情報が格納されていない状態である「空スロット」、スロットの中に情報は格納されているが、該情報はユーザが確認して確定していない状態である「未確定スロット」、スロットの中に格納された情報がユーザに確認、確定された状態である「確定スロット」、複数のスロットに対してユーザが同時に音声入力を行なった際に、ユーザが認識結果が正しくないと言った場合に、各スロットの情報を確認中である「逐次確認中スロット」の4つの状態をとる。 Here, the state of the slot is “empty slot” in which no information is stored in the slot, and information is stored in the slot, but the information is not confirmed by the user. "Undetermined slot" which is the state, information stored in the slot is confirmed to the user, "confirmed slot" which is the confirmed state, when the user performs voice input simultaneously to a plurality of slots, When the user says that the recognition result is not correct, four states of “sequentially checking slot” in which information of each slot is being checked are taken.
音声対話シーケンスをスロット状態で表すことで、シナリオ追加や修正の容易性と、再接続時の状態復帰が可能となる。 By expressing the voice interaction sequence in the slot state, it is possible to easily add or modify a scenario and to return the state at the time of reconnection.
本発明では、音声対話シーケンスの状態を2ビット(=4状態)のスロット状態で表すことで、音声入力の受理可否を1ビットで記述可能、かつ遷移先状態もスロット状態で一意に確定する。従って、網羅性に優れ、状態遷移図に記述できる内容はすべて正常系であると共に、記述できない内容は受理しないため基本的に異常系という概念がなく、対話シーケンスの構築およびメンテナンスが非常に容易になると言う効果がある。 In the present invention, by expressing the state of the voice interaction sequence as a slot state of 2 bits (= 4 states), it is possible to describe the acceptability of the voice input by 1 bit, and the transition destination state is uniquely determined by the slot state. Therefore, it is excellent in completeness, and all the contents that can be described in the state transition diagram are normal systems, and contents that cannot be described are not accepted, so there is basically no concept of abnormal systems, and the construction and maintenance of dialog sequences is very easy. There is an effect to say.
また、本対話シーケンスは、スロット状態にのみ対話状態が依存するため、対話シーケンス名とスロット状態を保持するだけで、再開処理が可能となるため、複雑な再開処理やフロー再生を必要とせずに必要十分な再開処理の実装が容易になると言う効果がある。 In addition, since this dialog sequence depends only on the slot state, the restart process can be performed simply by holding the dialog sequence name and the slot state, so there is no need for complicated restart processing or flow playback. There is an effect that it becomes easy to implement necessary and sufficient restart processing.
次に、本発明の実施の形態について図面を参照して説明する。 Next, embodiments of the present invention will be described with reference to the drawings.
図1は本発明の一実施形態の音声対話装置の構成図である。本実施形態の音声対話装置はと音声入出力受付部1とデータ入出力受付部2とシナリオDB3と認識辞書DB4と音声認識部5とシナリオ解析部6を有している。
FIG. 1 is a block diagram of a voice interactive apparatus according to an embodiment of the present invention. The voice interaction apparatus of this embodiment includes a voice input /
音声入出力受付部2は、シナリオ解析部6から出力された音声ガイダンスをユーザの端末装置7に出力し、またユーザが音声ガイダンスに対して端末装置7から入力した音声入力を受付け、シナリオ解析部6に出力する。データ入出力受付部2はシナリオ解析部6から出力された対話シーケンス名とスロット状態をユーザの端末装置7に出力し、また音声対話シーケンスの再開時などに端末装置7から入力された対話シーケンス名とスロット状態をシナリオ解析部6に出力する。シナリオDB3には、シナリオ解析部6が音声対話を制御する際に用いる音声対話シナリオが音声対話シーケンス毎に格納されている、認識辞書DB4は、音声認識部5が音声認識する際に用いる認識文法を格納している。音声認識部5は、シナリオ解析部6から出力された音声に対して、シナリオ解析部6から指定された音声認識文法を用いて音声認識処理を行い、その認識結果をシナリオ解析部6に出力する。シナリオ解析部6は、音声ガイダンスを音声入出力受付部1に、対話シーケンス名とスロット状態(空スロット、未確定スロット、確定スロット、逐次確認中スロット)をデータ入出力受付部2に出力し、音声入出力受付部1からの該音声ガイダンスに対応するユーザの音声入力に対して、音声認識部5に指示して適切な音声認識文法にて音声認識処理を行わせ、その音声認識結果に応じてシナリオDB3中の音声対話シナリオの状態を遷移させると共に、音声対話再開時にはデータ入出力受付部2より出力された対話シーケンス名およびスロット状態によって音声対話を再開する。
The voice input /
[第1の実施形態]
シナリオ記述例
本発明のシナリオ記述例を図2に示す。
[First Embodiment]
Scenario Description Example FIG. 2 shows a scenario description example of the present invention.
以下、流れに沿って説明する。 Hereinafter, it demonstrates along a flow.
初期状態はシナリオが受け付け可能なスロット個数のXが並んだ状態とする。図2のシナリオでは、店舗の種類スロット数を2としているため、初期状態はXXとなる。音声入出力受付部1は、シナリオ記述のGuidanceに定義された文字列をガイダンスとしてユーザに対し読み上げ処理を行う。この状態で受理可能な入力に対してはシナリオ記述欄に1を、受理不能な入力に対してはシナリオ記述欄に0が記入されている。
The initial state is a state in which the number of slots X that can accept a scenario is arranged. In the scenario of FIG. 2, since the number of store type slots is 2, the initial state is XX. The voice input /
例えば、図2のシナリオにおいて、お店の種類として、「和食」「洋食」「中華」が受理可能であるとする。その場合、このシナリオが受理可能な入力と発声例との比較は下記の通りである。
SLa:和食
SLa SLa:和食か洋食
SLa NOT SLa:洋食ではなくて中華
NOT SLa:そうじゃなくて洋食
ANY:なんでもよい
YES:はい
NO:いいえ
初期状態XX
初期状態XXでは、音声入出力受付部1は「お店の入力は」というガイダンスを流し、Sec1_XX.bnfを音声認識部5にセットしてユーザの入力を待つ。なお、Sec1_XX.bnfは認識が受理可能な語彙をBNF文法によって記述したファイルのファイル名であり、例えば図3に示すような記述となる。図2に示すシナリオでは、初期状態XXにおいて受理可能な入力は欄に1が記入された入力であり、この場合は(SLa|SLa SLa|ANY)が受理可能となる。なお、「戻る」という入力については、シナリオ解析部6において前状態をスタック保持するため、シナリオに記述はせず、シナリオ解析部6において解析・処理される。
For example, in the scenario of FIG. 2, it is assumed that “Japanese food”, “Western food”, and “Chinese food” are acceptable as the types of shops. In that case, the comparison between the input that can be accepted by this scenario and the utterance example is as follows.
SLa: Japanese food SLa SLa: Japanese food or Western food SLa NOT SLa: Chinese food, not Western food SLA: Western food, ANY: Anything, YES: Yes NO: No Initial state XX
In the initial state XX, the voice input /
初期状態XXにおいて「和食」と入力された場合、Sec1_XX.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_和食”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[SLa]の入力がなされたとみなす。そして、音声認識部5からの返値の内容(カテゴリ“FOOD_”を除いたもの)によってスロットXの前方よりスロットを埋める。この場合、全てのスロットが空のため、一番目のスロットXに“和食”がセットされる。ここで、スロットXの“和食”は音声認識の誤認識などを考えるとユーザの確認が行われていない未確認入力の状態である。従って、一番目のスロットXはスロットYとなり、二番目のスロットXは変化がないため、状態YXに遷移することになる。
When “Japanese food” is input in the initial state XX, Sec1_XX. In accordance with bnf, the value {“FOOD_Japanese food”} is returned from the speech recognition unit 5 to the
また、初期状態XXにおいて「和食か洋食」と入力された場合、Sec1_XX.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_和食”,“OR”,“FOOD_洋食”}という値が返る。シナリオ解析部6は二つのスロットに対して入力があると判断し、[SLa SLa]の入力がなされたとみなす。そして、スロットXの前方よりスロットを埋める。この場合、全てのスロットが空のため、一番目のスロットXに“和食”が、二番目のスロットXに“洋食”がセットされる。ここで、スロットXの“和食”およびスロットXの“洋食”はユーザの確認が行われていない未確認入力の状態である。従って、一番目のスロットXはスロットYとなり、二番目のスロットXはスロットYとなり、状態YYに遷移することになる。
In addition, when “Japanese or Western food” is input in the initial state XX, Sec1_XX. According to bnf, the value {“FOOD_Japanese food”, “OR”, “FOOD_Western food”} is returned from the speech recognition unit 5 to the
また、初期状態XXにおいて「何でも良い」と入力された場合、Sec1_XX.bnfに従い、音声認識部5からシナリオ解析部6へは{“ANY”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[ANY]の入力がなされたと見なす。そして、スロットXの前方よりスロットを埋める。この場合、全てのスロットが空のため、一番目のスロットXに“ANY”がセットされる。ここで、スロットXの“ANY”は未確認入力の状態である。従って、一番目のスロットXはスロットYとなり、二番目のスロットXは変化がないため、状態としてスロットYXに遷移することになる。
Further, when “anything” is input in the initial state XX, Sec1_XX. In accordance with bnf, the value {“ANY”} is returned from the speech recognition unit 5 to the
状態YX
状態YXでは、一つのスロットが未確認情報で埋まった状態となる。そこで、未確認情報を確認し確定情報とする対話を行う。音声入出力受付部1は「入力は和食でよろしいですか」といったガイダンスを流し、Sec1_YX.bnfを音声認識部5にセットしてユーザの入力を待つ。図2に示すシナリオでは、状態YXにおいて受理可能な入力は欄に1が記入された入力であり、この場合は(SLa|SLa SLa|SLa NOT SLa|NOT SLa|ANY|YES|NO)が受理可能となる。
State YX
In the state YX, one slot is filled with unconfirmed information. Therefore, a dialogue is performed in which unconfirmed information is confirmed and confirmed. The voice input /
状態YXで「洋食」と入力された場合、Sec1_YX.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_洋食”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[SLa]の入力がなされたと見なす。現状のスロット状態はYXであるため、未確定または空のスロットの前方よりスロットを埋める。この場合、一番目のスロットYが未確定であり、既にスロットYに入っている値“和食”と異なった入力“洋食”受理されたため、スロットYの内容が“洋食”がセットされる。従って、スロット状態はYXとなり、同じ状態YXに戻り「入力は洋食でよろしいですか」というガイダンスとなる。
When “Western food” is input in the state YX, Sec1_YX. In accordance with bnf, the value {“FOOD_Western food”} is returned from the speech recognition unit 5 to the
なお、状態YXで「和食」と入力された場合、Sec1_YX.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_和食”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[SLa]の入力がなされたと見なす。現状のスロット状態はYXであるため、未確定または空のスロットの前方よりスロットを埋める。この場合、一番目のスロットYが未確定であり、既にスロットYに入っている値“和食”と同じ入力が受理されたため、スロットYの内容はそのまま“和食”がセットされ、同じ状態YXに戻り「入力は和食でよろしいですか」というガイダンスが繰り返されることになる。
When “Japanese food” is input in the state YX, Sec1_YX. In accordance with bnf, the value {“FOOD_Japanese food”} is returned from the speech recognition unit 5 to the
状態YXで「洋食か中華」と入力された場合、Sec1_YX.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_洋食”,“OR”,“FOOD_中華”}という値が返る。シナリオ解析部6は、二つのスロットに対して入力があると判断し、[SLa SLa]の入力がなされたと見なす。現状のスロット状態はYXであるため、未確定または空のスロットの前方よりスロットを埋める。この場合、一番目のスロットYが未確定であり、また入力“洋食”、“中華”とは異なった値“和食”がセットされているため、一番目のスロットYの内容が“洋食”がリセットされ、二番目のスロットXは空のため、スロットXの内容が“中華”にセットされる。従って、一番目のスロットYはスロットYとなり、二番目のスロットXはスロットYとなり、状態YYに遷移することになる。
When “Western food or Chinese” is input in the state YX, Sec1_YX. According to bnf, the value {“FOOD_Western food”, “OR”, “FOOD_Chinese”} is returned from the speech recognition unit 5 to the
また、状態YXで「和食か洋食」と入力された場合、Sec1_YX.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_和食”,“OR”,“FOOD_洋食”}という値が返る。シナリオ解析部6は、二つのスロットに対して入力があると判断し、[SLa SLa]の入力がなされたと見なす。現状のスロット状態はYXであるため、未確定または空のスロットの前方よりスロットを埋める。この場合、一番目のスロットYが未確定であり、また入力“和食”と同じ値がセットされているため、スロットYの内容は“和食”で保持され、二番目のスロットXは空のため、スロットXの内容が“洋食”にセットされる。従って、スロットYはスロットYとなり、スロットXはスロットYとなり、状態YYに遷移することになる。
In addition, when “Japanese or Western food” is input in the state YX, Sec1_YX. According to bnf, the value {“FOOD_Japanese food”, “OR”, “FOOD_Western food”} is returned from the speech recognition unit 5 to the
状態YXで、「和食ではなくて洋食」と入力された場合、Sec1_YX.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_和食”,“NOT”,“FOOD_洋食”}という値が返る。シナリオ解析部6は、一つのスロットに対して修正入力があると判断し、[SLa NOT SLa]の入力がなされたと見なす。現状のスロット状態はYXであるため、未確定のスロットYの値“和食”を参照し、それを修正入力値である“洋食”にリセットする。従って、スロットYはスロットYとなり、スロットXはそのままとなり、状態YXに遷移することになる。
In the state YX, when “Western food instead of Japanese food” is input, Sec1_YX. In accordance with bnf, the values {“FOOD_Japanese food”, “NOT”, “FOOD_Western food”} are returned from the speech recognition unit 5 to the
状態YXで、「そうじゃなくて洋食」と入力された場合、Sec1_YX.bnfに従い、音声認識部5からシナリオ解析部6へは{“NOT”,“FOOD_洋食”}という値が返る。シナリオ解析部6は、一つのスロットに対して修正入力があると判断し、[NOT SLa]の入力がなされたと見なす。現状のスロット状態はYXであるため、未確定のスロットYの値“和食”を参照し、それを修正入力値である“洋食”にリセットする。従って、スロットYはスロットYとなり、スロットXはそのままとなり、状態YXに遷移することになる。
In the state YX, when “Western food is not so” is entered, Sec1_YX. In accordance with bnf, the values {“NOT”, “FOOD_Western food”} are returned from the speech recognition unit 5 to the
状態YXで、「なんでもよい」と入力された場合、Sec1_YX.bnfに従い、音声認識部5からシナリオ解析部6へは{“ANY”}という値が返る。シナリオ解析部6は、一つのスロットに対して入力があると判断し、[ANY]の入力がなされたと見なす。現状のスロット状態はYXであるため、未確定のスロットYの値“和食”を参照し、入力値“ANY”と異なるためそれを修正入力値である“ANY”にリセットする。従って、スロットYはスロットYとなり、スロットXはそのままとなり、状態YXに遷移することになる。
When “anything” is input in the state YX, Sec1_YX. In accordance with bnf, the value {“ANY”} is returned from the speech recognition unit 5 to the
状態YXで、「はい」と入力された場合、Sec1_YX.bnfに従い、音声認識部5からシナリオ解析部6へは{“YES”}という値が返る。シナリオ解析部6は、確認ガイダンスに対して受諾意志の入力があると判断し、[YES]の入力がなされたと見なす。現状のスロット状態はYXであるため、未確定のスロットYの値が確定スロットXとなり、スロットXはそのままとなり、スロット状態はZXとなる。ここで、スロット数=2に対して、決定スロット=1が下回るため、この入力だけでよいか確認するシーケンスに遷移する。これは、ZXに遷移して良いか確認する(confirmation)ということから、状態ZXCとする。従って、状態YXで、「はい」と入力された場合、状態ZXCに遷移することになる。但し、受諾されたYが“ANY”の場合は、スロット状態をZZ={“ANY”,“ANY”}とし、Sec1_ZZ.scriptを実行する。
If “Yes” is input in the state YX, Sec1_YX. In accordance with bnf, the value {“YES”} is returned from the speech recognition unit 5 to the
状態YXで、「いいえ」と入力された場合、Sec1_YX.bnfに従い、音声認識部5からシナリオ解析部6へは{“NO”}という値が返る。シナリオ解析部6は、確認ガイダンスに対して拒否意志の入力があると判断し、[NO]の入力がなされたと見なす。現状のスロット状態はYXであるため、未確定のスロットYの値が空スロットXとなり、二番目のスロットXはそのままとなり、状態XXに遷移することになる。
When “No” is input in the state YX, Sec1_YX. In accordance with bnf, the value {“NO”} is returned from the speech recognition unit 5 to the
状態YY
状態YYでは、二つのスロットが未確認情報で埋まった状態となる。そこで、未確認情報を確認し確定情報とする対話を行う。音声入出力受付部1は「入力は和食と洋食でよろしいですか」といったガイダンスを流し、Sec1_YY.bnfを音声認識部5にセットしてユーザの入力を待つ。図2に示すシナリオでは、状態YYにおいて受理可能な入力は欄に1が記入された入力であり、この場合は(SLa|SLa SLa|SLa NOT SLa|NOT SLa|ANY|YES|NO)が受理可能となる。ここでは、状態YYの受理可能入力と状態YXの受理可能入力が完全に同一のため、認識文法はSec1_YX.bnfと同一となる。
State YY
In the state YY, the two slots are filled with unconfirmed information. Therefore, a dialogue is performed in which unconfirmed information is confirmed and confirmed. The voice input /
状態YYで「中華」と入力された場合、Sec1_YY.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_中華”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[SLa]の入力がなされたと見なす。現状のスロット状態はYYであるため、未確定スロットである一番目のYおよび二番目のYの値を抹消し、入力値“中華”によって前方よりスロットを埋める。従って、状態YXに遷移することとなる。
When “Chinese” is input in the state YY, Sec1_YY. In accordance with bnf, the value {“FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態YYで「洋食か中華」と入力された場合、Sec1_YY.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_洋食”,“OR”,“FOOD_中華”}という値が返る。シナリオ解析部6は二つのスロットに対して入力があると判断し、[SLa SLa]の入力がなされたと見なす。現状のスロット状態はYYであるため、未確定スロットである一番目のYおよび二番目のYの値を抹消し、入力値“洋食”と“中華”によって前方よりスロットを埋める。従って、同じ状態YYに遷移することとなる。
When “Western food or Chinese” is input in the state YY, Sec1_YY. According to bnf, the value {“FOOD_Western food”, “OR”, “FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態YYで「和食ではなくて中華」と入力された場合、Sec1_YY.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_和食”,“NOT”,“FOOD_中華”}という値が返る。シナリオ解析部6は一つのスロットに対して修正入力があると判断し、[SLa NOT SLa]の入力がなされたと見なす。現状のスロット状態はYYであるため、未確定スロットである一番目のYおよび二番目のYの値と修正対象入力“和食”の値を比較し、該当する一番目のスロットYの値を“中華”に変更する。また、二番目のスロットYの値は変更はない。従って、同じ状態YYに遷移することとなる。
When “Chinese food is not Japanese food” is input in the state YY, Sec1_YY. In accordance with bnf, the values {“FOOD_Japanese food”, “NOT”, “FOOD_Chinese”} are returned from the speech recognition unit 5 to the
状態YYで「そうではなくて中華」と入力された場合、Sec1_YY.bnfに従い、音声認識部5からシナリオ解析部6へは{“NOT”,“FOOD_中華”}という値が返る。シナリオ解析部6は修正入力があると判断し、[NOT SLa]の入力がなされたと見なす。現状のスロット状態はYYであるため、未確定スロットである一番目のYおよび二番目のYの値を抹消し、入力値“中華”によって前方よりスロットを埋める。従って、スロット状態はYXとなり、状態YXに遷移することとなる。
If “Chinese but not so” is input in the state YY, Sec1_YY. In accordance with bnf, the values {“NOT”, “FOOD_Chinese”} are returned from the speech recognition unit 5 to the
状態YYで「なんでもよい」と入力された場合、Sec1_YY.bnfに従い、音声認識部5からシナリオ解析部6へは{“ANY”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[ANY]の入力がなされたと見なす。現状のスロット状態はYYであるため、未確定スロットである一番目のYおよび二番目のYの値を抹消し、入力値“ANY”によって前方よりスロットを埋める。従って、スロット状態はYXとなり、状態YXに遷移することとなる。
When “anything” is input in the state YY, Sec1_YY. In accordance with bnf, the value {“ANY”} is returned from the speech recognition unit 5 to the
状態YYで「はい」と入力された場合、Sec1_YY.bnfに従い、音声認識部5からシナリオ解析部6へは{“YES”}という値が返る。シナリオ解析部6は確認ガイダンスに対して受諾意志の入力があると判断し、[YES]の入力がなされたと見なす。現状のスロット状態はYYであるため、一番目の未確定スロットYが確定スロットZになり、二番目の未確定スロットYが確定スロットZとなり、状態としては状態ZZに相当する。ここで、スロット数=2と同数のスロットが確定スロットとなったため、スロットを埋めるという、本対話シーケンスの目的は達成された。そこで、Sec1_ZZ.scriptに記述された処理を実行することとなる。
When “Yes” is input in the state YY, Sec1_YY. In accordance with bnf, the value {“YES”} is returned from the speech recognition unit 5 to the
状態YYで「いいえ」と入力された場合、Sec1_YY.bnfに従い、音声認識部5からシナリオ解析部6へは{“NO”}という値が返る。シナリオ解析部6は確認ガイダンスに対して拒否意志の入力があると判断し、[NO]の入力がなされたと見なす。現状のスロット状態はYYであり、複数の未確定スロットが存在するため、逐次確認処理に遷移する。そこで逐次確認状態をWと定義し、状態WWに遷移する。
When “No” is input in the state YY, Sec1_YY. In accordance with bnf, the value {“NO”} is returned from the speech recognition unit 5 to the
状態WW
状態WWでは、二つのスロットが要逐次確認情報で埋まった状態となる。そこで、未確認情報を逐次確認し確定情報とする対話を行う。音声入出力受付部1は「最初の入力は和食でよろしいですか」といったガイダンスを流し、Sec1_WW.bnfを音声認識部5にセットしてユーザの入力を待つ。図2に示すシナリオでは、状態WWにおいて受理可能な入力は欄に1が記入された入力であり、この場合は(SLa|SLa SLa|SLa NOT SLa|NOT SLa|ANY|YES|NO)が受理可能となる。ここでは、状態WWの受理可能入力と状態YXの受理可能入力が完全に同一のため、認識文法はSec1_YX.bnfと同一となる。
State WW
In the state WW, two slots are filled with necessary sequential confirmation information. Therefore, a dialogue is performed in which unconfirmed information is sequentially confirmed and confirmed. The voice input /
状態WWで「中華」と入力された場合、Sec1_WW.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_中華”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[SLa]の入力がなされたと見なす。現状のスロット状態はWWであるため、確認中の一番目の未確定スロットWの値“和食”を入力値“中華”によってリセットする。“中華”は未確定状態のため、再び確認するシーケンスに移ることとなり、状態WWに遷移することとなる。
When “Chinese” is input in the state WW, Sec1_WW. In accordance with bnf, the value {“FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態WWで「洋食か中華」と入力された場合、Sec1_WW.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_洋食”,“OR”,“FOOD_中華”}という値が返る。シナリオ解析部6は二つのスロットに対して入力があると判断し、[SLa SLa]の入力がなされたと見なす。現状のスロット状態はWWであるため、逐次確認中の一番目の未確定スロットWおよび二番目の未確定スロットWの値を抹消し、入力値“洋食”と“中華”によって前方よりスロットを埋める。従って、状態YYに遷移することとなる。
When “Western food or Chinese” is input in the state WW, Sec1_WW. According to bnf, the value {“FOOD_Western food”, “OR”, “FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態WWで「和食ではなくて中華」と入力された場合、Sec1_WW.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_和食”,“NOT”,“FOOD_中華”}という値が返る。シナリオ解析部6は一つのスロットに対して修正入力があると判断し、[SLa NOT SLa]の入力がなされたと見なす。現状のスロット状態はWWであるため、逐次確認中未の一番目の確定スロットWの値を“中華”に変更する。“中華”は未確定状態のため、再び確認するシーケンスに移ることとなり、状態WWに遷移することとなる。
In the state WW, when “Chinese instead of Japanese” is input, Sec1_WW. In accordance with bnf, the values {“FOOD_Japanese food”, “NOT”, “FOOD_Chinese”} are returned from the speech recognition unit 5 to the
状態WWで「そうではなくて中華」と入力された場合、Sec1_WW.bnfに従い、音声認識部5からシナリオ解析部6へは{“NOT”,“FOOD_中華”}という値が返る。シナリオ解析部6は修正入力があると判断し、[NOT SLa]の入力がなされたと見なす。現状のスロット状態はWWであるため、逐次確認中の一番目の未確定スロットWの値を抹消し、入力値“中華”によってスロットWを埋める。“中華”は未確定状態のため、再び確認するシーケンスに移ることとなり、状態WWに遷移することとなる。
When “Chinese but not so” is input in the state WW, Sec1_WW. In accordance with bnf, the values {“NOT”, “FOOD_Chinese”} are returned from the speech recognition unit 5 to the
状態WWで「なんでもよい」と入力された場合、Sec1_WW.bnfに従い、音声認識部5からシナリオ解析部6へは{“ANY”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[ANY]の入力がなされたと見なす。現状のスロット状態はWWであるため、逐次確認中の一番目の未確定スロットWを入力値“ANY”によってリセットする。従って、スロット状態はWWとなり、状態WWに遷移することとなる。
When “anything” is input in the state WW, Sec1_WW. In accordance with bnf, the value {“ANY”} is returned from the speech recognition unit 5 to the
状態WWで「はい」と入力された場合、Sec1_WW.bnfに従い、音声認識部5からシナリオ解析部6へは{“YES”}という値が返る。シナリオ解析部6は確認ガイダンスに対して受諾意志の入力があると判断し、[YES]の入力がなされたと見なす。現状のスロット状態はWWであるため、逐次確認中の一番目の未確定スロットWが確定スロットZになり、状態ZWに遷移することとなる。
When “Yes” is input in the state WW, Sec1_WW. In accordance with bnf, the value {“YES”} is returned from the speech recognition unit 5 to the
状態WWで「いいえ」と入力された場合、Sec1_WW.bnfに従い、音声認識部5からシナリオ解析部6へは{“NO”}という値が返る。シナリオ解析部6は確認ガイダンスに対して拒否意志の入力があると判断し、[NO]の入力がなされたと見なす。現状のスロット状態はWWであるため、逐次確認中の一番目の未確定スロットWが空スロットXになり、スロットの状態はXWとなるが、確定情報(Z)→未確認情報(Y,W)→空(X)、の順でスロットをソートするというルールに従い、XとWが入れ替わり、スロット状態はWXとなり状態WXに遷移することとなる。
When “No” is input in the state WW, Sec1_WW. In accordance with bnf, the value {“NO”} is returned from the speech recognition unit 5 to the
状態WX
状態WXでは、一つのスロットについて逐次確認を行う状態となる。音声入出力受付部1は「次の入力は洋食でよろしいですか」といったガイダンスを流し、Sec1_XW.bnfを音声認識部5にセットしてユーザの入力を待つ。シナリオでは、状態WXにおいて受理可能な入力は欄に1が記入された入力であり、この場合は(SLa|SLa SLa|SLa NOT SLa|NOT SLa|ANY|YES|NO)が受理可能となる。ここでは、状態WXの受理可能入力と状態YXの受理可能入力が完全に同一のため、認識文法はSec1_YX.bnfと同一となる。
State WX
In the state WX, one slot is sequentially confirmed. The voice input /
状態WXで「中華」と入力された場合、Sec1_XW.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_中華”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[SLa]の入力がなされたと見なす。現状のスロット状態はWXであるため、確認中の未確定スロットWの値“洋食”を入力値“中華”に変更する。従って、スロット状態はYXとなり、状態YXに遷移することとなる。
When “Chinese” is input in the state WX, Sec1_XW. In accordance with bnf, the value {“FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態WXで「洋食か中華」と入力された場合、Sec1_XW.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_洋食”,“OR”,“FOOD_中華”}という値が返る。シナリオ解析部6は二つのスロットに対して入力があると判断し、[SLa SLa]の入力がなされたと見なす。現状のスロット状態はWXであるため、逐次確認中未確定スロットWの値を抹消し、入力値“洋食”と“中華”によって前方よりスロットを埋める。従って、状態YYに遷移することとなる。
When “Western food or Chinese” is input in the state WX, Sec1_XW. According to bnf, the value {“FOOD_Western food”, “OR”, “FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態WXで「洋食ではなくて中華」と入力された場合、Sec1_XW.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_洋食”,“NOT”,“FOOD_中華”}という値が返る。シナリオ解析部6は一つのスロットに対して修正入力があると判断し、[SLa NOT SLa]の入力がなされたと見なす。現状のスロット状態はWXであるため、逐次確認中未確定スロットWの値と入力“洋食”を比較し、それを“中華”に変更する。従って、スロット状態はYXとなり、状態YXに遷移することとなる。
When “Chinese instead of Western food” is input in the state WX, Sec1_XW. According to bnf, the value {“FOOD_Western food”, “NOT”, “FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態WXで「そうではなくて中華」と入力された場合、Sec1_XW.bnfに従い、音声認識部5からシナリオ解析部6へは{“NOT”,“FOOD_中華”}という値が返る。シナリオ解析部6は修正入力があると判断し、[NOT SLa]の入力がなされたと見なす。現状のスロット状態はWXであるため、逐次確認中未確定スロットWの値を抹消し、入力値“中華”によってスロットWを埋める。従って、スロット状態はYXとなり、状態YXに遷移することとなる。
When “Chinese but not so” is input in the state WX, Sec1_XW. In accordance with bnf, the values {“NOT”, “FOOD_Chinese”} are returned from the speech recognition unit 5 to the
状態WXで「なんでもよい」と入力された場合、Sec1_XW.bnfに従い、音声認識部5からシナリオ解析部6へは{“ANY”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[ANY]の入力がなされたと見なす。現状のスロット状態はWXであるため、逐次確認中の未確定スロットWの値を抹消し、入力値“ANY”によってスロットを埋める。従って、スロット状態はYXとなり、状態YXに遷移することとなる。
When “anything” is input in the state WX, Sec1_XW. In accordance with bnf, the value {“ANY”} is returned from the speech recognition unit 5 to the
状態WXで「はい」と入力された場合、Sec1_XW.bnfに従い、音声認識部5からシナリオ解析部6へは{“YES”}という値が返る。シナリオ解析部6は確認ガイダンスに対して受諾意志の入力があると判断し、[YES]の入力がなされたと見なす。現状のスロット状態はWXであるため、逐次確認中の未確定スロットWが確定スロットZになり、スロット状態はZXとなる。ここで、二つの入力可能スロット数に対して、それ未満のスロットが確定した状態となる、そこで、状態YXにおいて「はい」と入力された場合と同様に、この入力だけでよいか確認するシーケンスに遷移する。これは、ZXに遷移して良いか確認する(confirmation)ということから、状態ZXCとする。従って、状態WXで、「はい」と入力された場合、状態ZXCに遷移することとなる。
When “Yes” is input in the state WX, Sec1_XW. In accordance with bnf, the value {“YES”} is returned from the speech recognition unit 5 to the
状態WXで「いいえ」と入力された場合、Sec1_XW.bnfに従い、音声認識部5からシナリオ解析部6へは{“NO”}という値が返る。シナリオ解析部6は確認ガイダンスに対して拒否意志の入力があると判断し、[NO]の入力がなされたと見なす。現状のスロット状態はWXであるため、逐次確認中の未確定スロットWが空スロットXになり、状態XXに遷移することとなる。
When “No” is input in the state WX, Sec1_XW. In accordance with bnf, the value {“NO”} is returned from the speech recognition unit 5 to the
状態ZW
状態ZWでは、一つのスロットについて逐次確認を行う状態となる。音声入出力受付部1は「次の入力は洋食でよろしいですか」といったガイダンスを流し、Sec1_ZW.bnfを音声認識部5にセットしてユーザの入力を待つ。図2に示すシナリオでは、状態ZWにおいて受理可能な入力は欄に1が記入された入力であり、この場合は(SLa|SLa NOT SLa|NOT SLa|ANY|YES|NO)が受理可能となる。
State ZW
In the state ZW, it becomes a state in which confirmation is sequentially performed for one slot. The voice input /
状態ZWで「中華」と入力された場合、Sec1_ZW.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_中華”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[SLa]の入力がなされたと見なす。現状のスロット状態はZWであるため、確認中の未確定スロットWの値“洋食”を入力値“中華”に変更する。従って、状態ZWに遷移することとなる。
When “Chinese” is input in the state ZW, Sec1_ZW. In accordance with bnf, the value {“FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態ZWで「洋食ではなくて中華」と入力された場合、Sec1_ZW.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_洋食”,“NOT”,“FOOD_中華”}という値が返る。シナリオ解析部6は一つのスロットに対して修正入力があると判断し、[SLa NOT SLa]の入力がなされたと見なす。現状のスロット状態はZWであるため、逐次確認中未確定スロットWの値と入力“洋食”を比較し、それを“中華”に変更する。従って、状態ZWに遷移することとなる。
When “Chinese instead of Western food” is input in the state ZW, Sec1_ZW. According to bnf, the value {“FOOD_Western food”, “NOT”, “FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態ZWで「そうではなくて中華」と入力された場合、Sec1_ZW.bnfに従い、音声認識部5からシナリオ解析部6へは{“NOT”,“FOOD_中華”}という値が返る。シナリオ解析部6は修正入力があると判断し、[NOT SLa]の入力がなされたと見なす。現状のスロット状態はZWであるため、逐次確認中未確定スロットWの値を抹消し、入力値“中華”によってスロットWを埋める。従って状態ZWに遷移することとなる。
When “Chinese but not so” is input in the state ZW, Sec1_ZW. In accordance with bnf, the values {“NOT”, “FOOD_Chinese”} are returned from the speech recognition unit 5 to the
状態ZWで「なんでもよい」と入力された場合、Sec1_XW.bnfに従い、音声認識部5からシナリオ解析部6へは{“ANY”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[ANY]の入力がなされたと見なす。現状のスロット状態はZWであるため、逐次確認中未確定スロットWの値を抹消し、入力値“ANY”によってスロットWを埋める。従って状態ZWに遷移することとなる。
When “anything” is input in the state ZW, Sec1_XW. In accordance with bnf, the value {“ANY”} is returned from the speech recognition unit 5 to the
状態ZWで「はい」と入力された場合、Sec1_ZW.bnfに従い、音声認識部5からシナリオ解析部6へは{“YES”}という値が返る。シナリオ解析部6は確認ガイダンスに対して受諾意志の入力があると判断し、[YES]の入力がなされたと見なす。現状のスロット状態はZWであるため、逐次確認中の未確定スロットWが確定スロットZになり、スロット状態はZZとなり、状態としては状態ZZに相当する。ここで、スロット数=2と同数のスロットが確定スロットとなったため、スロットを埋めるという、本対話シーケンスの目的は達成された。そこで、Sec1_ZZ.scriptに記述された処理を実行することとなる。
When “Yes” is input in the state ZW, Sec1_ZW. In accordance with bnf, the value {“YES”} is returned from the speech recognition unit 5 to the
状態ZWで「いいえ」と入力された場合、Sec1_ZW.bnfに従い、音声認識部5からシナリオ解析部6へは{“NO”}という値が返る。シナリオ解析部6は確認ガイダンスに対して拒否意志の入力があると判断し、[NO]の入力がなされたと見なす。現状のスロット状態はZWであるため、逐次確認中の未確定スロットWが空スロットXになる。従って、スロット状態はZXとなり二つの入力可能スロット数に対して、それ未満のスロットが確定した状態となる。そこで、状態YXにおいて「はい」と入力された場合と同様に、この入力だけでよいか確認するシーケンスに遷移する。これは、ZXに遷移して良いか確認する(confirmation)ということから、状態ZXCとする。従って、状態XWで、「はい」と入力された場合、状態ZXCに遷移することになる。
When “No” is input in the state ZW, Sec1_ZW. In accordance with bnf, the value {“NO”} is returned from the speech recognition unit 5 to the
状態ZXC
状態ZXCでは、入力可能スロット数未満のスロットが確定された場合に、確定された情報だけで本対話シーケンスを完了するかどうか確認を行う状態となる。音声入出力受付部1は「入力は和食だけでよろしいですか」といったガイダンスを流し、Sec1_ZXC.bnfを音声認識部5にセットしてユーザの入力を待つ。図2に示すシナリオでは、状態ZXCにおいて受理可能な入力は欄に1が記入された入力であり、この場合は(YES|NO)が受理可能となる。
State ZXC
In the state ZXC, when slots less than the number of slots that can be input are confirmed, it is confirmed whether or not the present dialogue sequence is completed only by the confirmed information. The voice input /
状態ZXCで「はい」と入力された場合、Sec1_ZXC.bnfに従い、音声認識部5からシナリオ解析部6へは{“YES”}という値が返る。シナリオ解析部6は確認ガイダンスに対して受諾意志の入力があると判断し、[YES]の入力がなされたと見なす。現状のスロット状態はZXCであるため、本対話シーケンスの目的は達成されたと見なし、Sec1_ZZ.scriptに記述された処理を実行することとなる。
When “Yes” is input in the state ZXC, Sec1_ZXC. In accordance with bnf, the value {“YES”} is returned from the speech recognition unit 5 to the
状態ZXCで「いいえ」と入力された場合、Sec1_ZXC.bnfに従い、音声認識部5からシナリオ解析部6へは{“NO”}という値が返る。シナリオ解析部6は確認ガイダンスに対して拒否意志の入力があると判断し、[NO]の入力がなされたと見なす。現状のスロット状態はZXCであるため、未確定の空スロットXを確定するシーケンスに移行する。すなわち、状態ZXCで「いいえ」が入力された場合、状態ZXに遷移することになる。
When “NO” is input in the state ZXC, Sec1_ZXC. In accordance with bnf, the value {“NO”} is returned from the speech recognition unit 5 to the
状態ZX
状態ZXでは、入力可能スロット数未満のスロットが確定された場合に、残りの空スロットに情報を入力する状態となる。音声入出力受付部1は「もう一つのお店の種類は」といったガイダンスを流し、Sec1_ZX.bnfを音声認識部5にセットしてユーザの入力を待つ。図2に示すシナリオでは、状態ZXにおいて受理可能な入力は欄に1が記入された入力であり、この場合は(SLa|ANY)が受理可能となる。
State ZX
In the state ZX, when slots less than the number of slots that can be input are determined, information is input to the remaining empty slots. The voice input /
状態ZXで「中華」と入力された場合、Sec1_ZX.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_中華”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[SLa]の入力がなされたと見なす。現状のスロット状態はZXであるため、空スロットXに入力値“中華”を格納する。従って、状態ZYに遷移することとなる。
When “Chinese” is input in the state ZX, Sec1_ZX. In accordance with bnf, the value {“FOOD_Chinese”} is returned from the speech recognition unit 5 to the
状態ZXで「なんでもよい」と入力された場合、Sec1_ZX.bnfに従い、音声認識部5からシナリオ解析部6へは{“ANY”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[ANY]の入力がなされたと見なす。現状のスロット状態はZXであるため、空スロットXの値を抹消し、入力値“ANY”によってスロットを埋める。従って、状態ZYに遷移することとなる。
When “anything” is input in the state ZX, Sec1_ZX. In accordance with bnf, the value {“ANY”} is returned from the speech recognition unit 5 to the
状態ZY
状態ZYでは、入力可能スロット数未満のスロットが確定された場合に、残りの空スロットに入力された情報を確認する状態となる。音声入出力受付部1は「中華でよろしいですか」といったガイダンスを流し、Sec1_ZY.bnfを音声認識部5にセットしてユーザの入力を待つ。図2に示すシナリオでは、状態ZYにおいて受理可能な入力は欄に1が記入された入力であり、この場合は(SLa|SLa NOT SLa|NOT SLa|ANY|YES|NO)が受理可能となる。
State ZY
In the state ZY, when slots less than the number of slots that can be input are determined, the information input to the remaining empty slots is checked. The voice input /
状態ZYで「洋食」と入力された場合、Sec1_ZY.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_洋食”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[SLa]の入力がなされたと見なす。現状のスロット状態はZYであるため、未確定スロットYの値を入力値“洋食”に変更する。従って、同じ状態ZYに遷移することとなる。
When “Western food” is input in the state ZY, Sec1_ZY. In accordance with bnf, the value {“FOOD_Western food”} is returned from the speech recognition unit 5 to the
状態ZYで「中華ではなくて洋食」と入力された場合、Sec1_ZY.bnfに従い、音声認識部5からシナリオ解析部6へは{“FOOD_中華”,“NOT”,“FOOD_洋食”}という値が返る。シナリオ解析部6は一つのスロットに対して修正入力があると判断し、[SLa NOT SLa]の入力がなされたと見なす。現状のスロット状態はZYであるため、修正対象“中華”に該当する未確定スロットYの値を入力値“洋食”に変更する。従って、同じ状態ZYに遷移することとなる。
When “Western food instead of Chinese” is input in the state ZY, Sec1_ZY. According to bnf, the value {“FOOD_Chinese”, “NOT”, “FOOD_Western food”} is returned from the speech recognition unit 5 to the
状態ZYで「そうではなくて洋食」と入力された場合、Sec1_ZY.bnfに従い、音声認識部5からシナリオ解析部6へは{“NOT”,“FOOD_洋食”}という値が返る。シナリオ解析部6は一つのスロットに対して修正入力があると判断し、[NOT SLa]の入力がなされたと見なす。現状のスロット状態はZYであるため、未確定スロットYの値を入力値“洋食”に変更する。従って、同じ状態ZYに遷移することとなる。
When “Western food is not so” is input in the state ZY, Sec1_ZY. In accordance with bnf, the values {“NOT”, “FOOD_Western food”} are returned from the speech recognition unit 5 to the
状態ZYで「なんでもよい」と入力された場合、Sec1_ZY.bnfに従い、音声認識部5からシナリオ解析部6へは{“ANY”}という値が返る。シナリオ解析部6は一つのスロットに対して入力があると判断し、[ANY]の入力がなされたと見なす。現状のスロット状態はZYであるため、未確定スロットYの値を抹消し、入力値“ANY”によってスロットを埋める。従って、同じ状態ZYに遷移することとなる。
When “anything” is input in the state ZY, Sec1_ZY. In accordance with bnf, the value {“ANY”} is returned from the speech recognition unit 5 to the
状態ZYで「はい」と入力された場合、Sec1_ZY.bnfに従い、音声認識部5からシナリオ解析部6へは{“YES”}という値が返る。シナリオ解析部6は確認ガイダンスに対して受諾意志の入力があると判断し、[YES]の入力がなされたと見なす。現状のスロット状態はZYであるため、スロット状態はZZとなり本対話シーケンスの目的は達成されたと見なし、Sec1_ZZ.scriptに記述された処理を実行することとなる。但し、受諾されたYが以下の場合には異なる処理が行われる。
・Y=Zの場合
スロット内容がマージされるため、スロット状態はZXとなる。従って、入力可能スロット数未満のスロットが確定した状態となり、状態ZXCに遷移することとなる。
・Y=“ANY”の場合
確定済みのZと内容が競合するが、確定済みの内容を優先するとし、Z=“和食”であった場合、スロット状態をZZ={“和食”,''''}とし、Sec1_ZZ.scriptを実行する。
When “Yes” is input in the state ZY, Sec1_ZY. In accordance with bnf, the value {“YES”} is returned from the speech recognition unit 5 to the
When Y = Z, the slot contents are merged, so the slot state is ZX. Therefore, a slot less than the number of slots that can be input is determined, and the state transits to the state ZXC.
・ When Y = “ANY”, the content of the confirmed Z conflicts with the content of the confirmed Z. However, when the confirmed content is prioritized, and Z = “Japanese food”, the slot state is changed to ZZ = {“Japanese food”, ” ''} And Sec1_ZZ. Run script.
状態ZYで「いいえ」と入力された場合、Sec1_ZY.bnfに従い、音声認識部5からシナリオ解析部6へは{“NO”}という値が返る。シナリオ解析部6は確認ガイダンスに対して拒否意志の入力があると判断し、[NO]の入力がなされたと見なす。現状のスロット状態はZYであるため、未確定スロットYが空スロットXとなる。従って、入力可能スロット数未満のスロットが確定した状態となり、状態ZXCに遷移することとなる。
If “NO” is input in the state ZY, Sec1_ZY. In accordance with bnf, the value {“NO”} is returned from the speech recognition unit 5 to the
Sec1_ZZ.scriptについて
Sec1_ZZ.scriptは、対話シーケンスSec1が完了した場合に実行されるスクリプトである。ここには、検索処理実行方法や、検索後に起動する対話シーケンス名が記載される。Sec1_ZZ.scriptの記述例を図4に示す。例えば、対話シーケンス(Sec1)にて、“和食”と“洋食”が確定した場合、DBアクセスとして、“select * from table where SLa=“和食”|SLa=“洋食””というSQLが呼ばれ、その返値の配列@Resultが次の対話シーケンス(Sec2)に渡され、Sec2が起動される。
Sec1_ZZ. About Sec1_ZZ. The script is a script that is executed when the dialogue sequence Sec1 is completed. Here, a search processing execution method and a dialog sequence name to be started after the search are described. Sec1_ZZ. An example of script description is shown in FIG. For example, when “Japanese food” and “Western food” are confirmed in the dialogue sequence (Sec1), SQL of “select * from table where SLa =“ Japanese food ”| SLa =“ Western food ”” is called as DB access, The returned array @Result is passed to the next interactive sequence (Sec2), and Sec2 is activated.
[第2の実施形態]
切断・再開処理の実施形態について説明する。
[Second Embodiment]
An embodiment of the disconnection / resumption process will be described.
本発明の対話シーケンスはスロット状態にのみ依存するため、スロットの状態を指定することで中断復帰の動作は容易に実施可能となる。 Since the dialogue sequence of the present invention depends only on the slot state, the interruption / return operation can be easily performed by designating the slot state.
例えば、状態YYにおいて、{“和食”,“洋食”}が入力され、その確認ガイダンス中(「和食と洋食でよろしいですか」)の状態で中断された場合、端末装置7は対話シーケンス名Sec1と状態YYおよび{“和食”,“洋食”}を記憶する。接続再開時に、端末装置7は音声対話装置に対し、対話シーケンス名Sec1と状態YYおよび{“和食”,“洋食”}を送信する。音声対話装置のシナリオ解析部6は対話シーケンスSec1を状態YYおよびスロット値{“和食”,“洋食”}で呼び出して実行することで、切断前の状態に復帰可能となる。
For example, in the state YY, when {"Japanese food", "Western food"} is input and the confirmation guidance is interrupted ("Are you sure you want Japanese food and Western food?"), The
[第3の実施形態]
複数種別のスロットが存在する場合の実施形態を説明する。
[Third Embodiment]
An embodiment in the case where there are multiple types of slots will be described.
例えば、駐車場検索において、現在地からの距離と料金を用いて「800m以内で500円/H以下」といった検索する場合を考える。この場合、距離と料金は別カテゴリの入力となるため、それぞれに対して別の入力ID、SLaおよびSLbを付与すると共に、カテゴリ毎に利用可能なスロット数を指定する。図6に示すシナリオ例では、SLa{DISTANCE}=1,SLb{PRICE}=1となる。複数カテゴリ、複数スロットであれば、SLa=2,SLb=1,SLc=3となり、初期状態はXXXXXXと表記されることとなる。 For example, in the parking lot search, consider a case where a search such as “500 yen / H or less within 800 m” is performed using the distance from the current location and the fee. In this case, since the distance and the charge are input in different categories, different input IDs, SLa and SLb are assigned to the respective categories, and the number of slots available for each category is designated. In the example scenario shown in FIG. 6, SLa {DISTANCE} = 1 and SLb {PRICE} = 1. In the case of a plurality of categories and a plurality of slots, SLa = 2, SLb = 1, and SLc = 3, and the initial state is expressed as XXXXXX.
駐車場検索における状態遷移表例の一部を図6に示す。距離および料金はそれぞれ0以上1未満のスロットに対して入力可能であるため、初期状態はXXとなる。 A part of the state transition table example in the parking lot search is shown in FIG. Since the distance and fee can be input to slots of 0 or more and less than 1, respectively, the initial state is XX.
状態XX
初期状態XXでは、「距離または料金は」というガイダンスを流し、図7に示すSec2_XX.bnfを音声認識部5にセットしてユーザの入力を待つ。
State XX
In the initial state XX, the guidance “Distance or fee is” is played, and Sec2_XX. bnf is set in the voice recognition unit 5 to wait for user input.
初期状態XXにおいて「800m以内」と入力された場合、Sec2_XX.bnfに従い、音声認識部5からシナリオ解析部6へは{“DISTANCE_800m”}という値が返る。シナリオ解析部6は距離に関する一つのスロットに対して入力があると判断し、[SLa]の入力がなされたとみなす。そして、スロットXの前方よりスロットを埋める。この場合は、距離に関する一番目のスロットXに“800m”がセットされ、スロット状態はYとなる。従って、状態YXに遷移することになる。
When “within 800 m” is input in the initial state XX, Sec2_XX. In accordance with bnf, the value {“DISTANCE_800m”} is returned from the speech recognition unit 5 to the
初期状態XXにおいて、「500円以下」と入力された場合、Sec2_XX.bnfに従い、音声認識部5からシナリオ解析部6へは{“PRICE_500円”}という値が返る。シナリオ解析部6は料金に関する一つのスロットに対して入力があると判断し、[SLb]の入力がなされたとみなす。そして、料金に関する二番目のスロットXの前方よりスロットを埋める。この場合は、スロットXbに“800m”がセットされ、スロット状態はYとなる。従って、状態XYに遷移することになる。
When “500 yen or less” is input in the initial state XX, Sec2_XX. In accordance with bnf, the value {“PRICE_500 yen”} is returned from the speech recognition unit 5 to the
初期状態XXにおいて、「800m以内で500円以下」と入力された場合、Sec2_XX.bnfに従い、音声認識部5からシナリオ解析部6へは{“DISTANCE_800m”,“PRICE_500円”}という値が返る。シナリオ解析部6は距離と料金に関してそれぞれ一つのスロットに対して入力があると判断し、[SLa SLb]の入力がなされたとみなす。そして、距離に関する一番目のスロットXの前方より距離に関する入力値“800m”を埋め、料金に関する二番目のスロットXの前方より料金に関する入力値“500円”を埋める。従って、状態YYに遷移することになる。その後の処理ルールは第1の実施形態と同様のルールに従う。
In the initial state XX, when “500 yen or less within 800 m” is input, Sec2_XX. In accordance with bnf, the value {“DISTANCE_800 m”, “PRICE_500 yen”} is returned from the speech recognition unit 5 to the
[第4の実施形態]
受理可能な入力はシナリオ毎に設定されるものであり、図2や図6に示したものの他に、以下のような入力も考えられる。
・[SLa SLa NOT SLa SLa]
2つのスロットに{“和食”,“洋食”}が入っているYY状態において、「和食と洋食ではなくて中華とイタリア料理」という入力がこれに相当する。
・[NOT SLa SLa]
2つのスロットに{“和食”,“洋食”}が入っているYY状態において、「そうではなくて中華かイタリア料理」という入力がこれに相当する。
[Fourth Embodiment]
Acceptable inputs are set for each scenario, and in addition to those shown in FIGS. 2 and 6, the following inputs are also conceivable.
・ [SLa SLa NOT SLa SLa]
In the YY state in which {"Japanese food", "Western food"} is in two slots, the input "Chinese and Italian food, not Japanese food and Western food" corresponds to this.
・ [NOT SLa SLa]
In the YY state in which {"Japanese food", "Western food"} is contained in the two slots, the input “Chinese or Italian food instead” corresponds to this.
[第5の実施形態]
図2や図6で示したシナリオ例では、「和食でよろしいですか」や「洋食だけでよろしいですか」といった確認シーケンスが含まれている。しかし、シナリオが使われる状況によっては、これら確認シーケンスをスキップすることが必要となる場合もある。その場合は、図8に示す状態に対してSkip属性を付与する。シナリオ解析部6はSkip属性を持つ状態に対して、スロットYはZとして確定させると共に、ZXCのようにCを持つ状態についてはZXに無条件に遷移させる。
[Fifth Embodiment]
The scenario examples shown in FIGS. 2 and 6 include a confirmation sequence such as “Are you sure you want Japanese food?” Or “Are you sure you want only Western food?” However, depending on the situation in which the scenario is used, it may be necessary to skip these confirmation sequences. In that case, a Skip attribute is assigned to the state shown in FIG. The
[第6の実施形態]
図2に示したシナリオ例では、入力可能なスロット数より少ないスロット数が確定した状態で、確定スロットだけで検索など次の処理に進むか確認するZXCなどの状態では、「Slot[1]だけでOK」というガイダンスにより、[YES]であればシナリオ完了と見なし、[NO]であれば、不足スロットを入力する状態(ZX)に遷移する。しかし、ガイダンスとして、「もう一つの条件を入力しますか」といったものを設定した場合、[YES]、[NO]の持つ意味が正反対となる。そこで、[YES]、[NO]に関してZXCと正反対の遷移先となるZXDを定義する。
[Sixth Embodiment]
In the scenario example shown in FIG. 2, in a state such as ZXC in which the number of slots smaller than the number of slots that can be input is confirmed and whether to proceed to the next processing such as search using only the confirmed slots, only “Slot [1]” According to the guidance “OK”, the scenario is considered to be complete if it is [YES], and transitions to a state (ZX) in which an insufficient slot is input if it is [NO]. However, when a guidance such as “Do you want to input another condition” is set, the meanings of [YES] and [NO] are opposite. Therefore, ZXD, which is the opposite destination of ZXC with respect to [YES] and [NO], is defined.
YXなどで[YES]入力でYが確定した場合、シナリオ解析部6は最初に状態ZXCを検索し、見つからない場合には状態ZXDを検索する。状態ZXDにおいては、[YES]入力が状態ZXへの遷移を意味し、[NO]入力が状態ZZと同様に次の処理に進むことを意味する。
When Y is confirmed by inputting [YES] in YX or the like, the
なお、本発明は専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムを、コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するものであってもよい。コンピュータ読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間の間、動的にプログラムを保持するもの(伝送媒体もしくは伝送波)、その場合のサーバとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含む。 In addition to what is implemented by dedicated hardware, the present invention records a program for realizing the function on a computer-readable recording medium, and the program recorded on the recording medium is stored in a computer system. It may be read and executed. The computer-readable recording medium refers to a recording medium such as a flexible disk, a magneto-optical disk, and a CD-ROM, and a storage device such as a hard disk device built in a computer system. Furthermore, a computer-readable recording medium is a server that dynamically holds a program (transmission medium or transmission wave) for a short period of time, as in the case of transmitting a program via the Internet, and a server in that case. Some of them hold programs for a certain period of time, such as volatile memory inside computer systems.
1 音声入出力受付部
2 データ入出力受付部
3 シナリオDB
4 認識辞書DB
5 音声認識部
6 シナリオ解析部
7 端末装置
1 Voice input /
4 recognition dictionary DB
5
Claims (9)
ユーザとの音声対話で所定の目的を達成するために必要な各情報に対してスロットを割り当て、
音声対話開始から所定の目的の達成に至るまでの各音声入力に応じて各スロットに情報を格納するとともに、
情報が格納されていない状態である空スロット、情報は格納されているが、該情報はユーザが確認して確定していない状態である未確定スロット、情報が格納されており、該情報がユーザに確認、確定された状態である確定スロット、複数の未確定スロットがある場合で、各未確定スロットに格納された情報が正しいか否かのユーザの確認結果が否である場合に、各未確定スロットのそれぞれに対して設定される、当該未確定スロットの情報を確認中である逐次確認中スロットの4つの状態で前記各スロットの状態を管理することにより、音声対話シーケンスの状態をスロット状態と一意に関連づけて表現し、
前記各未確定スロットに対して設定された各逐次確認中スロットのそれぞれについて、当該逐次確認中スロットの情報がユーザに確認、確定された場合は、当該逐次確認中スロットから前記確定スロットへの状態遷移を行い、当該逐次確認中スロットの情報の修正情報が入力された場合で、該修正情報が複数の別の情報である場合は、該別の情報を別々に格納した複数の逐次確認中スロットをそれぞれ前記未確定スロットへ状態遷移させ、該修正情報が1つの別の情報である場合は、該別の情報を当該逐次確認中スロットに格納して、ユーザによる確認待ちの状態を維持する、
音声対話シーケンス状態表記方法。 A voice dialogue sequence state expression method performed in a voice dialogue device,
Assign slots for each piece of information needed to achieve a given goal in a voice conversation with the user,
Information is stored in each slot according to each voice input from the start of voice dialogue to the achievement of a predetermined purpose,
Information is empty slots is a state that is not stored, but information is stored, the information is unconfirmed slot is in a state that is not determined to confirm the user information is stored,該情 When there is a confirmed slot and a plurality of unconfirmed slots in which the information has been confirmed and confirmed to the user, and the user confirmation result of whether or not the information stored in each unconfirmed slot is correct , is set for each of the undetermined slot, by managing the status of each slot in the four states of the sequential verify the slot is being confirmed information of the undetermined slot, the voice interaction sequence status the expressed in association with the unique and slot state,
For each sequentially confirmed slot set for each unconfirmed slot, if the information of the sequentially confirmed slot is confirmed and confirmed to the user, the status from the sequentially confirmed slot to the confirmed slot When the correction information of the information of the slot being sequentially confirmed is input and the correction information is a plurality of other information, a plurality of slots being sequentially confirmed in which the other information is stored separately , Each state is changed to the unconfirmed slot, and when the correction information is one piece of other information, the other information is stored in the sequential confirmation slot, and the state waiting for confirmation by the user is maintained.
Spoken dialogue sequence state notation method.
ユーザに対して音声ガイダンスを出力し、またユーザから該音声ガイダンスに応答した音声入力を受付ける音声入出力受付部と、
入力された対話シーケンス名とスロット状態をユーザに出力し、また音声対話シーケンスの再開時にユーザから入力された対話シーケンス名とスロット状態を受付けるデータ入出力受付部と、
音声対話を制御する際に用いる音声対話シナリオを音声対話シーケンスごとに格納しているシナリオDBと、
音声認識文法を格納している認識辞書DBと、
入力された音声に対して、前記認識辞書DBに格納されている、指定された音声認識文法を用いて音声認識処理を行ない、その音声認識結果を出力する音声認識部と、
対話シーケンス名とスロット状態を前記データ入出力受付部に出力し、前記音声ガイダンスに対応して前記音声入出力部に入力された、ユーザの音声入力に対して前記音声認識部に、指示した音声認識文法にて音声認識処理を行なわせ、その音声認識結果に応じて、前記シナリオDBに格納されている音声対話シナリオの状態を遷移させると共に、音声対話再開時には前記データ入出力受付部より出力された対話シーケンス名およびスロット状態によって音声対話を再開するシナリオ解析部と、を有し、
前記シナリオ解析部は、
ユーザとの音声対話で所定の目的を達成するために必要な各情報に対してスロットを割り当て、音声対話開始から所定の目的の達成に至るまでの各音声入力に応じて各スロットに情報を格納するとともに、
情報が格納されていない状態である空スロット、情報は格納されているが、該情報はユーザが確認して確定していない状態である未確定スロット、情報が格納されており、該情報がユーザに確認、確定された状態である確定スロット、複数の未確定スロットがある場合で、各未確定スロットに格納された情報が正しいか否かのユーザの確認結果が否である場合に、各未確定スロットのそれぞれに対して設定される、当該未確定スロットの情報を確認中である逐次確認中スロットの4つの状態で前記各スロットの状態を管理することにより、前記音声対話シーケンスの状態をスロット状態と一意に関連づけて表現し、
前記各未確定スロットに対して設定された各逐次確認中スロットのそれぞれについて、当該逐次確認中スロットの情報がユーザに確認、確定された場合は、当該逐次確認中スロットから前記確定スロットへの状態遷移を行い、当該逐次確認中スロットの情報の修正情報が入力された場合で、該修正情報が複数の別の情報である場合は、該別の情報を別々に格納した複数の逐次確認中スロットをそれぞれ前記未確定スロットへ状態遷移させ、該修正情報が1つの別の情報である場合は、該別の情報を当該逐次確認中スロットに格納して、ユーザによる確認待ちの状態を維持する、音声対話装置。 A voice interaction device,
A voice input / output receiving unit that outputs voice guidance to the user and receives voice input in response to the voice guidance from the user;
A data input / output receiving unit for outputting the input dialog sequence name and slot state to the user and receiving the dialog sequence name and slot state input by the user when the voice dialog sequence is resumed;
A scenario DB that stores voice conversation scenarios used for controlling the voice conversation for each voice conversation sequence;
A recognition dictionary DB that stores speech recognition grammar;
A speech recognition unit that performs speech recognition processing on the input speech using the designated speech recognition grammar stored in the recognition dictionary DB and outputs the speech recognition result;
Interaction sequence name and slot status output to the data input receiving unit, the input to the voice output unit in response to the voice guidance, the voice recognition unit on the speech input of the user, and instructs the voice The speech recognition process is performed with the recognition grammar, and the state of the speech dialogue scenario stored in the scenario DB is changed according to the speech recognition result, and is output from the data input / output receiving unit when the speech dialogue is resumed. resuming the scenario analyzer voice conversation by interaction sequence name and slot state, has,
The scenario analysis unit
Slots are assigned to each piece of information necessary to achieve a predetermined purpose in a voice dialogue with the user, and information is stored in each slot according to each voice input from the start of the voice dialogue to the achievement of the predetermined goal. And
Information is empty slots is a state that is not stored, but information is stored, the information is unconfirmed slot is in a state that is not determined to confirm the user information is stored,該情 When there is a confirmed slot and a plurality of unconfirmed slots in which the information has been confirmed and confirmed to the user, and the user confirmation result of whether or not the information stored in each unconfirmed slot is correct By managing the state of each of the slots in the four states of the sequentially confirming slot, which is set for each of the unconfirmed slots and confirming the information of the unconfirmed slot , Express the state uniquely associated with the slot state ,
For each sequentially confirmed slot set for each unconfirmed slot, if the information of the sequentially confirmed slot is confirmed and confirmed to the user, the status from the sequentially confirmed slot to the confirmed slot When the correction information of the information of the slot being sequentially confirmed is input and the correction information is a plurality of other information, a plurality of slots being sequentially confirmed in which the other information is stored separately , Each state is changed to the unconfirmed slot, and when the correction information is one piece of other information, the other information is stored in the sequential confirmation slot, and the state waiting for confirmation by the user is maintained. Spoken dialogue device.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004236510A JP4535804B2 (en) | 2004-08-16 | 2004-08-16 | Spoken dialogue sequence state notation method, program, and spoken dialogue apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004236510A JP4535804B2 (en) | 2004-08-16 | 2004-08-16 | Spoken dialogue sequence state notation method, program, and spoken dialogue apparatus |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2006053470A JP2006053470A (en) | 2006-02-23 |
| JP4535804B2 true JP4535804B2 (en) | 2010-09-01 |
Family
ID=36030970
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004236510A Expired - Fee Related JP4535804B2 (en) | 2004-08-16 | 2004-08-16 | Spoken dialogue sequence state notation method, program, and spoken dialogue apparatus |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4535804B2 (en) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5044783B2 (en) * | 2007-01-23 | 2012-10-10 | 国立大学法人九州工業大学 | Automatic answering apparatus and method |
| JP2016061954A (en) * | 2014-09-18 | 2016-04-25 | 株式会社東芝 | Dialog apparatus, method and program |
| JP6950919B2 (en) | 2017-02-10 | 2021-10-13 | 株式会社アナリティックウェア | Dialogue devices, controls, dialogue systems, dialogue methods, control methods, and programs |
| KR102064207B1 (en) * | 2018-02-27 | 2020-01-09 | 주식회사 와이즈넛 | Method and apparatus of corpus-based goal-oriented dialog management for medical interview |
| CN113590750B (en) | 2021-07-30 | 2024-09-13 | 北京小米移动软件有限公司 | Human-computer dialogue method, device, electronic device and storage medium |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3667615B2 (en) * | 1991-11-18 | 2005-07-06 | 株式会社東芝 | Spoken dialogue method and system |
| JPH06332493A (en) * | 1993-05-19 | 1994-12-02 | Canon Inc | Device and method for voice interactive information retrieval |
| JP2001125591A (en) * | 1999-10-27 | 2001-05-11 | Fujitsu Ten Ltd | Speech interactive system |
| JP2004045900A (en) * | 2002-07-12 | 2004-02-12 | Toyota Central Res & Dev Lab Inc | Voice interaction device and program |
-
2004
- 2004-08-16 JP JP2004236510A patent/JP4535804B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2006053470A (en) | 2006-02-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3941299B2 (en) | Spoken dialogue device | |
| JP4854259B2 (en) | Centralized method and system for clarifying voice commands | |
| US12148430B2 (en) | Method, system, and computer-readable recording medium for managing text transcript and memo for audio file | |
| US7881938B2 (en) | Speech bookmarks in a voice user interface using a speech recognition engine and acoustically generated baseforms | |
| US20080273674A1 (en) | Computer generated prompting | |
| US20080300865A1 (en) | Method, system, and apparatus for natural language mixed-initiative dialogue processing | |
| JP2008203559A (en) | Dialogue apparatus and method | |
| CN110019716B (en) | Multi-turn question and answer method, terminal equipment and storage medium | |
| US20220036005A1 (en) | Tokenization of text data to facilitate automated discovery of speech disfluencies | |
| CN108648750A (en) | Mixed model speech recognition | |
| US11880665B2 (en) | Systems and methods for inserting dialogue into a query response | |
| US20060287868A1 (en) | Dialog system | |
| US12062373B2 (en) | Automated generation of transcripts through independent transcription | |
| JP7347217B2 (en) | Information processing device, information processing system, information processing method, and program | |
| CN108924218A (en) | Method and apparatus for pushed information | |
| JP4837887B2 (en) | Pattern processing system specific to user groups | |
| CN113987149A (en) | Intelligent session method, system and storage medium for task robot | |
| KR20190062982A (en) | Electronic device and method for operating the same | |
| JP4535804B2 (en) | Spoken dialogue sequence state notation method, program, and spoken dialogue apparatus | |
| US20050234720A1 (en) | Voice application system | |
| JP3878147B2 (en) | Terminal device | |
| CN115129878A (en) | Conversation service execution method, device, storage medium and electronic equipment | |
| JP2003030187A (en) | Automatic interpreting system, conversation learning device, automatic interpreting device, its method and its program | |
| US20060031853A1 (en) | System and method for optimizing processing speed to run multiple dialogs between multiple users and a virtual agent | |
| KR102446300B1 (en) | Method, system, and computer readable record medium to improve speech recognition rate for speech-to-text recording |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060904 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091019 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091028 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091224 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100602 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100615 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130625 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140625 Year of fee payment: 4 |
|
| LAPS | Cancellation because of no payment of annual fees |