JP6760138B2 - Dialogue corpus creation program, dialogue corpus creation method, and information processing device - Google Patents
Dialogue corpus creation program, dialogue corpus creation method, and information processing device Download PDFInfo
- Publication number
- JP6760138B2 JP6760138B2 JP2017040681A JP2017040681A JP6760138B2 JP 6760138 B2 JP6760138 B2 JP 6760138B2 JP 2017040681 A JP2017040681 A JP 2017040681A JP 2017040681 A JP2017040681 A JP 2017040681A JP 6760138 B2 JP6760138 B2 JP 6760138B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- worker
- dialogue
- data
- utterance data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、対話コーパス作成プログラム、対話コーパス作成方法、及び情報処理装置に関する。 The present invention relates to a dialogue corpus creation program, a dialogue corpus creation method, and an information processing apparatus.
近年、機械が人を相手とした対話を自然な応答文で応答する対話システムが開発され製品化されている。人の入力文に対する予め蓄積した応答文の文パターンから対応する応答文の文パターンを求め、入力文から抽出した単語の特徴語と関連度の高い単語を用いて、求めた応答文のパターンとから入力文に対する応答文を生成する技術が知られている。 In recent years, a dialogue system in which a machine responds to a dialogue with a person with a natural response sentence has been developed and commercialized. The sentence pattern of the corresponding response sentence is obtained from the sentence pattern of the response sentence accumulated in advance for the human input sentence, and the obtained response sentence pattern is obtained by using the characteristic words of the words extracted from the input sentence and the words having a high degree of relevance. A technique for generating a response sentence to an input sentence from is known.
また、機械が人との対話においてより自然な文を出力するために、2者以上のユーザの対話文を受け付け、少なくとも一者の会話文を自然言語処理し、会話の繋がりデータを取得し蓄積することで対話コーパスを生成する技術等が提案されている。 In addition, in order for the machine to output more natural sentences in dialogue with humans, it accepts dialogue sentences of two or more users, processes at least one conversational sentence in natural language, and acquires and accumulates conversation connection data. A technique for generating a dialogue corpus by doing so has been proposed.
上述した技術では、2者で作業した場合、片方が作業している間の待ち時間が生じるため非効率的であるといった問題がある。効率的に2者による対話を行なおうとすると、ペアとなる2者を探す作業、2者の時間合せ等の管理が必要となり管理者の負担になる。 The above-mentioned technique has a problem that when two people work, it is inefficient because a waiting time occurs while one of them is working. If two parties try to have a dialogue efficiently, it is necessary to manage the work of finding a pair of two parties and the time adjustment of the two parties, which is a burden on the administrator.
したがって、1つの側面では、対話コーパスを効率的に作成することを目的とする。 Therefore, one aspect aims to efficiently create a dialogue corpus.
一態様によれば、2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から取り出し、前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択する割当処理を1発話ずつコンピュータに実行させ、前記複数の作業者により前記対話を完成させた対話データを得る処理を前記コンピュータに実行させる対話コーパス作成プログラムが提供される。 According to one aspect, the worker IDs of workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties, and the worker IDs of a plurality of workers in the order in which they can participate in the dialogue. The work of the worker ID taken out from the stored storage unit and managed by the storage unit by referring to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues. According to the worker allocation procedure based on the past participation status of the person, the computer is made to execute the allocation process for selecting the dialogue for assigning the worker who creates the speech data one by one, and the dialogue is completed by the plurality of workers. Provided is a dialogue corpus creation program that causes the computer to execute a process of obtaining the dialogue data.
また、上記課題を解決するための手段として、対話コーパス作成方法、及び情報処理装置とすることもできる。 Further, as a means for solving the above problems, a dialogue corpus creation method and an information processing device can be used.
対話コーパスを効率的に作成することができる。 You can efficiently create a dialogue corpus.
以下、本発明の実施の形態を図面に基づいて説明する。先ず、2者のペアにより対話コーパスを作成する場合について説明する。図1は、ペアの対話による対話コーパスの作成を説明するための図である。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. First, a case where a dialogue corpus is created by a pair of two parties will be described. FIG. 1 is a diagram for explaining the creation of a dialogue corpus by a pair dialogue.
図1では、予め対話のペアとなる被験者α及びβを用意し、そのペアに対話をしてもらい、対話の内容を記録することで対話コーパス1aを作成する。被験者α及びβには、予め役割を説明しておく。例えば、旅行代理店の店員と、移動手段、ホテル等を予約する顧客等である。 In FIG. 1, subjects α and β to be a dialogue pair are prepared in advance, the pair is asked to have a dialogue, and the content of the dialogue is recorded to create a dialogue corpus 1a. The roles of subjects α and β will be explained in advance. For example, a clerk of a travel agency and a customer who reserves a means of transportation, a hotel, or the like.
図1では、被験者αには、旅行代理店の店員として会話してもらい、被験者βには、顧客として会話してもらった場合の対話例を示している。被験者αが1番目の発話「どちらに行かれますか?」で問いかけ、被験者βが2番目の発話「シカゴに行こうと思います」で返答する。 FIG. 1 shows an example of a dialogue in which the subject α has a conversation as a clerk of a travel agency and the subject β has a conversation as a customer. Subject α asks in the first utterance, "Where are you going?", And subject β replies in the second utterance, "I'm going to Chicago."
そして、被験者αが3番目の発話「何泊のご予定ですか?」で更に質問し、被験者βが4番目の発話「3泊くらいを考えてます」で返答する等々と、被験者αと被験者βとの間で会話が継続される。旅行代理店の店員役の被験者αが、旅行の計画に十分な情報を被験者βから取得すると、対話の終了となる。 Then, subject α asks a further question in the third utterance "How many nights are you planning?", Subject β replies in the fourth utterance "I'm thinking about 3 nights", and so on. The conversation with β is continued. When the subject α, who acts as a clerk of the travel agency, obtains sufficient information from the subject β to plan the trip, the dialogue ends.
このようにして、多くの被験者のペアから収集した対話コーパス1aを用いて機械学習を行うことで、機械が人を相手とした場合に対話を適切に進行させることができる。対話コーパス1aを用いた機械学習により、人手による対話の規則の記述を不要にきる。 In this way, by performing machine learning using the dialogue corpus 1a collected from many pairs of subjects, it is possible to appropriately proceed with the dialogue when the machine deals with a person. Machine learning using the dialogue corpus 1a eliminates the need to manually describe the rules of dialogue.
精度よく対話を進行させるためには、大規模な対話コーパス1aを作成することが必要である。大規模な対話コーパス1aにより機械学習を用いた対話システムの開発を高精度に行えるようになる。 In order to proceed with the dialogue accurately, it is necessary to create a large-scale dialogue corpus 1a. The large-scale dialogue corpus 1a enables the development of a dialogue system using machine learning with high accuracy.
しかし、このようにして、対話コーパス1aを作成するためには、一般的には、対話のペアとなる被験者α及びβを用意し、場所を提供又は通信手段を介して、定めた時間に対話を開始させ、進行する対話の内容を記録する。この手法では、被験者は他者と共同で作業にあたることになり、片方の被験者が作業している間、ペアの相手はその作業を待つ時間が発生する。 However, in order to create the dialogue corpus 1a in this way, in general, subjects α and β to be a pair of dialogues are prepared, and dialogues are provided at a predetermined time by providing a place or via a communication means. And record the content of the ongoing dialogue. In this method, the subject works in collaboration with the other, and while one subject is working, the other person in the pair has time to wait for the work.
このような問題に対する簡単な解決策として、対話コーパス1aに記録される対話を、定めた2者により開始から終了までを行わせるのではなく、対話を個別の複数のタスクに分割し、クラウドソーシング等を用いることにより多数の人の参加により独立に実施することが考えられる。 As a simple solution to such a problem, instead of having the dialogue recorded in the dialogue corpus 1a performed from the start to the end by two defined parties, the dialogue is divided into a plurality of individual tasks and crowdsourced. It is conceivable to carry out independently with the participation of a large number of people by using such as.
対話を個別の複数のタスクに分割するとは、1つの役割を1人の人が行うのではなく、会話のやり取り毎に役割を担う人を選定して会話を継続させることである。一例として、図1の被験者αと被験者βとの対話のうち、被験者α及びβのいずれかが発話する毎に、役割を担う人を変更する。この場合、1回の発話を行うことを1つの個別のタスクと見なす。 Dividing the dialogue into a plurality of individual tasks means that one person does not perform one role, but a person who plays a role is selected for each conversation and the conversation is continued. As an example, in the dialogue between the subject α and the subject β in FIG. 1, the person who plays the role is changed each time either the subject α or β speaks. In this case, making one utterance is regarded as one individual task.
クラウドソーシングとは、目的とする主タスクを、それぞれ独立した細かい単位のタスク(以下、小タスクという)に分解し、その小タスクを不特定多数の作業者によってネットワークを介して実施することである。 Crowdsourcing is to decompose the target main task into independent small unit tasks (hereinafter referred to as small tasks) and execute the small tasks by an unspecified number of workers via a network. ..
小タスクの配信や実施は、主に、ウェブブラウザやスマートフォン等を用いて行われるため、作業者のメリットとして、作業者は任意の場所において任意のタイミングで作業を実施できる。個々の小タスクは小規模で簡単な作業であるため、専門性を必要としない場合が多い。 Since the distribution and execution of small tasks are mainly performed using a web browser, a smartphone, or the like, as a merit of the worker, the worker can carry out the work at any place at any time. Individual subtasks are small and easy tasks and often do not require expertise.
また、不特定多数の作業者に小タスクを実施してもらうことにより、大きな主タスクを低いコストで早く完了させることができる。このことから、簡単な例として、複数の発話でなる対話を主タスクとし、発話単位を小タスクとすることが考えられる。 In addition, by having an unspecified number of workers perform small tasks, it is possible to complete a large main task quickly at low cost. From this, as a simple example, it is conceivable that the main task is a dialogue consisting of a plurality of utterances, and the utterance unit is a small task.
図2は、タスク分解をしてクラウドソーシングを用いるコーパス作成例を示す図である。図2において、作業者A、B、C、及びDを含む複数の作業者9による対話の進行例を示している。
FIG. 2 is a diagram showing an example of creating a corpus by decomposing tasks and using crowdsourcing. FIG. 2 shows an example of progress of dialogue by a plurality of
作業者Aが1番目の発話「どちらに行かれますか?」で問いかけることで会話が開始される。この問いかけに対して、作業者Bが2番目の発話「シカゴに行こうと思います」で返答する。 The conversation is started when Worker A asks the first utterance, "Where are you going?". Worker B responds to this question with the second utterance, "I'm going to Chicago."
作業者Bの返答に対して、図1の例では、1番目の発話の作業者Aが次の質問を行うはずであるが、図2の例では、作業者Aとは異なる作業者Cが、3番目の発話「何泊のご予定ですか?」で更に質問する。 In response to the response of the worker B, in the example of FIG. 1, the worker A of the first utterance should ask the next question, but in the example of FIG. 2, a worker C different from the worker A is asked. Ask more questions in the third utterance, "How many nights are you planning?"
作業者Cの質問に対して、回答する作業者9は作業者Bではなく作業者Dである。作業者Dは、4番目の発話「3泊くらいを考えてます」で返答する。このように、対話をする2者を固定せず、発話入力毎に、作業者9を選定し、多数の作業者9により一連の会話を個別に独立させて実施する。
The
本実施例を説明する前に、以下に用語を定義する。 Before explaining this embodiment, the terms are defined below.
発話は、一人の作業者が記述する一つの発言である。 An utterance is a statement described by a single worker.
対話は、複数の発話からなる一連の発話列である。 A dialogue is a series of utterances consisting of multiple utterances.
作業者は、発話を作成する個別の人であり、発話者という場合がある。 A worker is an individual person who creates an utterance and is sometimes referred to as the speaker.
図2で説明したようなクラウドソーシングを用いるコーパス作成方法では、上述したように対話の流れを個別の小タスクに分解すると整合性のある発話例を生成できない場合がある。したがって、本実施例では、
(I)整合性のチェック
(II)発話、作業者、及び対話それぞれのスコアリング
(III)作業者の割り当ての効率化
を行う。
In the corpus creation method using crowdsourcing as described in FIG. 2, if the dialogue flow is decomposed into individual subtasks as described above, it may not be possible to generate a consistent utterance example. Therefore, in this embodiment,
(I) Consistency check (II) Scoring of utterances, workers, and dialogues (III) Efficient allocation of workers.
(I)整合性のチェック
先ず、文脈の提示による作業者9の意識の共通化と対話品質を維持するために、
・作業者9には開始からの文脈を提示し
・作業者9は、その文脈を読んで理解することによって、これまでの発話者(作業者9)と同じ文脈を共有することができ、それにより同一ペアによって作成された発話と同様の品質を保持する。
(I) Consistency check First, in order to maintain the common consciousness of
-Present the context from the beginning to the worker 9-The
次に、文脈の整合性を担保するために、
・1発話進むごとに、作業者9がそれまでの対話の内容が適切であるか否かをチェックする。これは、文脈の理解と同時に行うことができる。つまり、文脈を理解するために全て読んだ後、内容を理解できなければ不適切であると判断する。
・独立した作業者9によって対話コーパスを作成する際の問題点として整合性のある発話列が作成できない恐れがある点が挙げられるが、このチェックにより対話の整合性を担保する。
・作業者9は、直前の対話を不適切だと判断した場合、作業者9はそこでなされるであろう発話を作成する。
Then, to ensure the integrity of the context
-Every time one utterance progresses, the
-The problem with creating a dialogue corpus by an
-If the
(II)発話、作業者、及び対話それぞれのスコアリング
先ず、発話と、作業者9の信頼度のスコアリングについて説明する。
・作業者9のレベルにはばらつきがあることが一般的であり、その結果、不適切な発話が作成される可能性がある。
・各発話に、パラメータとして与えられた多重度においてその発話が正しいと判定された割合を発話スコアとする。
・分岐後は、発話スコアが高い発話を継続させる。分岐後の発話の枝を延ばすと表現される場合がある。
・作業者9が作成したすべての発話の発話スコアの平均値をその作業者9の作業者スコアとする。
(II) Scoring of utterances, workers, and dialogues First, utterances and scoring of the reliability of
-The level of
-For each utterance, the ratio at which the utterance is judged to be correct at the multiplicity given as a parameter is defined as the utterance score.
・ After branching, continue utterance with a high utterance score. It may be described as extending the branch of the utterance after branching.
-The average value of the utterance scores of all the utterances created by the
次に、作業者スコアを用いた対話のスコアリングについて説明する。
・各対話のスコアを算出する。
・分岐があった場合は最も指示されたパスを選択し、一本のパスを抽出する。
・そのパスに出現する作業者9の作業者スコアの相乗平均を求め、これをその対話のスコアとし、以下、対話スコアという。
Next, dialogue scoring using worker scores will be described.
-Calculate the score for each dialogue.
・ If there is a branch, select the most specified path and extract one path.
-The geometric mean of the worker scores of the
(III)作業者の割り当ての効率化
対話における発話列が長くなると文脈の理解とその内容のチェックに時間がかかる。このチェックを可能な限り省略し効率的にするために、同一の作業者9に同じタスクを優先的にアサインする。
・このために対話のタスク履歴に基づいた確率を用いてタスクを割り当てる。
ここでのタスクとは、作成予定の対話に相当し、以下の説明において、対話タスクという場合がある。作成予定の対話には、現在進行中の対話と、未だ開始されていない対話とを含む。
(III) Efficient allocation of workers When the utterance line in a dialogue becomes long, it takes time to understand the context and check its contents. In order to omit this check as much as possible and make it efficient, the same task is preferentially assigned to the
-For this purpose, assign tasks using probabilities based on the task history of the dialogue.
The task here corresponds to the dialogue to be created, and may be referred to as a dialogue task in the following description. Dialogues to be created include those that are currently in progress and those that have not yet started.
上述した(I)から(III)について、例を用いて説明する。先ず、(I)整合性のチェックについて図3から図5で説明する。 The above-mentioned (I) to (III) will be described with reference to examples. First, (I) consistency check will be described with reference to FIGS. 3 to 5.
図3は、対話に対する意識の共通化と対話品質の維持の方法とを説明するための図である。図3では、作業者A、B、C、Dを含む複数の異なる作業者9には、旅行代理店での交通機関、宿泊先等の予約の場面を想定してもらい、一連の会話を行ってもらった場合の例を示している。
FIG. 3 is a diagram for explaining a method of standardizing awareness of dialogue and maintaining dialogue quality. In FIG. 3, a plurality of
本実施例では、
・作業者9のペアの管理は行わず各作業者9を独立に受け付ける。
・各作業者9には、それまでの対話の文脈(生成された発話の列)を提示し、次の発話の作成を依頼する。
In this embodiment
-The pair of
-Each
複数の作業者9は、携帯電話等の端末からネットワークを介して本実施例に係るサービスへ接続する。作業者9へは、少なくとも直前までの発話を提示する。対話を進行する場面の説明を更に提示してもよい。一方で、対話の場面は、直前までの発話から、作業者9により判断させてもよい。
The plurality of
この例では、旅行代理店における予約に関する店員と顧客の対話を、複数の作業者9に行ってもらう。各作業者9は、状況を把握した上で、直前の発話に対して最も有り得る内容を次の発話として入力する。又は、直線の発話を不適切と判断した場合は修正する発話を入力する。
In this example, a plurality of
複数の作業者9のうち、最初に会話を入力する作業者Aは、自分は店員であると判断して最初の発話を入力する。例えば、1番目の発話として「どちらに行かれますか?」等が入力される。
Of the plurality of
1番目の発話に対して、1番目の発話を提示された作業者Bは、自分は顧客であると判断して、2番目の発話を入力する。例えば、2番目の発話として「シカゴに行こうと思います」等が入力される。 Worker B, who is presented with the first utterance for the first utterance, determines that he / she is a customer and inputs the second utterance. For example, "I'm going to Chicago" is input as the second utterance.
1番目及び2番目の発話を提示された作業者Cは、自分は店員であると判断して3番目の発話を入力する。例えば、3番目の発話として「何泊のご予定ですか?」等が入力される。 Worker C, who is presented with the first and second utterances, determines that he is a clerk and inputs the third utterance. For example, "How many nights are you planning?" Is input as the third utterance.
1番目から3番目の発話を提示された作業者Dは、自分は顧客であると判断して、4番目の発話を入力する。例えば、4番目の発話として「3泊くらいを考えてます」等が入力される。 Worker D, who is presented with the first to third utterances, determines that he is a customer and inputs the fourth utterance. For example, "I'm thinking about 3 nights" is entered as the fourth utterance.
このように、直前までの発話を作業者9に提供することで、発話毎に作業者9が変更されても、作業者9は、状況と自分の役割を把握することができる。更に、本実施例では、図4に示すような画面を作業者9の端末に表示させることで、直前までの対話の整合性を作業者9によりチェックさせる。
By providing the utterances up to the last minute to the
図4は、対話画面例を示す図である。図4に例示する対話画面G70は、発話履歴表示域71と、発話入力域72と、不適切チェック領域73と、終了チェック領域74とを有する。対話画面G70において、作業者Cは、発話履歴表示域71に表示れた対話の最初から直前までの2つの発話を読み、対話の状況を把握する。
FIG. 4 is a diagram showing an example of a dialogue screen. The dialogue screen G70 illustrated in FIG. 4 has an utterance history display area 71, an utterance input area 72, an
作業者Cは、先ず、発話履歴表示域71に表示れた
1.どちらに行かれますか?
2.シカゴに行こうと思います
の発話から、最後(2番目)の発話が適切であるか否かを判断する。
Worker C was first displayed in the utterance history display area 71. Where are you going?
2. 2. From the utterances I'm going to Chicago, determine if the last (second) utterance is appropriate.
作業者Cは、最後の発話が適切であると判断した場合、最後の発話に続く適切な発話を発話入力域72に作成し入力する。一方、不適切であると判断した場合、作業者Cは、不適切チェック領域73にチェックを入れる。不適切チェック領域73にチェックを入れた場合、作業者Cに、最後の発話の代わりに、適切と考える発話を発話入力域72に入力して修正する。
When the worker C determines that the last utterance is appropriate, the worker C creates and inputs an appropriate utterance following the last utterance in the utterance input area 72. On the other hand, when it is determined that it is inappropriate, the worker C checks the
不適切チェック領域73にチェックを入れた場合には、この修正は必須とすることが望ましい。修正すべき発話を作成させることで、作業者Cに最後の発話の適正判断を誠実に行わせることができる。本実施例では、このように発話毎に、次の作業者9に最後の発話の適正を判断させるため、最後の発話より以前の発話は、適正であると判断済みの発話であると言える。
When the
この例では、作業者Cは、不適切チェック領域73にチェックを入れずに、発話入力域72に「何泊のご予定ですか?」と発話を作成している。即ち、「シカゴに行こうと思います」の発話は適正であると判断し、この発話に続く次の発話を作成した場合である。
In this example, the worker C creates an utterance in the utterance input area 72 as "How many nights are you planning?" Without checking the
終了チェック領域74は、対話の終了であると判断した場合に、作業者Cは、終了チェック領域74にチェックを入れる。対話の終了とは、対話の目的が達成されたと判断した場合である。対話が宿泊に係る交通機関、ホテル等の予約を目的とする場合、出発地、目的地、滞在地、滞在日数等の情報を取得できたと判断した場合を対話の終了とする。このような必要な情報を得られた場合の他、質問に回答できた、相手の満足を得られた等が、対話の終了となる。
When it is determined that the
本実施例では、上述した不適切チェック領域73へチェックされた場合に、図5に示すように、発話の進行を分岐させる木構造(以下、発話木構造という)により複数の発話で構成される対話の進行状態を表現する。
In this embodiment, when the
図5は、不適切チェックの有無に基づく発話木構造の例を説明するための図である。図5(A)では、作業者Aによる最初(1番目)の発話「どちらに行かれますか?」に対して、次の作業者Bが2番目の発話「シカゴに行こうと思います」を作成し、この対話が作業者Cに割り当てられた際の対話画面G70を示している。図4の対話画面G70と同様である。 FIG. 5 is a diagram for explaining an example of an utterance tree structure based on the presence or absence of an inappropriate check. In FIG. 5 (A), in response to the first (first) utterance "Where are you going?" By worker A, the next worker B is the second utterance "I will go to Chicago." Is created, and the dialogue screen G70 when this dialogue is assigned to the worker C is shown. This is the same as the dialogue screen G70 of FIG.
この例では、作業者Cは、作業者Aの発話に対する作業者Bの発話は適切であったと判断し、不適切チェックが無い状態で、作業者Cにより発話「何泊のご予定ですか?」が作成される。 In this example, the worker C judges that the utterance of the worker B is appropriate for the utterance of the worker A, and the utterance by the worker C "How many nights are you planning?" Without the inappropriate check. Is created.
この対話の進行状態は、発話木構造8aで表現される。発話木構造8aでは、発話を、その発話を作成した作業者9を表わすアルファベットのノードで簡潔に示す。図6〜図9も同様である。
The progress of this dialogue is represented by the utterance tree structure 8a. In the utterance tree structure 8a, the utterance is briefly indicated by a node of the alphabet representing the
発話木構造8aは、最初(1番目)の発話Aから始まり、下へ2番目の発話B、更に下へ3番目の発話Cへと枝が伸びる。発話木構造8aには分岐が存在しない。即ち、この時点では、未だ不適切チェックがなされていないことを示す。 The utterance tree structure 8a starts from the first (first) utterance A, extends downward to the second utterance B, and further downwards to the third utterance C. There are no branches in the utterance tree structure 8a. That is, at this point, it indicates that the inappropriate check has not been performed yet.
図5(B)では、作業者Aによる最初(1番目)の発話「どちらに行かれますか?」に対して、次の作業者Dが2番目の発話「どこでも」を作成した状態の対話画面G70が示されている。 In FIG. 5 (B), a dialogue in which the next worker D creates the second utterance "anywhere" in response to the first (first) utterance "Where are you going?" By the worker A. The screen G70 is shown.
作業者Eは、直前の作業者Dの発話「どこでも」は不適切であると判断し、修正する発話を作成する。不適切チェック有りの状態で、発話Eが作成された場合の発話木構造8bを示している。発話木構造8bでは、最初(1番目)の発話Aから始まり、下へ2番目の発話Dと伸びるが、発話Dに対する不適切チェックにより、発話Eは発話Aの直下に位置付けされる。 The worker E determines that the utterance "anywhere" of the immediately preceding worker D is inappropriate, and creates an utterance to be corrected. The utterance tree structure 8b when the utterance E is created with the improper check is shown. In the utterance tree structure 8b, the utterance tree structure 8b starts from the first (first) utterance A and extends downward to the second utterance D, but the utterance E is positioned directly under the utterance A due to an inappropriate check for the utterance D.
以下の説明において、発話木構造8a、8b等のように特定しない限りにおいて、総称して発話木構造8という場合がある。 In the following description, unless otherwise specified such as the utterance tree structure 8a, 8b, etc., the utterance tree structure 8 may be generically referred to.
次に、(II)発話、作業者、及び対話それぞれのスコアリングについて図6〜図9で説明する。先ず、発話スコアリングについて説明する。本実施例では、
・発話が分岐した際に、チェックのための多重度をパラメータとして与える。
・多重度は奇数を与える。
・分岐が起きた際に、分岐が起きるか否かを多重度の数まで作業者に評価させる。多重度が1の場合は、分岐した際に分岐後の発話のみを用いることなる。多重度は3以上であることが好ましい。
・作業者9によって指示された割り合いを発話スコアとする。
Next, scoring of (II) utterance, worker, and dialogue will be described with reference to FIGS. 6 to 9. First, utterance scoring will be described. In this embodiment
-When the utterance branches, the multiplicity for checking is given as a parameter.
-The multiplicity gives an odd number.
-When a branch occurs, let the operator evaluate whether or not the branch occurs up to the number of multiplicities. When the multiplicity is 1, only the utterance after the branch is used when the branch is made. The multiplicity is preferably 3 or more.
-The utterance score is the ratio instructed by the
先ず、発話スコアリングについて図6及び図7で説明する。図6は、多重度「1」の場合の発話スコアリングを説明するための図である。図6(A)では、図5(A)の発話木構造8aの各発話の発話スコアを示している。発話木構造8aでは、分岐が存在しないため、発話A、B及びCの全ての発話スコアUSが「1」を示す。 First, utterance scoring will be described with reference to FIGS. 6 and 7. FIG. 6 is a diagram for explaining utterance scoring when the multiplicity is “1”. FIG. 6 (A) shows the utterance score of each utterance of the utterance tree structure 8a of FIG. 5 (A). In the utterance tree structure 8a, since there is no branch, all the utterance scores US of the utterances A, B, and C show "1".
図6(B)では、発話木構造8cにおいて分岐の前後の発話スコアUSを説明する。分岐前の発話Dが作成された時点では、発話Aも発話Dも発話スコアUSは「1」である。発話Cの作成時に発話Aから分岐すると、即ち、発話Dが不適切であると判断されると、多重度が1の場合は、不適切と判断された発話Dの発話スコアUSは「0」となり、修正用の発話Cに発話スコアUS「1」が与えられる。 FIG. 6B describes the utterance score US before and after the branch in the utterance tree structure 8c. At the time when the utterance D before the branch is created, the utterance score US of both the utterance A and the utterance D is "1". When branching from utterance A when creating utterance C, that is, when utterance D is determined to be inappropriate, if the multiplicity is 1, the utterance score US of utterance D determined to be inappropriate is "0". Then, the utterance score US "1" is given to the utterance C for correction.
図7は、多重度「3」の場合の発話スコアリングを説明するための図である。図7(A)では、発話Aに応答して発話Dが作成された状態を示す。この状態では、発話Aの発話スコアUSは「1」であり、発話Dの発話スコアUSも「1」である。 FIG. 7 is a diagram for explaining utterance scoring when the multiplicity is “3”. FIG. 7A shows a state in which utterance D is created in response to utterance A. In this state, the utterance score US of utterance A is "1", and the utterance score US of utterance D is also "1".
図7(B)では、発話Dが不適切と判断され、修正用に発話Cが作成される。この時点では、本当に発話Dが不適切であるのかは断定できない。この状態での発話木構造8dでは、発話Dの発話スコアUSが「1」から「1/2」に変更され、発話Cには発話スコアUS「1/2」が与えられる。図7(B)の発話木構造8dに対して、図7(C)又は図7(D)の状態に遷移することが考えられる。 In FIG. 7B, the utterance D is determined to be inappropriate, and the utterance C is created for correction. At this point, it cannot be determined whether utterance D is really inappropriate. In the utterance tree structure 8d in this state, the utterance score US of the utterance D is changed from "1" to "1/2", and the utterance C is given the utterance score US "1/2". It is conceivable that the utterance tree structure 8d of FIG. 7 (B) transitions to the state of FIG. 7 (C) or FIG. 7 (D).
図7(C)では、発話Dを不適切と判断した、別の作業者Eにより発話Eが生成された状態を示している。発話Eの追加により、発話Dが不適切でないことは理解できるが、発話Cと発話Eとではいずれが適切かはまだ判定できない。この場合、発話Dが削除され、発話Cと発話Eの発話スコアUSが「1/2」ずつになる。 FIG. 7C shows a state in which the utterance E is generated by another worker E who determines that the utterance D is inappropriate. It can be understood that the utterance D is not inappropriate by adding the utterance E, but it cannot be determined yet which is more appropriate between the utterance C and the utterance E. In this case, the utterance D is deleted, and the utterance score US of the utterance C and the utterance E becomes "1/2" each.
図7(D)では、発話Dに対して不適切と判断されずに、発話Fが追加された状態を示している。したがって、発話Dの発話スコアUSは「1/2」から「2/3」へと変更され、発話Cの発話スコアUSは「1/2」から「1/3」へと変更される。 FIG. 7D shows a state in which the utterance F is added without being judged to be inappropriate for the utterance D. Therefore, the utterance score US of utterance D is changed from "1/2" to "2/3", and the utterance score US of utterance C is changed from "1/2" to "1/3".
次に、上述したように生成され変化する発話木構造8を用いて、作業者スコアリングが行われる。作業者スコアリングでは、作業者9が作成した全ての発話の発話スコアの平均値を算出し、作業者スコアとする。
Next, worker scoring is performed using the utterance tree structure 8 that is generated and changed as described above. In the worker scoring, the average value of the utterance scores of all the utterances created by the
図8は、作業者スコアリングを説明するための図である。図8では、3つの発話木構造8e、8f、及び8gにおける各発話A〜Gの発話スコアUSを用いて、作業者A〜Gの作業者スコアWSを算出する場合で説明する。 FIG. 8 is a diagram for explaining worker scoring. FIG. 8 describes a case where the worker scores WS of the workers A to G are calculated by using the utterance scores US of the utterances A to G in the three utterance tree structures 8e, 8f, and 8g.
この例では、
作業者Aについて、
作業者スコアWSA = (1+1+1)/3 = 1 を取得し、
作業者Bについて、
作業者スコアWSB = (1/3+1+1)/3 = 0.78を取得し、
作業者Cについて、
作業者スコアWSC = (1+2/3)/2 = 0.83を取得し、
作業者Dについて、
作業者スコアWSD = (0+1/3)/2 = 0.17を取得し、
作業者Eについて、
作業者スコアWSE = (1+1+1)/3 = 1を取得し、
作業者Fについて、
作業者スコアWSF = (1+1)/2 = 1を取得し、
作業者Gについて、
作業者スコアWSG = (2/3)/1 = 0.67
を取得する。
In this example
About worker A
Obtain the worker score WS A = (1 + 1 + 1) / 3 = 1 and
About worker B
Obtain the worker score WS B = (1/3 + 1 + 1) / 3 = 0.78,
About worker C
Worker score WS C = (1 + 2/3) / 2 = 0.83 is obtained,
About worker D
Obtain the worker score WS D = (0 + 1/3) / 2 = 0.17 and
About worker E
Obtain the worker score WS E = (1 + 1 + 1) / 3 = 1 and
About worker F
Obtain the worker score WS F = (1 + 1) / 2 = 1 and
About worker G
Worker score WS G = (2/3) / 1 = 0.67
To get.
作業者スコアWSが低い程、不適切な発話を作成する作業者9であることを示す。この作業者スコアWSに対して閾値を用いてフィルタリングすることで、不適切な発話を作成する作業者9を除外してもよい。この場合、不適切な発話の作成を抑制することができる。
The lower the worker score WS, the more the
次に、対話スコアリングについて説明する。対話スコアリングは、最も支持されたパス上の発話を作成した作業者9の作業者スコアWSの相乗平均によって行われる。最も支持されたパスとは、発話の数が最も多い枝を選択することで定まる。
Next, dialogue scoring will be described. Dialogue scoring is performed by the geometric mean of the worker scores WS of
図9は、対話スコアリングを説明するための図である。図9では、図8と同様の3つの発話木構造8e、8f、及び8gで表現されるそれぞれの対話の対話スコアDSを算出する場合で説明する。 FIG. 9 is a diagram for explaining dialogue scoring. In FIG. 9, the case of calculating the dialogue score DS of each dialogue represented by the three utterance tree structures 8e, 8f, and 8g similar to those in FIG. 8 will be described.
発話木構造8eで最も支持されたパスPeは、発話A、G、C、E、及びFの順の文脈である。したがって、パスPeを構成する発話を作成した作業者9の作業者スコアWSの相乗平均は、
(1×0.67×0.83×1×1)^(1/5)= 0.89
であり、対話スコアDSe=0.89を得る。
The most favored path Pe in the utterance tree structure 8e is the context of utterances A, G, C, E, and F in that order. Therefore, the geometric mean of the worker score WS of the
(1 x 0.67 x 0.83 x 1 x 1) ^ (1/5) = 0.89
And a dialogue score of DSe = 0.89 is obtained.
発話木構造8fで最も支持されたパスPfは、発話E、F、A、及びBの順の文脈である。したがって、パスPfを構成する発話を作成した作業者9の作業者スコアWSの相乗平均は、
(1×1×1×0.78)^(1/4) = 0.94
であり、対話スコアDSf=0.94を得る。
The most supported path Pf in the utterance tree structure 8f is the context of utterances E, F, A, and B in that order. Therefore, the geometric mean of the worker score WS of the
(1 x 1 x 1 x 0.78) ^ (1/4) = 0.94
The dialogue score DSf = 0.94 is obtained.
発話木構造8gで最も支持されたパスPgは、発話B、E、C、及びAの順の文脈である。したがって、パスPgを構成する発話を作成した作業者9の作業者スコアWSの相乗平均は、
(0.78×1×0.83×1)^(1/4)= 0.90
であり、対話スコアDSg=0.90を得る。
The most supported path Pg in the utterance tree structure 8g is the context of utterances B, E, C, and A in that order. Therefore, the geometric mean of the worker score WS of the
(0.78 × 1 × 0.83 × 1) ^ (1/4) = 0.90
The dialogue score DSg = 0.90 is obtained.
対話スコアDSが高い値、即ち、1に近い程、適切な文脈で表される対話であることを示す。この例では、対話スコアDSfが最も高い値「0.94」を示すため、パスPfによる文脈は適切な発話の連続を示すと考えられる。 The higher the dialogue score DS, that is, the closer it is to 1, the more appropriate the context is for the dialogue. In this example, since the dialogue score DSf shows the highest value "0.94", the context by the path Pf is considered to indicate a proper sequence of utterances.
次に、(III)作業者の割り当ての効率化について図10から図14で説明する。図10は、作業者割当手順の概要を説明するための図である。 Next, (III) efficiency improvement of worker allocation will be described with reference to FIGS. 10 to 14. FIG. 10 is a diagram for explaining an outline of the worker allocation procedure.
図10において、作業者リスト41は、作業者9の作業者IDを追加した順で取り出すキュー構造を持つリストであり、一例として、キュー構造はFIFO(First-In,First-Out)方式であればよい。この例では、作業者9のIDを右端から追加し、左端から作業者9のIDが取り出される。
In FIG. 10, the
対話タスクテーブル42は、対話毎に発話を作成した作業者9を順に示したテーブルである。各対話は、対話タスクとして対話タスクテーブル42に登録され、以後、対話タスクテーブル42で管理される。対話の進行状況は、対話タスクテーブル42に記録された作業者9を特定する作業者IDで示される。
The dialogue task table 42 is a table in which the
この例では、対話に参加可能な複数の作業者9として、作業者リスト41を参照すると、作業者w4、w9、w21、w10、w5が既に待ち状態である。更に、先頭の作業者w4を対話に割り当て、最後の作業者w5に続いて、作業者w7が作業者リスト41に追加される状況を示している。
In this example, as a plurality of
対話タスクテーブル42には、対話タスクd1、・・・、d5等が登録され、対話タスクd1では、作業者w4が最初の発話を作成後、最初の発話に対して、作業者w11が2番目の発話を作成した状態を示している。対話タスクd2、d3、及びd4等についても同様に、発話が作成された順(発話作成順)に、作業者IDが示される。対話タスクd5は、登録済みであるが、未だ、発話が作成されていない状態を示している。 Dialogue tasks d1, ..., D5, etc. are registered in the dialogue task table 42. In the dialogue task d1, after the worker w4 creates the first utterance, the worker w11 is second with respect to the first utterance. Shows the state in which the utterance of is created. Similarly, for the dialogue tasks d2, d3, d4, etc., the worker IDs are shown in the order in which the utterances are created (utterance creation order). The dialogue task d5 indicates a state in which the utterance has not been created yet, although it has been registered.
作業者9の対話への割り当ては、以下のような作業者割当手順に従って行う。
・手順(1)作業者リスト41(図10)の先頭(左)から作業者IDを取り出す。
・手順(2)対話タスクテーブル42に登録されているそれぞれの対話タスクに対して選択確率を求める。
選択確率 = 作業者IDの出現回数/発話個数
上式にて、発話個数には、取り出した作業者IDが最後となる対話タスクはカウントしない。
・手順(3)選択確率が最大の対話タスクを選択する。
最大の対話タスクが複数ある場合、発話個数が最も少ない対話タスクを選択する。最も少ない対話タスクが複数存在する場合、ランダムに1つの対話タスクを選択する。
The
-Procedure (1) The worker ID is taken out from the head (left) of the worker list 41 (FIG. 10).
-Procedure (2) Obtain the selection probability for each dialogue task registered in the dialogue task table 42.
Selection probability = Number of occurrences of worker ID / number of utterances In the above formula, the number of utterances does not count the dialogue task whose last worker ID is taken out.
-Procedure (3) Select the dialogue task with the highest selection probability.
If there are multiple largest dialogue tasks, select the one with the least number of utterances. If there are a plurality of the least interactive tasks, one interactive task is randomly selected.
図10に示すデータ例を用いて、上述した作業者割当手順に従った作業者割当処理について図11から図14で説明する。図11は、選択確率が最も高い作業者IDが1つのみの場合の作業者割当処理の例を示す図である。 Using the data example shown in FIG. 10, the worker allocation process according to the worker allocation procedure described above will be described with reference to FIGS. 11 to 14. FIG. 11 is a diagram showing an example of a worker allocation process when there is only one worker ID having the highest selection probability.
図11における作業者割当処理では、手順(1)により、作業者リスト41から作業者ID「w4」が取り出され、手順(2)により、対話タスクテーブル42が参照されて、取り出した作業者ID「w4」の選択確率を算出する。
In the worker allocation process in FIG. 11, the worker ID “w4” is extracted from the
この例の場合、対話タスクd1では、作成済みの2つの発話のうち1つが作業者ID「w4」によるものであるため、選択確率「1/2」を得る。対話タスクd2では、作成済みの4つの発話のうち作業者ID「w4」による発話は存在しないため、選択確率「0」を得る。 In the case of this example, in the dialogue task d1, since one of the two created utterances is due to the worker ID “w4”, the selection probability “1/2” is obtained. In the dialogue task d2, since there is no utterance by the worker ID “w4” among the four created utterances, the selection probability “0” is obtained.
対話タスクd3では、作業者ID「w4」が最後に発話を作成しているため、選択確率の算出は行われない。選択確率の算出は抑止される。 In the dialogue task d3, since the worker ID "w4" creates the utterance at the end, the selection probability is not calculated. The calculation of the selection probability is suppressed.
対話タスクd4では、作成済みの2つの発話のうち作業者ID「w4」による発話は存在しないため、選択確率「0」を得る。対話タスクd5では、作成済みの発話は未だ存在しないため、選択確率「0」を得る。 In the dialogue task d4, since there is no utterance by the worker ID “w4” among the two created utterances, the selection probability “0” is obtained. In the dialogue task d5, since the created utterance does not exist yet, the selection probability “0” is obtained.
次に、手順(3)により、選択確率が最も高い対話タスクd1を選択し、発話作成順の最後に「w4」を追加する。対話タスクd1において、作業者ID「w11」の次に「w4」が追加される。作業者リスト41より、作業者ID「w4」の次は作業者ID「w9」である。作業者ID「w9」に対する作業者割当処理は図12で説明する。
Next, according to the procedure (3), the dialogue task d1 having the highest selection probability is selected, and "w4" is added to the end of the utterance creation order. In the dialogue task d1, "w4" is added after the worker ID "w11". From the
図12は、最も高い選択確率が複数存在する場合の作業者割当処理の第1例を示す図である。図12において、手順(1)により、作業者リスト41から作業者ID「w9」が取り出され、手順(2)により、対話タスクテーブル42が参照されて、取り出した作業者ID「w9」の選択確率を算出する。
FIG. 12 is a diagram showing a first example of the worker allocation process when a plurality of the highest selection probabilities exist. In FIG. 12, the worker ID “w9” is extracted from the
この例の場合、対話タスクd1〜d5において、作業者ID「w9」による発話は存在しないため、全ての対話タスクd1〜d5に対して選択確率「0」を得る。この場合、最大の対話タスクが複数ある場合に相当し、手順(3)により、発話個数の最も少ない対話タスクを選択する。 In the case of this example, in the dialogue tasks d1 to d5, since there is no utterance by the worker ID "w9", the selection probability "0" is obtained for all the dialogue tasks d1 to d5. In this case, it corresponds to the case where there are a plurality of maximum dialogue tasks, and the dialogue task with the smallest number of utterances is selected according to the procedure (3).
対話タスクd1の発話個数は「3」であり、対話タスクd2の発話個数は「4」であり、対話タスクd3の発話個数は「1」であり、対話タスクd4の発話個数は「2」であり、対話タスクd5の発話個数は「0」である。 The number of utterances of the dialogue task d1 is "3", the number of utterances of the dialogue task d2 is "4", the number of utterances of the dialogue task d3 is "1", and the number of utterances of the dialogue task d4 is "2". Yes, the number of utterances in the dialogue task d5 is "0".
従って、作業者ID「w9」に対して、対話タスクd5が選択される。発話個数が最も少ない対話タスクd5に作業者ID「w9」が割り当てられる。この例では、対話タスクd5対して、最初の発話として「w9」が記録される。そして、作業者リスト41より、作業者ID「w9」の次は作業者ID「w21」である。作業者ID「w21」に対する作業者割当処理は図13で説明する。
Therefore, the dialogue task d5 is selected for the worker ID “w9”. The worker ID "w9" is assigned to the dialogue task d5 with the smallest number of utterances. In this example, "w9" is recorded as the first utterance for the dialogue task d5. Then, from the
図13は、最も高い選択確率が複数存在する場合の作業者割当処理の第2例を示す図である。図13において、手順(1)により、作業者リスト41から作業者ID「w21」が取り出され、手順(2)により、対話タスクテーブル42が参照されて、取り出した作業者ID「w21」の選択確率を算出する。
FIG. 13 is a diagram showing a second example of the worker allocation process when a plurality of the highest selection probabilities exist. In FIG. 13, the worker ID “w21” is extracted from the
この例の場合、対話タスクd1〜d5において、作業者ID「w21」による発話は存在しないため、全ての対話タスクd1〜d5に対して選択確率「0」を得る。この場合、最大の対話タスクが複数ある場合に相当し、手順(3)により、発話個数の最も少ない対話タスクを選択する。 In the case of this example, since there is no utterance by the worker ID "w21" in the dialogue tasks d1 to d5, the selection probability "0" is obtained for all the dialogue tasks d1 to d5. In this case, it corresponds to the case where there are a plurality of maximum dialogue tasks, and the dialogue task with the smallest number of utterances is selected according to the procedure (3).
対話タスクd1の発話個数は「3」であり、対話タスクd2の発話個数は「4」であり、対話タスクd3の発話個数は「1」であり、対話タスクd4の発話個数は「2」であり、対話タスクd5の発話個数は「1」である。従って、発話個数の最も少ない対話タスクが2つ存在する。 The number of utterances of the dialogue task d1 is "3", the number of utterances of the dialogue task d2 is "4", the number of utterances of the dialogue task d3 is "1", and the number of utterances of the dialogue task d4 is "2". Yes, the number of utterances in the dialogue task d5 is "1". Therefore, there are two dialogue tasks with the smallest number of utterances.
この場合、手順(3)により、発話個数の最も少ない複数の対話タスクからランダムにいずれか1つを選択する。ランダム選択の方法は、特に限定しない。既存の関数などを用いればよい。 In this case, according to the procedure (3), one of the plurality of dialogue tasks with the smallest number of utterances is randomly selected. The random selection method is not particularly limited. An existing function or the like may be used.
作業者ID「w21」に対して、対話タスク「d3」と「d5」のうち対話タスク「d3」が選択されたものとする。対話タスクd3において、既に割り当てた作業者ID「w4」の次に作業者ID「w21」を追加する。 It is assumed that the dialogue task "d3" is selected from the dialogue tasks "d3" and "d5" for the worker ID "w21". In the dialogue task d3, the worker ID "w21" is added next to the already assigned worker ID "w4".
作業者リスト41より、作業者ID「w21」の次は作業者ID「w10」である。作業者ID「w10」は、対話タスクテーブル42に存在しない。作業者ID「w9」と同様の状況を示す。従って、最も発話個数の少ない対話タスクd5に追加される。そして、作業者リスト41より、作業者ID「w10」の次は作業者ID「w5」である。作業者ID「w5」に対する作業者割当処理は図14で説明する。
From the
図14は、最も高い選択確率が複数存在する場合の作業者割当処理の第3例を示す図である。図14において、手順(1)により、作業者リスト41から作業者ID「w5」が取り出され、手順(2)により、対話タスクテーブル42が参照されて、取り出した作業者ID「w5」の選択確率を算出する。
FIG. 14 is a diagram showing a third example of the worker allocation process when a plurality of the highest selection probabilities exist. In FIG. 14, the worker ID “w5” is extracted from the
この例の場合、対話タスクd1では、作成済みの3つの発話のうち作業者ID「w5」による発話は存在しないため、選択確率「0」を得る。対話タスクd2では、作成済みの4つの発話のうち2つが作業者ID「w5」によるものであるため、選択確率「1/2」(=2/4)を得る。 In the case of this example, in the dialogue task d1, since there is no utterance by the worker ID “w5” among the three created utterances, the selection probability “0” is obtained. In the dialogue task d2, since two of the four created utterances are due to the worker ID "w5", the selection probability "1/2" (= 2/4) is obtained.
対話タスクd3では、対話タスクd1と同様に、作業者ID「w5」による発話は存在しないため、選択確率「0」を得る。対話タスクd4では、作成済みの2つの発話のうち1つが作業者ID「w5」によるものであるため、選択確率「1/2」を得る。対話タスクd5も、対話タスクd1と同様に、作業者ID「w5」による発話は存在しないため、選択確率「0」を得る。 In the dialogue task d3, as in the dialogue task d1, since there is no utterance by the worker ID “w5”, the selection probability “0” is obtained. In the dialogue task d4, since one of the two created utterances is due to the worker ID "w5", the selection probability "1/2" is obtained. Similar to the dialogue task d1, the dialogue task d5 also has a selection probability of “0” because there is no utterance by the worker ID “w5”.
この例の場合、対話タスクd1〜d5において、作業者ID「w5」に関して、選択確率が最も高い対話タスクは「d2」と「d4」であり複数存在する。従って、手順(3)により、発話個数の最も少ない対話タスクを選択する。 In the case of this example, in the dialogue tasks d1 to d5, the dialogue tasks having the highest selection probability with respect to the worker ID "w5" are "d2" and "d4", and there are a plurality of dialogue tasks. Therefore, according to the procedure (3), the dialogue task with the smallest number of utterances is selected.
発話個数は、対話タスクd2とd4に対してカウントすればよい。対話タスクd2の発話個数は「4」であり、対話タスクd4の発話個数は「2」である。従って、発話個数の最も少ない対話タスクd4が選択される。 The number of utterances may be counted for the dialogue tasks d2 and d4. The number of utterances of the dialogue task d2 is "4", and the number of utterances of the dialogue task d4 is "2". Therefore, the dialogue task d4 with the smallest number of utterances is selected.
上述したような作業者割当処理を作業者リスト41から作業者IDを順に取り出すごとに繰り返す。一方、作業者リスト41へは、作業者割当処理とは独立して随時作業者IDを追加する処理を行う。
The worker allocation process as described above is repeated every time the worker ID is sequentially taken out from the
本実施例に係る種々の処理は、図15に示すようなシステム構成において行われる。図15は、本実施例におけるシステム構成例を示す図である。図15に示すシステム1000は、サーバ装置100と、携帯端末、PC(Personal Computer)等を含む複数の作業者端末3と、1以上の利用者端末6とを有し、サーバ装置100と複数の作業者端末3及び1以上の利用者端末とはネットワーク2を介して接続される。
Various processes according to this embodiment are performed in the system configuration as shown in FIG. FIG. 15 is a diagram showing a system configuration example in this embodiment. The system 1000 shown in FIG. 15 includes a
サーバ装置100は、本実施例に係る対話コーパス作成処理を実行する装置であり、不特定多数の作業者9に、複数の対話のそれぞれの目的に応じた発話を作成させることで、より利用価値の高い対話事例を蓄積して対話コーパスを作成する。
The
複数の作業者端末3は、作業者9により利用される端末であり、各作業者9は、作業者端末3をサーバ装置100にネットワーク2を介して接続することで、ネットワーク2を介して行われる対話に参加するこができる。
The plurality of
1以上の利用者端末6は、サーバ装置100が累積した、対話に係る一連の会話データ(対話コーパス)を利用する利用者7により利用される端末であり、利用者7は、利用者端末6をサーバ装置100にネットワーク2を介して接続し、サーバ装置100から会話データを取得する。
The one or
サーバ装置100は、コンピュータによって制御される情報処理装置であって、CPU(Central Processing Unit)11と、主記憶装置12と、補助記憶装置13と、入力装置14と、表示装置15と、通信I/F(インターフェース)17と、ドライブ装置18とを有し、バスB1に接続される。
The
CPU11は、主記憶装置12に格納されたプログラムに従ってサーバ装置100を制御するプロセッサに相当する。主記憶装置12には、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU11にて実行されるプログラム、CPU11での処理に必要なデータ、CPU11での処理にて得られたデータ等を記憶又は一時保存する。
The CPU 11 corresponds to a processor that controls the
補助記憶装置13には、HDD(Hard Disk Drive)等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置13に格納されているプログラムの一部が主記憶装置12にロードされ、CPU11に実行されることによって、各種処理が実現される。 An HDD (Hard Disk Drive) or the like is used in the auxiliary storage device 13, and data such as a program for executing various processes is stored in the auxiliary storage device 13. Various processes are realized by loading a part of the program stored in the auxiliary storage device 13 into the main storage device 12 and executing the program in the CPU 11.
入力装置14は、マウス、キーボード等を有し、管理者がサーバ装置100による処理に必要な各種情報を入力するために用いられる。表示装置15は、CPU11の制御のもとに必要な各種情報を表示する。入力装置14と表示装置15とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。通信I/F17は、有線又は無線などのネットワークを通じて通信を行う。通信I/F17による通信は無線又は有線に限定されるものではない
サーバ装置100によって行われる処理を実現するプログラムは、例えば、CD−ROM(Compact Disc Read-Only Memory)等の記憶媒体19によってサーバ装置100に提供される。
The input device 14 has a mouse, a keyboard, and the like, and is used by the administrator to input various information necessary for processing by the
ドライブ装置18は、ドライブ装置18にセットされた記憶媒体19(例えば、CD−ROM等)とサーバ装置100とのインターフェースを行う。
The drive device 18 interfaces the storage medium 19 (for example, a CD-ROM or the like) set in the drive device 18 with the
また、記憶媒体19に、後述される本実施の形態に係る種々の処理を実現するプログラムを格納し、この記憶媒体19に格納されたプログラムは、ドライブ装置18を介してサーバ装置100にインストールされる。インストールされたプログラムは、サーバ装置100により実行可能となる。
Further, a program for realizing various processes according to the present embodiment described later is stored in the storage medium 19, and the program stored in the storage medium 19 is installed in the
尚、プログラムを格納する記憶媒体19はCD−ROMに限定されず、コンピュータが読み取り可能な、データとしての構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。コンピュータ読取可能な記憶媒体として、CD−ROMの他に、DVDディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。 The storage medium 19 for storing the program is not limited to the CD-ROM, and one or more non-transitory, tangible (tangible) having a structure as data that can be read by a computer. ) Any medium. As the computer-readable storage medium, in addition to the CD-ROM, a portable recording medium such as a DVD disk or a USB memory, or a semiconductor memory such as a flash memory may be used.
複数の作業者端末3は、コンピュータによって制御されるタブレット型、携帯電話等の情報処理端末であって、CPU11aと、主記憶装置12aと、ユーザI/F(インターフェース)16aと、通信I/F17aと、ドライブ装置18aとを有し、バスB1に接続される。
The plurality of
CPU11aは、主記憶装置12aに格納されたプログラムに従って作業者端末3を制御するプロセッサに相当する。主記憶装置12aには、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU11aにて実行されるプログラム、CPU11aでの処理に必要なデータ、CPU11aでの処理にて得られたデータ等を記憶又は一時保存する。主記憶装置12aに格納されているプログラムが、CPU11aに実行されることによって、各種処理が実現される。
The
ユーザI/F16aは、CPU11aの制御のもとに必要な各種情報を表示し、また、ユーザによる操作入力を可能とするタッチパネル等である。通信I/F17aによる通信は無線又は有線に限定されるものではない。
The user I / F 16a is a touch panel or the like that displays various information required under the control of the
作業者端末3によって行われる処理を実現するプログラムは、ネットワーク2を介して外部装置からダウンロードされる。或いは、予め作業者端末3の主記憶装置12a又は記憶媒体19aに記憶されていても良い。主記憶装置12a及び/又は記憶媒体19aが記憶部130aに相当する。
The program that realizes the processing performed by the
ドライブ装置18aは、ドライブ装置18aにセットされた記憶媒体19a(例えば、SD(Secure Digital)メモリカード等)と作業者端末3とのインターフェースを行う。尚、記憶媒体19aは、コンピュータが読み取り可能な、データとしての構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。
The
利用者端末6のハードウェア構成は、作業者端末3と同様であるためその詳細な説明を省略する。また、作業者端末3及び利用者端末6は、デスクトップ型、ノートブック型、ラップトップ型等の情報処理端末であっても良く、そのハードウェア構成は、サーバ装置100のハードウェア構成と同様であるので、その説明を省略する。
Since the hardware configuration of the
図16は、本実施例のシステムにおける全体処理の概要を説明するための図である。図16では、本実施例のシステムにおける全体処理の概要を処理シーケンスを用いて説明する。 FIG. 16 is a diagram for explaining an outline of the overall processing in the system of this embodiment. In FIG. 16, an outline of the overall processing in the system of this embodiment will be described using a processing sequence.
作業者9が作業者端末3から対話参加要求3aをサーバ装置100へ送信する(ステップS1)。対話参加要求3aには作業者IDが含まれている。作業者IDは、対話参加要求3aを行う前にサーバ装置100から取得しておいても良いし、初めての対話参加要求3aに応じてサーバ装置100が作業者IDを付与し、作業者端末3に通知してもよい。以後は、サーバ装置100から与えられた作業者IDを指定して、対話参加要求3aをサーバ装置100へと送信する。
The
サーバ装置100では、対話参加要求3aで指定される作業者IDを用いて、作業者IDを割り当てる対話を特定する作業者割当処理を行って(ステップS2)、対話参加要求3aの要求元である作業者端末3に対話タスク提示を行って、対話タスクを作業者端末3に表示させる(ステップS4)。対話タスク提示3bには、対話前提情報、発話履歴情報等が含まれる。対話前提情報は、対話がなされる場面(前提)の説明を含み、作業者9に自身の役割を理解させるための情報である。発話履歴情報は、対話画面G70に表示される既になされた対話の内容に相当する。
The
作業者端末3では、対話画面G70がユーザI/F16aに表示され、作業者9により発話が作成されると(ステップS5)、発話作成情報3cがサーバ装置100へ送信される(ステップS6)。発話作成情報3cには、不適切チェックの有無、終了有無、作業者9が対話画面G70の発話入力域72に入力した発話を表わす発話データ等を含む。
On the
サーバ装置100は、発話作成情報3cの受信に応じて、発話作成処理を行う(ステップS7)。発話作成処理において、サーバ装置100は、発話データを記憶部130に蓄積し、作業者9に割り当てた対話タスクに対応付けて発話データを特定する発話IDを追加し、対話タスクにおける発話スコアを更新する(ステップS7)。このようなステップS1〜S7が適宜繰り返される。
The
一方、利用者7が利用者端末6から対話データ取得要求6aを行うと(ステップS8)、サーバ装置100は、対話データ取出処理を行う(ステップS9)。対話データ取出処理において、サーバ装置100は、全ての対話を対象にして、発話スコアに基づいて作業者9に対する作業者スコアを算出する。また、サーバ装置100は、対話毎に対話に関連付けられた発話毎の発話スコアに基づいて対話スコアを算出する。
On the other hand, when the user 7 makes the dialogue data acquisition request 6a from the user terminal 6 (step S8), the
そして、所定条件に基づくスコア付き対話データ6bを提供する(ステップS10)。所定条件は、例えば、利用者7が所望する対話スコアの閾値等であり、対話データ取得要求6aで指定されてもよいし、対話データ取出処理にて予め設定されたデフォルトの閾値であってもよい。
Then, the
図17は、サーバ装置の機能構成例を示す図である。図17において、サーバ装置100は、主に、初期化部50と、作業者登録部51と、作業者割当部52と、発話作成部55と、対話データ取出部57と、ユーザI/F60とを有する。初期化部50と、作業者登録部51と、作業者割当部52と、発話作成部55と、対話データ取出部57と、ユーザI/F60とは、対応するプログラムをCPU11aが実行することで行われる処理に相当する。
FIG. 17 is a diagram showing a functional configuration example of the server device. In FIG. 17, the
記憶部130には、作業者リスト41、対話タスクテーブル42、発話テーブル43、発話データDB44、作業者スコアテーブル45、スコア付き対話データ6b等が記憶される。
The
初期化部50は、本実施例に係るシステムの運用開始時、対話コーパスの作成をリセット等する際に作業者リスト41、対話タスクテーブル42等を初期化する。
The
作業者登録部51は、ユーザI/F60を介して対話参加要求3aの受信に応じて、対話参加要求3aで指定される作業者IDを作業者リスト41に登録する処理部である。
The
作業者割当部52は、ユーザI/F60を介して対話参加要求3aの受信に応じて、1発話ごとに作業者9を特定し、特定した作業者9に発話を作成してもらう対話タスクを選択し、対話タスク提示3bを作業者端末9に行う処理部である。1発話ごとに作業者9を特定する処理は、作業者割当部52により行われる処理の一部であり、作業者ID取出部に相当する。作業者割当部52は、更に、対話タスク生成部54を含む対話タスク選択部53を有する。
The
対話タスク選択部53は、作業者割当部52から呼び出される処理部であり、選択部に相当する。対話タスク選択部53は、上述した作業者割当手順に従って、作業者9に割り当てる対話タスクを選択する。対話タスク選択部53は、対話タスク生成部54を呼び出して、対話タスクを生成させ、生成した対話タスクをユーザI/F60を介して作業者端末3に送信して表示させる。
The dialogue
発話作成部55は、ユーザI/F60を介して作業者端末3から発話作成情報3cを受信すると、対話タスクテーブル42を更新する。発話作成情報3cから取得される発話データは、新たに付与された発話IDと共に発話データDB44に蓄積される。発話データDB44は、対話コーパス1aに相当する。
When the
発話作成部55は、更に、発話情報更新部56を有し、発話情報更新部56を呼び出すことにより、発話データを追加し、対話タスクの発話スコアを再計算させ更新させる。
The
発話情報更新部56は、発話作成情報3cに基づき、発話テーブル43で管理される発話木構造を更新し、発話スコアを更新する。
The utterance
対話データ取出部57は、ユーザI/F60を介して利用者端末6から対話データ取得要求6aを受信すると、発話テーブル43を参照して、作業者スコアと、対話スコアとを算出し、スコア付き対話データ6bを出力する。対話データ6bの一部又は全部を利用者端末6に提供してもよい。利用者7がサーバ装置100の管理者である場合、入力装置114から対話データ取得要求6aを行ってもよい。
When the dialogue
対話データ取出部57は、更に、作業者スコア算出部58と、発話スコア算出部59とを有する。対話データ取出部57は、作業者スコア算出部58を呼び出して、発話テーブル43を用いて作業者9それぞれの作業者スコアを算出させる。作業者スコア算出部58によって作業者スコアテーブル45が記憶部130に出力され記憶される。
The dialogue
対話データ取出部57は、発話スコア算出部59を呼び出して、作業者スコアテーブル45を用いて対話タスクごとの対話スコアを算出する。対話データ取出部57によってスコア付き対話データ6bが記憶部130に出力され記憶される。
The dialogue
ユーザI/F60は、サーバ装置100と作業者端末3の作業者9とのインタフェース、及びサーバ装置100と利用者端末6の利用者7とインタフェースを、通信I/F117を介して行う。
The user I /
次に、記憶部130に記憶される種々のデータ構成について図18から図23について説明する。
Next, FIGS. 18 to 23 will be described with respect to various data configurations stored in the
図18は、作業者リストのデータ構成例を示す図である。図18に示す作業者リスト41は、図10で説明したように、作業者9の作業者IDを追加した順で取り出すキュー構造を持つリストである。
FIG. 18 is a diagram showing an example of data structure of the worker list. As described with reference to FIG. 10, the
この例では、作業者リスト41の左から順に追加順に、w4、w9、w21、w10、w5、w7、w8、そしてw40が示されている。作業者リスト41の長さは、作業者IDの追加及び取り出しにより伸縮し、作業者リスト41は拡張可能な記憶領域である。
In this example, w4, w9, w21, w10, w5, w7, w8, and w40 are shown in order of addition from the left of the
図19は、対話タスクテーブルのデータ構成例を示す図である。図19において、対話タスクテーブル42は、対話タスク毎に、発話を作成した順で作業者IDを記録したテーブルであり、対話ID、作業者IDのリスト等の項目を有する。 FIG. 19 is a diagram showing an example of data configuration of the interactive task table. In FIG. 19, the dialogue task table 42 is a table in which worker IDs are recorded in the order in which utterances are created for each dialogue task, and has items such as a dialogue ID and a list of worker IDs.
対話IDは、対話タスクを特定する識別情報である。全ての対話タスクはタスクテーブル42に登録され管理される。作業者IDのリストは、発話作成毎に、作業者IDを作成順に記録した一覧である。 The dialogue ID is identification information that identifies the dialogue task. All interactive tasks are registered and managed in the task table 42. The list of worker IDs is a list in which worker IDs are recorded in the order of creation for each utterance creation.
この例では、対話ID「d1」に対して、作業者ID「w4」及び「W11」が記録されている。対話ID「d2」に対して、作業者ID「w5」、「w7」、「w5」、及び「W8」が記録されている。 In this example, the worker IDs "w4" and "W11" are recorded for the dialogue ID "d1". Worker IDs "w5", "w7", "w5", and "W8" are recorded for the dialogue ID "d2".
図20は、発話テーブルのデータ構成例を示す図である。図20において、発話テーブル43は、対話タスクに対して作成された発話を発話木構造8で記録し管理するテーブルである。発話テーブル43は、対話ID、発話ID、親発話、作業者ID、発話スコア(US)、支持数等の項目を有する。 FIG. 20 is a diagram showing an example of data structure of the utterance table. In FIG. 20, the utterance table 43 is a table for recording and managing the utterances created for the dialogue task in the utterance tree structure 8. The utterance table 43 has items such as a dialogue ID, an utterance ID, a parent utterance, an operator ID, an utterance score (US), and a number of supporters.
対話IDは、対話を特定する識別情報を示し、対話タスクテーブル42に登録された識別情報である。発話IDは、作成された発話を表わす発話データと関連付けられて発話データDB44で管理されている識別情報である。
The dialogue ID indicates identification information that identifies the dialogue, and is identification information registered in the dialogue task table 42. The utterance ID is identification information that is associated with the utterance data representing the created utterance and is managed in the
親発話は、発話木構造8において、親の関係にある発話IDを示す。作業者IDは、発話を作成した作業者9を特定する識別情報を示す。発話スコア(US)は、支持数に基づいて算出された値を示し、発話の追加毎に更新される。支持数は、発話の追加毎に加算又は減算された値を示し、発話スコアの算出時に参照される。
The parent utterance indicates an utterance ID having a parental relationship in the utterance tree structure 8. The worker ID indicates identification information that identifies the
このデータ例では、対話ID「d2」に関して、発話ID「u21」〜「u27」が記録されている。発話ID「u21」のレコードでは、自身が親発話に相当するため、親発話IDは存在せず、発話作成者は作業者ID「w1」の作業者9であり、発話スコアは「1」であり、支持数「1」を示している。
In this data example, the utterance IDs "u21" to "u27" are recorded with respect to the dialogue ID "d2". In the record of the utterance ID "u21", since the utterance ID corresponds to the parent utterance, the utterance ID does not exist, the utterance creator is the
発話ID「u22」のレコードでは、親発話IDは「u21」であり、発話作成者は作業者ID「w4」の作業者9であり、発話スコアは「0」であり、支持数「0」を示している。発話ID「u23」のレコードでは、親発話IDは「u21」であり、発話作成者は作業者ID「w7」の作業者9であり、発話スコアは「2/3」であり、支持数「2」を示している。発話ID「u24」のレコードでは、親発話IDは「u21」であり、発話作成者は作業者ID「w2」の作業者9であり、発話スコアは「1/3」であり、支持数「1/3」を示している。
In the record of the utterance ID "u22", the parent utterance ID is "u21", the utterance creator is the
発話ID「u25」のレコードでは、親発話IDは「u23」であり、発話作成者は作業者ID「w3」の作業者9であり、発話スコアは「1」であり、支持数「1」を示している。発話ID「u26」のレコードでは、親発話IDは「u25」であり、発話作成者は作業者ID「w5」の作業者9であり、発話スコアは「1」であり、支持数「1」を示している。発話ID「u27」のレコードでは、親発話IDは「u26」であり、発話作成者は作業者ID「w6」の作業者9であり、発話スコアは「1」であり、支持数「1」を示している。
In the record of the utterance ID "u25", the parent utterance ID is "u23", the utterance creator is the
このようなデータにより、発話木構造8kを表わすことができる。発話木構造8kは、対話d2を構成する発話作成の系図を表わしている。ノードは発話を示し、発話IDがノード内に示されている。また、枝に作業者IDを示し、ノード近傍に発話スコアを示している。 With such data, the utterance tree structure 8k can be represented. The utterance tree structure 8k represents a genealogy of utterance creation that constitutes dialogue d2. The node indicates an utterance, and the utterance ID is indicated in the node. In addition, the worker ID is shown on the branch, and the utterance score is shown near the node.
図21は、発話データDBのデータ構成例を示す図である。図21において、発話データDB44は、作業者端末3から受信した発話データを発話IDに対応付けて記憶し管理するデータベースであり、発話ID、発話データ等の項目を有する。
FIG. 21 is a diagram showing a data configuration example of the utterance data DB. In FIG. 21, the
発話IDは、作業者端末3から受信した発話データ毎に一意に付与される識別情報であり、発話データDB44で全ての発話データが発話IDにより管理される。発話IDにより、発話データDB44と発話テーブル43とが関連付けされる。
The utterance ID is identification information uniquely assigned to each utterance data received from the
発話データは、作業者端末3から受信した発話作成情報3cから取得した、作業者9が作成した発話を表わすデータである。一例として、発話データは、テキスト、音声データ、対話状況を表現した画像や動画等である。
The utterance data is data representing the utterance created by the
このデータ例では、発話ID「u11」の発話データは「どちらへおでかけですか」であり、発話ID「u12」の発話データは「シカゴに行きます」であり、発話ID「u13」の発話データは「楽しんできてください」等が記録されている。他の発話IDについても同様に、作業者9が作成した内容そのものが示される。
In this data example, the utterance data of the utterance ID "u11" is "Where are you going?", The utterance data of the utterance ID "u12" is "Go to Chicago", and the utterance data of the utterance ID "u13". "Please enjoy" etc. are recorded. Similarly, for the other utterance IDs, the content itself created by the
図22は、作業者スコアテーブルのデータ構成例を示す図である。図22において、作業者スコアテーブル45は、作業者9毎の作業者スコアを記録し管理するテーブルであり、作業者ID、作業者スコア等の項目を有する。
FIG. 22 is a diagram showing an example of data structure of the worker score table. In FIG. 22, the worker score table 45 is a table for recording and managing the worker score for each
作業者IDは、作業者リスト41に1度以上追加されたことのある作業者IDを示す。作業者IDによって、発話テーブル43と作業者スコアテーブル45とが関連付けされる。
作業者スコアは、発話テーブル43の作業者IDに対応付けられている発話スコアを用いて算出されたスコアを示し、作業者9の発話作成に対する誠実な貢献度(作成した発話の内容の信頼度)を示す。
The worker ID indicates a worker ID that has been added to the
The worker score indicates a score calculated using the utterance score associated with the worker ID of the utterance table 43, and the degree of sincere contribution to the utterance creation of the worker 9 (reliability of the content of the created utterance). ) Is shown.
図23は、スコア付き対話データのデータ構成例を示す図である。図23において、スコア付き対話データ6bは、対話タスクを評価した結果を示すテーブルであり、対話ID、対話スコア、発話1、発話2、発話3等の項目を有する。
FIG. 23 is a diagram showing a data structure example of dialogue data with a score. In FIG. 23, the scored
対話IDは、対話タスクを特定する識別情報であり、対話タスクテーブル42に存在する対話IDのいずれかを示す。対話スコアは、発話テーブル43の発話スコアに基づいて、最も支持されたパスを特定し、特定したパス上で示される発話スコアを用いて算出された値を示し、対話タスクの完成度を示す。対話スコアが「1」の場合に最も完成度が高く、「0」に近付くほど完成度が低いことを示す。発話1、発話2、発話3等は、最も支持されたパス上でなされた発話データを示す。
The dialogue ID is identification information that identifies the dialogue task, and indicates any of the dialogue IDs existing in the dialogue task table 42. The dialogue score identifies the most supported path based on the utterance score of the utterance table 43, indicates a value calculated using the utterance score shown on the identified path, and indicates the degree of completion of the dialogue task. When the dialogue score is "1", the degree of completion is the highest, and the closer it is to "0", the lower the degree of completion.
このデータ例では、対話ID「d1」について、対話スコアは「1」を示し、最も支持されたパス上でなわれた発話は、発話1「どちらへおでかけですか」、発話2「シカゴに行きます」、発話3「楽しんできてください」等であったことが示されている。
In this data example, for the dialogue ID "d1", the dialogue score is "1", and the utterances made on the most supported path are utterance 1 "Where are you going?" And
対話ID「d3」について、対話スコアは「0.75」を示し、最も支持されたパス上でなわれた発話は、発話1「どこへ行きますか」、発話2「見送りです」、発話3「[終了]」が示されている。作業者9がこの対話は直前の発話で完結したと判断し、対話画面G70の終了チェック領域74をチェックした場合に、発話3のように[終了]が示される。
For the dialogue ID "d3", the dialogue score is "0.75", and the utterances made on the most supported path are utterance 1 "where are you going",
次に、各処理部50〜58における処理について説明する。以下の図において、点線はデータの流れを示し、実線は処理の流れを示す。先ず、初期化部50による初期化処理について説明する。
Next, the processing in each
図24は、初期化処理を説明するためのフローチャート図である。図24において、初期化部50は、対話数を取得する(ステップS201)。対話数の取得は、記憶部130に予め設定された対話数を読み込むことでもよいし、入力画面を表示装置115に表示して、サーバ装置100の管理者等により初期設定として入力させてもよい。初期化部50は、作業者リスト41を空にし(ステップS202)、対話数に基づいて、対話タスクテーブル42を初期化する(ステップS203)。
FIG. 24 is a flowchart for explaining the initialization process. In FIG. 24, the
対話タスクテーブル42の初期化の一例として、対話数「5」が指定された場合、対話タスクを識別する対話IDを5個生成し、対話タスクテーブル42に登録する。対話ID「d1」、「d2」、「d3」、「d4」、及び「d5」が生成された場合、対話ID毎にレコードが対話タスクテーブル42に生成される。 As an example of initialization of the dialogue task table 42, when the number of dialogues "5" is specified, five dialogue IDs that identify the dialogue tasks are generated and registered in the dialogue task table 42. When the dialogue IDs "d1", "d2", "d3", "d4", and "d5" are generated, a record is generated in the dialogue task table 42 for each dialogue ID.
次に、作業者登録部51による作業者登録処理と、作業者割当部52による作業者割当処理とについて説明する。図25は、作業者登録処理と作業者割当処理とを説明するためのフローチャート図である。
Next, the worker registration process by the
図25において、作業者登録部51は、対話参加要求3aをユーザI/F60を介して受信すると、対話参加要求3aから作業者IDを取得して、作業者リスト41へ追加する(ステップS211)。作業者登録部51は、対話参加要求3aの受信毎に、同様の処理を行う。
In FIG. 25, when the
一方、作業者割当部52は、所定間隔で、作業者リスト41から順に作業者IDを1つ取り出して(ステップS221)、対話タスク選択部53を呼び出して作業者ID及び対話タスクテーブル42を通知して、対話タスク選択部53により対話タスク選択処理を行う(ステップS222)。作業者IDに対して割り当てる対話タスクが対話IDにより特定される。作業者割当部52によるステップS221は作業者ID取出部に相当し、対話タスク選択部53によるステップS222は選択部に相当する。
On the other hand, the
タスク選択処理により対話タスクが特定されると、作業者割当部52は、作業者リスト41は空か否かを判定する(ステップS224)。作業者リスト41が空でない場合(ステップS224のNO)、作業者割当部52は、ステップS221へと戻り、上記同様の処理を繰り返す。一方、作業者リスト41が空の場合(ステップS224のYES)、作業者割当部52は、この作業者割当処理を終了する。
When the interactive task is specified by the task selection process, the
図26は、図25のステップS222における対話タスク選択処理を説明するためのフローチャート図である。図26において、対話タスク選択部53は、作業者割当部52から作業者ID及び対話タスクテーブル42を受け取ると、対話タスクテーブル42の全ての対話IDに対して選択確率を算出する(ステップS231)。
FIG. 26 is a flowchart for explaining the dialogue task selection process in step S222 of FIG. 25. In FIG. 26, when the dialogue
上述した作業者割当手順に従って、対話IDごとに選択確率が求められる。対話タスクが、通知された作業者IDで終わっている場合には、
選択確率 = 0
とする。それ以外では、
選択確率 = 作業者IDの出現回数/発話個数
により算出する。
The selection probability is obtained for each dialogue ID according to the worker allocation procedure described above. If the interactive task ends with the notified worker ID,
Selection probability = 0
And. Otherwise
Selection probability = Calculated based on the number of occurrences / number of utterances of the worker ID.
対話タスク選択部53は、選択確率の最大値を持つ対話IDを対話タスクテーブル42から選択し(ステップS232)、選択した対話IDの数は1つか否かを判断する(ステップS233)。選択した対話IDの数は1つの場合(ステップS233のYES)、対話タスク選択部53は、ステップS237へと進む。
The dialogue
一方、選択した対話IDの数が複数の場合(ステップS233のNO)、対話タスク選択部53は、発話個数が最小の対話IDを選択し(ステップS234)、選択した対話IDの数は1つか否かを判断する(ステップS235)。選択した対話IDの数は1つの場合(ステップS235のYES)、対話タスク選択部53は、ステップS237へと進む。
On the other hand, when the number of selected dialogue IDs is plural (NO in step S233), the dialogue
一方、選択した対話IDの数が複数の場合(ステップS235のNO)、対話タスク選択部53は、選択した複数の対話IDからランダムに1つを選択し(ステップS236)、対話タスク生成部54を呼び出して、対話ID及び発話テーブル43を通知し、対話タスク生成部54により対話タスク生成処理を行う(ステップS237)。対話IDに対応する対話タスクが生成される。
On the other hand, when the number of selected dialogue IDs is plural (NO in step S235), the dialogue
対話タスク選択部53は、対話タスクを取得すると、作業者割当部52への戻り値として設定し、この対話タスク選択処理を終了する。
When the dialogue
図27は、図26のステップS237における対話タスク生成処理を説明するためのフローチャート図である。図27では、対話IDで特定された対話タスクが発話の作成毎に、<ケース1>→<ケース2>→<ケース3>→<ケース4>の順に遷移した場合に対応付けて説明する。対話タスク生成部54から指定される対話IDの発話木構造8は、<ケース1>、<ケース2>、<ケース3>、又は<ケース4>のいずれかに相当する。
FIG. 27 is a flowchart for explaining the dialogue task generation process in step S237 of FIG. 26. In FIG. 27, a case where the dialogue task specified by the dialogue ID transitions in the order of <
対話タスク生成部54は、対話タスク生成部54から受け付けた発話テーブル43と対話IDとを用いて、発話テーブル43における指定された対話IDに対応付けられる発話IDを発話木構造8に従ってたどり、末端の発話IDのうち、発話スコアが0でない発話IDを取得する(ステップS241)。
The dialogue
対話タスク生成部54は、取得した発話IDの数が1であったか2であったかを判断する(ステップS242)。
The dialogue
取得した発話IDは1つであった場合、対話タスク生成部54は、発話テーブル43から取得した発話IDを用いて発話データDB44を参照し発話履歴情報を取得して、対話タスクを作成する(ステップS243)。
When there is only one utterance ID acquired, the dialogue
この場合は<ケース1>に相当する。親の発話ID「A」に対して子の発話IDは「D」のみである。従って、ステップS243では、発話データDB44から発話ID「A」で特定される発話データと、発話ID「D」で特定される発話データとにより、<ケース1>の発話木構造8に従って時系列に並べることで発話履歴情報を取得する。この発話履歴情報を含む対話タスクが作成される。
In this case, it corresponds to <
その後、対話タスク生成部54は、作成した対話タスクを戻り値として設定し、この対話タスク生成処理を終了する。
After that, the dialogue
ステップS242において取得した発話IDは2つであると判断した場合、対話タスク生成部54は、発話テーブル43から発話IDのそれぞれの支持数を取得し、取得した支持数の合計値が2を示すか3を示すかを判断する(ステップS244)。
When it is determined that the number of utterance IDs acquired in step S242 is two, the dialogue
ステップS244において指示数の合計値が2を示すと判断した場合、対話タスク生成部54は、最後に追加された発話IDを除く発話IDを用いて発話データDB44を参照し発話履歴情報を取得して、対話タスクを作成する(ステップS245)。
When it is determined in step S244 that the total value of the number of instructions indicates 2, the dialogue
この場合は<ケース2>又は<ケース3>に相当する。<ケース2>の場合、最後に追加された発話IDは「C」であるため、この発話ID「C」が除かれる。従って、発話データDB44から発話ID「A」で特定される発話データと、発話ID「D」で特定される発話データとにより、<ケース2>の発話木構造8に従って時系列に並べることで発話履歴情報を取得する。この発話履歴情報を含む対話タスクが作成される。
In this case, it corresponds to <
<ケース3>の場合、最後に追加された発話IDは「E」であるため、この発話ID「E」が除かれる。更に、発話ID「D」の発話は不適切であると判断されているため考慮せず、発話データDB44から発話ID「A」で特定される発話データと、発話ID「C」で特定される発話データとにより、<ケース3>の発話木構造8に従って時系列に並べることで発話履歴情報を取得する。この発話履歴情報を含む対話タスクが作成される。
In the case of <
その後、対話タスク生成部54は、作成した対話タスクを戻り値として設定し、この対話タスク生成処理を終了する。
After that, the dialogue
ステップS244において取得した指示数の合計値が3を示すと判断した場合、対話タスク生成部54は、発話テーブル44を参照して、発話スコアの最も高い発話を選択して、対話タスクを作成する(ステップS246)。
When it is determined that the total value of the number of instructions acquired in step S244 indicates 3, the dialogue
この場合は<ケース4>に相当する。<ケース4>の場合、発話スコアの最も高い発話IDは「F」である。発話ID「F」を有するパスに従って、発話データDB44から発話ID「A」で特定される発話データと、発話ID「D」で特定される発話データと、発話ID「F」で特定される発話データとにより、<ケース4>の発話木構造8に従って時系列に並べることで発話履歴情報を取得する。この発話履歴情報を含む対話タスクが作成される。
In this case, it corresponds to <
その後、対話タスク生成部54は、作成した対話タスクを戻り値として設定し、この対話タスク生成処理を終了する。
After that, the dialogue
次に、発話作成部55による発話作成処理を説明する。図28は、発話作成処理を説明するためのフローチャート図である。図28において、発話作成部55は、ユーザI/F60を介して発話作成情報3cを受信すると、発話作成情報3c内の発話データに発話IDを付与して、発話データDB44に記録し、発話IDを対話タスクテーブル42へ追加する(ステップS251)。
Next, the utterance creation process by the
そして、発話作成部55は、発話作成情報3cから不適切チェック有無を取得して、取得した不適切チェック有無と、発話IDと、発話テーブル43とを発話情報更新部56に通知して、発話情報更新処理を行う(ステップS252)。発話情報更新処理により発話テーブル43が更新され、発話作成部55は、この発話作成処理を終了する。
Then, the
次に、発話情報更新部56による発話情報更新処理について説明する。図29は、図28のステップS252における発話情報更新処理を説明するためのフローチャート図である。
Next, the utterance information update process by the utterance
図29において、発話情報更新部56は、発話IDを新しく追加するのか否かを判断する(ステップS261)。発話木構造8pの最後の発話ID「D」を親発話IDとする発話IDが他になければ、新たに追加する発話であると判断する。
In FIG. 29, the utterance
一例として、図28では、割り当てた対話が発話木構造8pで表現される場合は、新たな発話IDの追加であると判断する。一方、割り当てた対話が発話木構造8qで表現される場合は、新たな発話IDは新たな追加ではないと判断する。
As an example, in FIG. 28, when the assigned dialogue is represented by the
ステップS261において新しく追加すると判断した場合、発話情報更新部56は、更に、最後の発話が不適切であるか否かを判断する(ステップS262)。不適切チェック無しの場合、発話情報更新部56は、最後の発話は不適切でないと判定し、発話テーブル43に新たな発話IDを追加登録し、支持数に1を設定する(ステップS263)。
When it is determined in step S261 that a new utterance is to be added, the utterance
最後の発話ID「D」を親発話IDとした、支持数「1」の新たな発話IDのレコードが発話テーブル43に追加される。発話木構造8pは発話木構造8p−1に遷移する。そして、発話情報更新部56は、ステップS268へと進む。
A record of a new utterance ID having a support number of "1" with the last utterance ID "D" as the parent utterance ID is added to the utterance table 43. The
一方、ステップS262において、不適切チェック有りの場合、発話情報更新部56は、最後の発話は不適切であると判定し、発話テーブル43に新たな発話IDを追加登録し、最後の発話IDと同じ親発話IDを設定し、支持数を1に設定する(ステップS264)。
On the other hand, in step S262, when there is an inappropriate check, the utterance
最後の発話IDと同じ親発話IDが設定され、支持数「1」の新たな発話IDのレコードが発話テーブル43に追加される。発話木構造8pは発話木構造8p−2に遷移する。そして、発話情報更新部56は、ステップS268へと進む。
The same parent utterance ID as the last utterance ID is set, and a record of a new utterance ID with a support number of "1" is added to the utterance table 43. The
ステップS261において新しく追加しないと判断した場合、発話情報更新部56は、更に、最後の発話が不適切であるか否かを判断する(ステップS265)。不適切チェック無しの場合、発話情報更新部56は、最後の発話は不適切でないと判定し、発話テーブル43において、親発話IDに対して支持数を1増やし、新たな発話IDを追加登録し、その支持数を1に設定する(ステップS266)。
If it is determined in step S261 that no new utterance is to be added, the utterance
親発話IDのレコードの支持数が1加算され、支持数「1」の新たな発話IDのレコードが発話テーブル43に追加される。発話木構造8q発話木構造8q−1に遷移する。そして、発話情報更新部56は、ステップS268へと進む。
The number of support of the record of the parent utterance ID is added by 1, and the record of the new utterance ID with the number of support "1" is added to the utterance table 43. Speaking
一方、ステップS265において、不適切チェック有りの場合、発話情報更新部56は、最後の発話は不適切であると判定する。そして、発話情報更新部56は、発話テーブルにおいて、最後の発話IDに対して支持数を0に設定し、新たな発話IDを追加登録し、最後の発話IDと同じ親発話IDを設定し、支持数を1に設定する(ステップS267)。
On the other hand, in step S265, when there is an inappropriate check, the utterance
最後の発話IDのレコードの支持数が0に設定さら、最後の発話IDと同じ親発話IDを持ち、支持数「1」の新たな発話IDのレコードが発話テーブル43に追加される。発話木構造8q発話木構造8q−2に遷移する。そして、発話情報更新部56は、ステップS268へと進む。
The number of support of the record of the last utterance ID is set to 0. Further, the record of the new utterance ID having the same parent utterance ID as the last utterance ID and the number of support "1" is added to the utterance table 43. The
ステップS268では、発話情報更新部56は、支持数が変化したノードと、その兄弟ノードそれぞれに対して、発話スコアを算出し、それぞれのレコードに設定する。発話スコアは、
支持数 ÷ 兄弟ノードの合計支持数
により得られる。
In step S268, the utterance
Support number ÷ Obtained by the total support number of sibling nodes.
発話木構造8p−1では、新たな発話ID「N」の兄弟ノードは存在しないため、発話スコアは「1」となる。
In the
また、発話木構造8p−2では、新たな発話ID「N」の兄弟ノードは発話ID「D」である。従って、発話ID「N」の発話スコアに「1/2」が設定され、発話ID「D」の発話スコアに「1/2」が設定される。
Further, in the
一方、発話木構造8q−1では、支持数の変化した発話ID「D」には発話ID「C」の兄弟ノードが存在するため、発話ID「D」の発話スコアに「2/3」が設定され、発話ID「C」の発話スコアに「1/3」が設定される。発話ID「N」に兄弟は存在しないため、発話スコアは「1」となる。
On the other hand, in the
また、発話木構造8q−2では、支持数の変化した発話ID「D」には、発話ID「C」と、新たに追加した発話ID「N」とが兄弟ノードとして存在している。発話ID「D」の発話スコアは「0」であり、削除された状態を示す。兄弟ノードの、発話ID「C」の発話スコアに「1/2」が設定され、発話ID「N」の発話スコアに「1/2」が設定される。
Further, in the
次に、対話データ取出部57による対話データ取出処理を説明する。図30は、対話データ取出処理を説明するためのフローチャート図である。図30において、対話データ取出部57は、ユーザI/F60から対話データ取得要求6aの通知を受けると、作業者スコア算出部58を呼び出して、発話テーブル43を通知し、作業者スコア算出処理を行う(ステップS271)。対話データ取出部57は、作業者スコア算出部58から、戻り値として、作業者9毎に発話作成の内容に対する信頼度を示した作業者スコアテーブル45を取得する。
Next, the dialogue data retrieval process by the dialogue
そして、対話データ取出部57は、対話スコア算出部59を呼び出して、作業者スコア算出部58から得た作業者スコアテーブル45を通知し、対話スコア算出処理を行う(ステップS272)。対話データ取出部57は、対話スコア算出部59から、戻り値として、対話毎に文脈の適切さを示したスコア付き対話データ6bを取得する。
Then, the dialogue
次に、作業者スコア算出部58による作業者スコア算出処理について説明する。図31は、図30のステップS271における作業者スコア算出処理を説明するためのフローチャート図である。
Next, the worker score calculation process by the worker
図31において、作業者スコア算出部58は、発話テーブル43を参照して、作業者ID毎に、発話数と発話スコアの合計とを求める(ステップS281)。
In FIG. 31, the worker
そして、作業者スコア算出部58は、作業者ID毎に、求めた発話数と発話スコアの合計とから平均値を算出し、作業者IDと算出した平均値とを対応付けた作業者スコアテーブル45を作成する(ステップS282)。作業者スコア算出部58は、作成した作業者スコアテーブル45を戻り値に設定し、この作業者スコア算出処理を終了する。
Then, the worker
次に、対話スコア算出部59による対話スコア算出処理について説明する。図32は、図30のステップS272における対話スコア算出処理を説明するためのフローチャート図である。
Next, the dialogue score calculation process by the dialogue
図32において、対話スコア算出部59は、発話テーブル43を参照して、対話ID毎に、発話木構造8の親子関係に従い、発話スコアに基づいて発話IDを選択することで、最も支持されたパスを特定する(ステップS291)。2以上の発話IDに対して同一の親発話IDが対応付けられている場合、対話スコア算出部59は、発話スコアが最大値の発話IDを選択する。
In FIG. 32, the dialogue
対話スコア算出部59は、発話テーブル43を参照して、対話ID毎に、特定したパス上の発話IDに対応付けられた作業者IDを取得する(ステップS292)。更に、対話スコア算出部59は、作業者スコアテーブル45を参照して、対話ID毎に、特定したパス上の発話IDに対応付けられた作業者IDを取得する(ステップS293)。
The dialogue
また、対話スコア算出部59は、パス毎に、作業者スコアの合計値と、対話IDの総数とを用いて相乗平均を算出する(ステップS294)。
In addition, the dialogue
そして、対話スコア算出部59は、各対話IDに対して、最も支持されたパスの発話IDの順に、発話データDB44から発話データを取得して、対話IDと、対話スコアと、発話データとを対応付けたスコア付き対話データ6bを作成する(ステップS295)。対話スコア算出部59は、作成したスコア付き対話データ6bを戻り値に設定して、この対話スコア算出処理を終了する。
Then, the dialogue
上述より、本実施例では、作業者9のペアを作る必要がないため、ペアを作って時間を調整する等の作業コストを削減することができる。ペアを作る場合には、ペアの管理コストの負担や高い作業単価のために、一定の費用を用いて作成できる対話コーパスのサイズが小さくなる。そのため、小規模な対話コーパスしか作ることが出来なかった。
From the above, in this embodiment, since it is not necessary to make a pair of
一方、本実施例では、個別の作業者9による対話の発話作業が可能となるため、作業者9は、作業者端末3を用いて、任意の場所や時間に作業を行える。そのため不特定多数の作業者9が作業にあたることができ、大規模な対話コーパスの作成を可能とする。また、不特定多数の個別の作業者9に作業を発注する方法であるクラウドソーシングを利用できるようになる。
On the other hand, in the present embodiment, since the
更に、不適切な発話を作成する作業者9を作業者スコアに基づいて特定することが可能であり、作業者スコアにより作業者9をフィルタリングすることにより不適切な発話の作成を抑制できる。また、発話の適切さを示すスコアを算出可能であるため、質の良い対話を特定でき、対話の内容(対話の流れの発話データのセット)を提供可能である。
Further, it is possible to identify the
また、選択確率を用いた作業者9の対話への割り当てにより、作業者9の負荷を下げることができ、これにより作業単価を低く抑えることができる。
Further, by assigning the
クラウドソーシングでは、作業可能な作業者9の数は時系列上で一定ではないが、その数の如何によらず適切な作業の割り当てを行うことができる。
In crowdsourcing, the number of
本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、主々の変形や変更が可能である。 The present invention is not limited to the specifically disclosed examples, and major modifications and modifications can be made without departing from the scope of claims.
以上の本実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から、1発話ごとに取り出し、
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択し、
前記複数の作業者により前記対話を完成させた対話データを得る
処理をコンピュータに実行させる対話コーパス作成プログラム。
(付記2)
前記対話を割り当てた作業者の作業者端末に、該対話の対話情報の表示と、該対話情報で示される直前の発話の内容が不適切である場合のチェックと、前記発話データの入力領域とを有する作成画面を表示させ、
前記作業者端末から、少なくとも前記発話データと、前記不適切のチェック有無とを受信すると、受信した該発話データを、前記対話の進行に従って親子関係を持つ木構造で管理し、前記不適切のチェック有りの場合、前記受信した発話データを、親の発話データから枝分かれさせて直前の発話データと兄弟関係として前記記憶部に記録し、
直後の発話データと共に受信した前記不適切のチェックの有無に応じて、前記直前の発話データの不適切さを判定する
処理を前記コンピュータに実行させる付記1記載の対話コーパス作成プログラム。
(付記3)
前記木構造では、受信した前記発話データに対して、支持数を付与し、
前記直前の発話データに対して兄弟関係の別の発話データが存在する場合、受信した前記発話データと共に受信した前記不適切のチェックの有無に応じて、該直前の発話データの前記支持数を増減する
処理を前記コンピュータに実行させる付記2記載の対話コーパス作成プログラム。
(付記4)
前記支持数が増減した発話データと、該発話データの兄弟関係の発話データとに対して、前記支持数の合計に対する該発話データそれぞれの支持数の割合により、発話スコアを算出し前記記憶部に記憶する
処理を前記コンピュータに実行させる付記3記載の対話コーパス作成プログラム。
(付記5)
前記記憶部を参照して、作業者ID毎に、作成した前記発話データの個数と、前記発話スコアの合計値とを取得し、
前記作業者ID毎に、前記発話スコアの平均値を算出して、該作業者IDに算出した該平均値を対応付けて前記記憶部に記憶する
処理を前記コンピュータに実行させる付記4記載の対話コーパス作成プログラム。
(付記6)
前記記憶部を参照して、対話毎の発話データの木構造の親子関係と、前記発話スコアとに基づいて、該対話において最も支持された一連の発話データのつながりによるパスを特定し、
前記パス毎に、前記発話データを作成した作業者の作業者IDに対応付けられた前記平均値を前記記憶部から取得して合計し、合計した値とパスの総数とを用いて相乗平均を算出し、対話を特定する対話IDと算出した相乗平均とを対応付けて前記記憶部に記憶する
処理を前記コンピュータに実行させる付記5記載の対話コーパス作成プログラム。
(付記7)
前記パス上の親子関係に従って発話データを順に並べ、前記相乗平均と共に前記対話IDに対応付けたスコア付き対話データを作成する
処理を前記コンピュータに実行させる付記6記載の対話コーパス作成プログラム。
(付記8)
前記コンピュータに、
前記複数の対話それぞれにおいて、該対話に参加した作業者の作業者IDの記録に、取り出された前記作業者IDが存在する割合を算出させ、
最も高い割合の対話の最後に取り出された前記作業者IDを追加し、追加した該作業者IDで特定される作業者を該最も高い割合の対話に割り当てさせる
ことを特徴とする付記1乃至7のいずれか一項記載の対話コーパス作成プログラム。
(付記9)
前記コンピュータに、
前記最も高い割合の対話が複数存在する場合、該複数の対話から、取り出された前記作業者IDの出現回数が最も多い対話を選択する
ことを特徴とする付記8記載の対話コーパス作成プログラム。
(付記10)
前記コンピュータに、
前記最も高い割合の対話が複数存在し、かつ、取り出された前記作業者IDの出現回数が同数の場合、該複数の対話から、ランダムに対話を1つを選択する。
ことを特徴とする付記8記載の対話コーパス作成プログラム。
(付記11)
2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から、1発話ごとに取り出し、
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択し、
前記複数の作業者により前記対話を完成させた対話データを得る
処理をコンピュータが行う対話コーパス作成方法。
(付記12)
2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から、1発話ごとに取り出す作業者ID取出部と、
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択する選択部と
前記複数の作業者により前記発話データを作成させ、作成された発話データを収集する発話作成部と
を有する情報処理装置。
The following additional notes will be further disclosed with respect to the above embodiments including the present embodiment.
(Appendix 1)
From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. Take out for each utterance
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on, select the dialogue to which the worker who creates the utterance data is assigned, and
A dialogue corpus creation program that causes a computer to execute a process of obtaining dialogue data that completes the dialogue by the plurality of workers.
(Appendix 2)
Displaying the dialogue information of the dialogue on the worker terminal of the worker to which the dialogue is assigned, checking when the content of the utterance immediately before being indicated by the dialogue information is inappropriate, and the input area of the utterance data. Display the creation screen with
When at least the utterance data and the presence / absence of the inappropriate check are received from the worker terminal, the received utterance data is managed by a tree structure having a parent-child relationship according to the progress of the dialogue, and the inappropriate check is performed. If there is, the received utterance data is branched from the parent's utterance data and recorded in the storage unit as a sibling relationship with the immediately preceding utterance data.
The dialogue corpus creation program according to
(Appendix 3)
In the tree structure, a support number is given to the received utterance data, and the support number is given.
When another utterance data having a sibling relationship exists with respect to the immediately preceding utterance data, the number of supports of the immediately preceding utterance data is increased or decreased depending on the presence or absence of the inappropriate check received together with the received utterance data. The interactive corpus creation program according to
(Appendix 4)
The utterance score is calculated from the utterance data in which the number of support increases or decreases and the utterance data of the sibling relationship of the utterance data, and the ratio of the number of support of each of the utterance data to the total number of support is calculated and stored in the storage unit. The interactive corpus creation program according to
(Appendix 5)
With reference to the storage unit, the number of the created utterance data and the total value of the utterance score are acquired for each worker ID.
The dialogue according to
(Appendix 6)
With reference to the storage unit, the path of the most supported series of utterance data in the dialogue is identified based on the parent-child relationship of the tree structure of the utterance data for each dialogue and the utterance score.
For each pass, the average value associated with the worker ID of the worker who created the speech data is acquired from the storage unit and totaled, and the geometric mean is calculated using the total value and the total number of passes. The dialogue corpus creation program according to
(Appendix 7)
The dialogue corpus creation program according to
(Appendix 8)
On the computer
In each of the plurality of dialogues, the ratio of the extracted worker IDs present in the record of the worker IDs of the workers who participated in the dialogue is calculated.
(Appendix 9)
On the computer
The dialogue corpus creation program according to Appendix 8, wherein when a plurality of the dialogues having the highest ratio exist, the dialogue having the largest number of occurrences of the worker ID extracted is selected from the plurality of dialogues.
(Appendix 10)
On the computer
When a plurality of the highest ratio dialogues exist and the number of occurrences of the extracted worker IDs is the same, one dialogue is randomly selected from the plurality of dialogues.
The dialogue corpus creation program described in Appendix 8 characterized by the above.
(Appendix 11)
From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. Take out for each utterance
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on, select the dialogue to which the worker who creates the utterance data is assigned, and
A method of creating a dialogue corpus in which a computer performs a process of obtaining dialogue data in which the dialogue is completed by the plurality of workers.
(Appendix 12)
From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. The worker ID extraction section that retrieves each utterance,
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. A selection unit that selects the dialogue to which a worker who creates the utterance data is assigned according to a worker allocation procedure based on the above, and a utterance creation unit that causes the plurality of workers to create the utterance data and collects the created utterance data. Information processing device with.
3 作業者端末
3a 対話参加要求
3b 対話タスク提示
6 利用者端末
6a 対話データ取得要求
6b スコア付き対話データ
7 利用者
9 作業者
41 作業者リスト
42 対話タスクテーブル
43 発話テーブル
44 発話データDB
45 作業者スコアテーブル
50 初期化部
51 作業者登録部
52 作業者割当部
53 対話タスク選択部
54 対話タスク生成部
55 発話作成部
56 発話情報更新部
57 対話データ取出部
58 作業者スコア算出部
59 対話スコア算出部
60 ユーザI/F
100 サーバ装置
3
45 Worker score table 50
100 server device
Claims (6)
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択し、
前記複数の作業者により前記対話を完成させた対話データを得る
処理をコンピュータに実行させる対話コーパス作成プログラム。 From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. Take out for each utterance
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on, select the dialogue to which the worker who creates the utterance data is assigned, and
A dialogue corpus creation program that causes a computer to execute a process of obtaining dialogue data that completes the dialogue by the plurality of workers.
前記作業者端末から、少なくとも前記発話データと、前記不適切のチェック有無とを受信すると、受信した該発話データを、前記対話の進行に従って親子関係を持つ木構造で管理し、前記不適切のチェック有りの場合、前記受信した発話データを、親の発話データから枝分かれさせて直前の発話データと兄弟関係として前記記憶部に記録し、
直後の発話データと共に受信した前記不適切のチェックの有無に応じて、前記直前の発話データの不適切さを判定する
処理を前記コンピュータに実行させる請求項1記載の対話コーパス作成プログラム。 Displaying the dialogue information of the dialogue on the worker terminal of the worker to which the dialogue is assigned, checking when the content of the utterance immediately before being indicated by the dialogue information is inappropriate, and the input area of the utterance data. Display the creation screen with
When at least the utterance data and the presence / absence of the inappropriate check are received from the worker terminal, the received utterance data is managed by a tree structure having a parent-child relationship according to the progress of the dialogue, and the inappropriate check is performed. If there is, the received utterance data is branched from the parent's utterance data and recorded in the storage unit as a sibling relationship with the immediately preceding utterance data.
The interactive corpus creation program according to claim 1, wherein the computer executes a process of determining the inappropriateness of the immediately preceding utterance data according to the presence or absence of the inappropriateness check received together with the immediately preceding utterance data.
前記直前の発話データに対して兄弟関係の別の発話データが存在する場合、受信した前記発話データと共に受信した前記不適切のチェックの有無に応じて、該直前の発話データの前記支持数を増減する
処理を前記コンピュータに実行させる請求項2記載の対話コーパス作成プログラム。 In the tree structure, a support number is given to the received utterance data, and the support number is given.
When another utterance data having a sibling relationship exists with respect to the immediately preceding utterance data, the number of supports of the immediately preceding utterance data is increased or decreased depending on the presence or absence of the inappropriate check received together with the received utterance data. The interactive corpus creation program according to claim 2, wherein the computer executes the processing to be performed.
処理を前記コンピュータに実行させる請求項3記載の対話コーパス作成プログラム。 The utterance score is calculated from the utterance data in which the number of support increases or decreases and the utterance data of the sibling relationship of the utterance data, and the ratio of the number of support of each of the utterance data to the total number of support is calculated and stored in the storage unit. The interactive corpus creation program according to claim 3, wherein the computer executes a memorizing process.
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択し、
前記複数の作業者により前記対話を完成させた対話データを得る
処理をコンピュータが行う対話コーパス作成方法。 From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. Take out for each utterance
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on, select the dialogue to which the worker who creates the utterance data is assigned, and
A method of creating a dialogue corpus in which a computer performs a process of obtaining dialogue data in which the dialogue is completed by the plurality of workers.
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択する選択部と
前記複数の作業者により前記発話データを作成させ、作成された発話データを収集する発話作成部と
を有する情報処理装置。 From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. The worker ID extraction section that retrieves each utterance,
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on the above, the selection unit that selects the dialogue to which the worker who creates the utterance data is assigned, and the utterance creation unit that causes the plurality of workers to create the utterance data and collects the created utterance data. Information processing device with.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017040681A JP6760138B2 (en) | 2017-03-03 | 2017-03-03 | Dialogue corpus creation program, dialogue corpus creation method, and information processing device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017040681A JP6760138B2 (en) | 2017-03-03 | 2017-03-03 | Dialogue corpus creation program, dialogue corpus creation method, and information processing device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018146720A JP2018146720A (en) | 2018-09-20 |
| JP6760138B2 true JP6760138B2 (en) | 2020-09-23 |
Family
ID=63588808
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017040681A Active JP6760138B2 (en) | 2017-03-03 | 2017-03-03 | Dialogue corpus creation program, dialogue corpus creation method, and information processing device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6760138B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2024031394A (en) * | 2022-08-26 | 2024-03-07 | 日本電信電話株式会社 | Analysis support method, analysis support device and program |
-
2017
- 2017-03-03 JP JP2017040681A patent/JP6760138B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018146720A (en) | 2018-09-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11295221B2 (en) | Learning user preferences in a conversational system | |
| JP7401619B2 (en) | conversation business tools | |
| CN108629549A (en) | A kind of schedule processing method and processing device | |
| JP2018028939A (en) | Classification support device, classification support method, and classification support program | |
| WO2023112745A1 (en) | Information processing method, information processing device and information processing program | |
| CN117971661A (en) | Large model testing method, device, electronic equipment and storage medium | |
| JP6760138B2 (en) | Dialogue corpus creation program, dialogue corpus creation method, and information processing device | |
| CN117670367A (en) | Complaint work order processing method, complaint work order processing device, terminal equipment and storage medium | |
| JP5267269B2 (en) | Conference management apparatus and method | |
| JP5338601B2 (en) | Conference facilitator selection method, apparatus and program | |
| JP4824043B2 (en) | Knowledge structure construction method of natural language dialogue agent, automatic response creation method and automatic response creation apparatus using knowledge structure | |
| JP7084775B2 (en) | Information processing equipment and programs | |
| JP6502564B1 (en) | Personnel management system, personnel management program and personnel management method | |
| US11318373B2 (en) | Natural speech data generation systems and methods | |
| JP7677328B2 (en) | Information processing device and information processing method | |
| JP6639431B2 (en) | Item judgment device, summary sentence display device, task judgment method, summary sentence display method, and program | |
| EP3663940A1 (en) | Information processing device and information processing method | |
| JP2014134859A (en) | Device, method, and program handling message | |
| JP7436012B2 (en) | Knowledge sharing support device, knowledge sharing support method, program, and recording medium | |
| JP5488200B2 (en) | Dialog apparatus, dialog method, and program | |
| JP7654197B1 (en) | Question and answer generation system, method, and program | |
| JP2022059725A (en) | Information processor, information processing system, and program | |
| CN117238293B (en) | Hotel travel interaction method and device based on large language model and computing equipment | |
| CN117311963B (en) | Interactive control method, device, equipment and storage medium | |
| US20240362950A1 (en) | Information processing method, information processing system, and recording medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191112 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200709 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200817 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6760138 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |