Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6760138B2 - Dialogue corpus creation program, dialogue corpus creation method, and information processing device - Google Patents
[go: Go Back, main page]

JP6760138B2 - Dialogue corpus creation program, dialogue corpus creation method, and information processing device - Google Patents

Dialogue corpus creation program, dialogue corpus creation method, and information processing device Download PDF

Info

Publication number
JP6760138B2
JP6760138B2 JP2017040681A JP2017040681A JP6760138B2 JP 6760138 B2 JP6760138 B2 JP 6760138B2 JP 2017040681 A JP2017040681 A JP 2017040681A JP 2017040681 A JP2017040681 A JP 2017040681A JP 6760138 B2 JP6760138 B2 JP 6760138B2
Authority
JP
Japan
Prior art keywords
utterance
worker
dialogue
data
utterance data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017040681A
Other languages
Japanese (ja)
Other versions
JP2018146720A (en
Inventor
哲朗 高橋
哲朗 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017040681A priority Critical patent/JP6760138B2/en
Publication of JP2018146720A publication Critical patent/JP2018146720A/en
Application granted granted Critical
Publication of JP6760138B2 publication Critical patent/JP6760138B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、対話コーパス作成プログラム、対話コーパス作成方法、及び情報処理装置に関する。 The present invention relates to a dialogue corpus creation program, a dialogue corpus creation method, and an information processing apparatus.

近年、機械が人を相手とした対話を自然な応答文で応答する対話システムが開発され製品化されている。人の入力文に対する予め蓄積した応答文の文パターンから対応する応答文の文パターンを求め、入力文から抽出した単語の特徴語と関連度の高い単語を用いて、求めた応答文のパターンとから入力文に対する応答文を生成する技術が知られている。 In recent years, a dialogue system in which a machine responds to a dialogue with a person with a natural response sentence has been developed and commercialized. The sentence pattern of the corresponding response sentence is obtained from the sentence pattern of the response sentence accumulated in advance for the human input sentence, and the obtained response sentence pattern is obtained by using the characteristic words of the words extracted from the input sentence and the words having a high degree of relevance. A technique for generating a response sentence to an input sentence from is known.

また、機械が人との対話においてより自然な文を出力するために、2者以上のユーザの対話文を受け付け、少なくとも一者の会話文を自然言語処理し、会話の繋がりデータを取得し蓄積することで対話コーパスを生成する技術等が提案されている。 In addition, in order for the machine to output more natural sentences in dialogue with humans, it accepts dialogue sentences of two or more users, processes at least one conversational sentence in natural language, and acquires and accumulates conversation connection data. A technique for generating a dialogue corpus by doing so has been proposed.

特開2015−153261号公報Japanese Unexamined Patent Publication No. 2015-153261 特開2008−299754号公報Japanese Unexamined Patent Publication No. 2008-299754 特開2007−102104号公報JP-A-2007-102104 特開2001−166785号公報Japanese Unexamined Patent Publication No. 2001-166785

上述した技術では、2者で作業した場合、片方が作業している間の待ち時間が生じるため非効率的であるといった問題がある。効率的に2者による対話を行なおうとすると、ペアとなる2者を探す作業、2者の時間合せ等の管理が必要となり管理者の負担になる。 The above-mentioned technique has a problem that when two people work, it is inefficient because a waiting time occurs while one of them is working. If two parties try to have a dialogue efficiently, it is necessary to manage the work of finding a pair of two parties and the time adjustment of the two parties, which is a burden on the administrator.

したがって、1つの側面では、対話コーパスを効率的に作成することを目的とする。 Therefore, one aspect aims to efficiently create a dialogue corpus.

一態様によれば、2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から取り出し、前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択する割当処理を1発話ずつコンピュータに実行させ、前記複数の作業者により前記対話を完成させた対話データを得る処理を前記コンピュータに実行させる対話コーパス作成プログラムが提供される。 According to one aspect, the worker IDs of workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties, and the worker IDs of a plurality of workers in the order in which they can participate in the dialogue. The work of the worker ID taken out from the stored storage unit and managed by the storage unit by referring to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues. According to the worker allocation procedure based on the past participation status of the person, the computer is made to execute the allocation process for selecting the dialogue for assigning the worker who creates the speech data one by one, and the dialogue is completed by the plurality of workers. Provided is a dialogue corpus creation program that causes the computer to execute a process of obtaining the dialogue data.

また、上記課題を解決するための手段として、対話コーパス作成方法、及び情報処理装置とすることもできる。 Further, as a means for solving the above problems, a dialogue corpus creation method and an information processing device can be used.

対話コーパスを効率的に作成することができる。 You can efficiently create a dialogue corpus.

ペアの対話による対話コーパスの作成を説明するための図である。It is a figure for demonstrating the creation of the dialogue corpus by the dialogue of a pair. タスク分解をしてクラウドソーシングを用いるコーパス作成例を示す図である。It is a figure which shows the example of corpus creation which breaks down a task and uses crowdsourcing. 対話に対する意識の共通化と対話品質の維持の方法とを説明するための図である。It is a figure for demonstrating the common consciousness for dialogue and the method of maintaining the quality of dialogue. 対話画面例を示す図である。It is a figure which shows the dialogue screen example. 不適切チェックの有無に基づく発話木構造の例を説明するための図である。It is a figure for demonstrating the example of the utterance tree structure based on the presence or absence of an inappropriate check. 多重度「1」の場合の発話スコアリングを説明するための図である。It is a figure for demonstrating the utterance scoring in the case of the multiplicity "1". 多重度「3」の場合の発話スコアリングを説明するための図である。It is a figure for demonstrating the utterance scoring in the case of the multiplicity "3". 作業者スコアリングを説明するための図である。It is a figure for demonstrating the worker scoring. 対話スコアリングを説明するための図である。It is a figure for demonstrating dialogue scoring. 作業者割当手順の概要を説明するための図である。It is a figure for demonstrating the outline of the worker allocation procedure. 選択確率が最も高い作業者IDが1つのみの場合の作業者割当処理の例を示す図である。It is a figure which shows the example of the worker allocation processing in the case of only one worker ID with the highest selection probability. 最も高い選択確率が複数存在する場合の作業者割当処理の第1例を示す図である。It is a figure which shows the 1st example of the worker allocation processing when there are a plurality of the highest selection probabilities. 最も高い選択確率が複数存在する場合の作業者割当処理の第2例を示す図である。It is a figure which shows the 2nd example of the worker allocation processing when there are a plurality of the highest selection probabilities. 最も高い選択確率が複数存在する場合の作業者割当処理の第3例を示す図である。It is a figure which shows the 3rd example of the worker allocation processing when there are a plurality of the highest selection probabilities. 本実施例におけるシステム構成例を示す図である。It is a figure which shows the system configuration example in this Example. 本実施例のシステムにおける全体処理の概要を説明するための図である。It is a figure for demonstrating the outline of the whole processing in the system of this Example. サーバ装置の機能構成例を示す図である。It is a figure which shows the functional configuration example of a server device. 作業者リストのデータ構成例を示す図である。It is a figure which shows the data structure example of a worker list. 対話タスクテーブルのデータ構成例を示す図である。It is a figure which shows the data structure example of an interactive task table. 発話テーブルのデータ構成例を示す図である。It is a figure which shows the data structure example of the utterance table. 発話データDBのデータ構成例を示す図である。It is a figure which shows the data structure example of the utterance data DB. 作業者スコアテーブルのデータ構成例を示す図である。It is a figure which shows the data structure example of the worker score table. スコア付き対話データのデータ構成例を示す図である。It is a figure which shows the data structure example of the dialogue data with a score. 初期化処理を説明するためのフローチャート図である。It is a flowchart for demonstrating the initialization process. 作業者登録処理と作業者割当処理とを説明するためのフローチャート図である。It is a flowchart for demonstrating the worker registration process and the worker allocation process. 図25のステップS222における対話タスク選択処理を説明するためのフローチャート図である。It is a flowchart for demonstrating the interactive task selection process in step S222 of FIG. 図26のステップS237における対話タスク生成処理を説明するためのフローチャート図である。It is a flowchart for demonstrating the dialogue task generation process in step S237 of FIG. 発話作成処理を説明するためのフローチャート図である。It is a flowchart for demonstrating the utterance making process. 図28のステップS252における発話情報更新処理を説明するためのフローチャート図である。It is a flowchart for demonstrating the utterance information update process in step S252 of FIG. 28. 対話データ取出処理を説明するためのフローチャート図である。It is a flowchart for demonstrating the interactive data fetch process. 図30のステップS271における作業者スコア算出処理を説明するためのフローチャート図である。It is a flowchart for demonstrating the worker score calculation process in step S271 of FIG. 図30のステップS272における対話スコア算出処理を説明するためのフローチャート図である。It is a flowchart for demonstrating the dialogue score calculation process in step S272 of FIG.

以下、本発明の実施の形態を図面に基づいて説明する。先ず、2者のペアにより対話コーパスを作成する場合について説明する。図1は、ペアの対話による対話コーパスの作成を説明するための図である。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. First, a case where a dialogue corpus is created by a pair of two parties will be described. FIG. 1 is a diagram for explaining the creation of a dialogue corpus by a pair dialogue.

図1では、予め対話のペアとなる被験者α及びβを用意し、そのペアに対話をしてもらい、対話の内容を記録することで対話コーパス1aを作成する。被験者α及びβには、予め役割を説明しておく。例えば、旅行代理店の店員と、移動手段、ホテル等を予約する顧客等である。 In FIG. 1, subjects α and β to be a dialogue pair are prepared in advance, the pair is asked to have a dialogue, and the content of the dialogue is recorded to create a dialogue corpus 1a. The roles of subjects α and β will be explained in advance. For example, a clerk of a travel agency and a customer who reserves a means of transportation, a hotel, or the like.

図1では、被験者αには、旅行代理店の店員として会話してもらい、被験者βには、顧客として会話してもらった場合の対話例を示している。被験者αが1番目の発話「どちらに行かれますか?」で問いかけ、被験者βが2番目の発話「シカゴに行こうと思います」で返答する。 FIG. 1 shows an example of a dialogue in which the subject α has a conversation as a clerk of a travel agency and the subject β has a conversation as a customer. Subject α asks in the first utterance, "Where are you going?", And subject β replies in the second utterance, "I'm going to Chicago."

そして、被験者αが3番目の発話「何泊のご予定ですか?」で更に質問し、被験者βが4番目の発話「3泊くらいを考えてます」で返答する等々と、被験者αと被験者βとの間で会話が継続される。旅行代理店の店員役の被験者αが、旅行の計画に十分な情報を被験者βから取得すると、対話の終了となる。 Then, subject α asks a further question in the third utterance "How many nights are you planning?", Subject β replies in the fourth utterance "I'm thinking about 3 nights", and so on. The conversation with β is continued. When the subject α, who acts as a clerk of the travel agency, obtains sufficient information from the subject β to plan the trip, the dialogue ends.

このようにして、多くの被験者のペアから収集した対話コーパス1aを用いて機械学習を行うことで、機械が人を相手とした場合に対話を適切に進行させることができる。対話コーパス1aを用いた機械学習により、人手による対話の規則の記述を不要にきる。 In this way, by performing machine learning using the dialogue corpus 1a collected from many pairs of subjects, it is possible to appropriately proceed with the dialogue when the machine deals with a person. Machine learning using the dialogue corpus 1a eliminates the need to manually describe the rules of dialogue.

精度よく対話を進行させるためには、大規模な対話コーパス1aを作成することが必要である。大規模な対話コーパス1aにより機械学習を用いた対話システムの開発を高精度に行えるようになる。 In order to proceed with the dialogue accurately, it is necessary to create a large-scale dialogue corpus 1a. The large-scale dialogue corpus 1a enables the development of a dialogue system using machine learning with high accuracy.

しかし、このようにして、対話コーパス1aを作成するためには、一般的には、対話のペアとなる被験者α及びβを用意し、場所を提供又は通信手段を介して、定めた時間に対話を開始させ、進行する対話の内容を記録する。この手法では、被験者は他者と共同で作業にあたることになり、片方の被験者が作業している間、ペアの相手はその作業を待つ時間が発生する。 However, in order to create the dialogue corpus 1a in this way, in general, subjects α and β to be a pair of dialogues are prepared, and dialogues are provided at a predetermined time by providing a place or via a communication means. And record the content of the ongoing dialogue. In this method, the subject works in collaboration with the other, and while one subject is working, the other person in the pair has time to wait for the work.

このような問題に対する簡単な解決策として、対話コーパス1aに記録される対話を、定めた2者により開始から終了までを行わせるのではなく、対話を個別の複数のタスクに分割し、クラウドソーシング等を用いることにより多数の人の参加により独立に実施することが考えられる。 As a simple solution to such a problem, instead of having the dialogue recorded in the dialogue corpus 1a performed from the start to the end by two defined parties, the dialogue is divided into a plurality of individual tasks and crowdsourced. It is conceivable to carry out independently with the participation of a large number of people by using such as.

対話を個別の複数のタスクに分割するとは、1つの役割を1人の人が行うのではなく、会話のやり取り毎に役割を担う人を選定して会話を継続させることである。一例として、図1の被験者αと被験者βとの対話のうち、被験者α及びβのいずれかが発話する毎に、役割を担う人を変更する。この場合、1回の発話を行うことを1つの個別のタスクと見なす。 Dividing the dialogue into a plurality of individual tasks means that one person does not perform one role, but a person who plays a role is selected for each conversation and the conversation is continued. As an example, in the dialogue between the subject α and the subject β in FIG. 1, the person who plays the role is changed each time either the subject α or β speaks. In this case, making one utterance is regarded as one individual task.

クラウドソーシングとは、目的とする主タスクを、それぞれ独立した細かい単位のタスク(以下、小タスクという)に分解し、その小タスクを不特定多数の作業者によってネットワークを介して実施することである。 Crowdsourcing is to decompose the target main task into independent small unit tasks (hereinafter referred to as small tasks) and execute the small tasks by an unspecified number of workers via a network. ..

小タスクの配信や実施は、主に、ウェブブラウザやスマートフォン等を用いて行われるため、作業者のメリットとして、作業者は任意の場所において任意のタイミングで作業を実施できる。個々の小タスクは小規模で簡単な作業であるため、専門性を必要としない場合が多い。 Since the distribution and execution of small tasks are mainly performed using a web browser, a smartphone, or the like, as a merit of the worker, the worker can carry out the work at any place at any time. Individual subtasks are small and easy tasks and often do not require expertise.

また、不特定多数の作業者に小タスクを実施してもらうことにより、大きな主タスクを低いコストで早く完了させることができる。このことから、簡単な例として、複数の発話でなる対話を主タスクとし、発話単位を小タスクとすることが考えられる。 In addition, by having an unspecified number of workers perform small tasks, it is possible to complete a large main task quickly at low cost. From this, as a simple example, it is conceivable that the main task is a dialogue consisting of a plurality of utterances, and the utterance unit is a small task.

図2は、タスク分解をしてクラウドソーシングを用いるコーパス作成例を示す図である。図2において、作業者A、B、C、及びDを含む複数の作業者9による対話の進行例を示している。 FIG. 2 is a diagram showing an example of creating a corpus by decomposing tasks and using crowdsourcing. FIG. 2 shows an example of progress of dialogue by a plurality of workers 9 including workers A, B, C, and D.

作業者Aが1番目の発話「どちらに行かれますか?」で問いかけることで会話が開始される。この問いかけに対して、作業者Bが2番目の発話「シカゴに行こうと思います」で返答する。 The conversation is started when Worker A asks the first utterance, "Where are you going?". Worker B responds to this question with the second utterance, "I'm going to Chicago."

作業者Bの返答に対して、図1の例では、1番目の発話の作業者Aが次の質問を行うはずであるが、図2の例では、作業者Aとは異なる作業者Cが、3番目の発話「何泊のご予定ですか?」で更に質問する。 In response to the response of the worker B, in the example of FIG. 1, the worker A of the first utterance should ask the next question, but in the example of FIG. 2, a worker C different from the worker A is asked. Ask more questions in the third utterance, "How many nights are you planning?"

作業者Cの質問に対して、回答する作業者9は作業者Bではなく作業者Dである。作業者Dは、4番目の発話「3泊くらいを考えてます」で返答する。このように、対話をする2者を固定せず、発話入力毎に、作業者9を選定し、多数の作業者9により一連の会話を個別に独立させて実施する。 The worker 9 who answers the question of the worker C is not the worker B but the worker D. Worker D replies with the fourth utterance, "I'm thinking about three nights." In this way, the two persons having a dialogue are not fixed, a worker 9 is selected for each utterance input, and a series of conversations are individually and independently carried out by a large number of workers 9.

本実施例を説明する前に、以下に用語を定義する。 Before explaining this embodiment, the terms are defined below.

発話は、一人の作業者が記述する一つの発言である。 An utterance is a statement described by a single worker.

対話は、複数の発話からなる一連の発話列である。 A dialogue is a series of utterances consisting of multiple utterances.

作業者は、発話を作成する個別の人であり、発話者という場合がある。 A worker is an individual person who creates an utterance and is sometimes referred to as the speaker.

図2で説明したようなクラウドソーシングを用いるコーパス作成方法では、上述したように対話の流れを個別の小タスクに分解すると整合性のある発話例を生成できない場合がある。したがって、本実施例では、
(I)整合性のチェック
(II)発話、作業者、及び対話それぞれのスコアリング
(III)作業者の割り当ての効率化
を行う。
In the corpus creation method using crowdsourcing as described in FIG. 2, if the dialogue flow is decomposed into individual subtasks as described above, it may not be possible to generate a consistent utterance example. Therefore, in this embodiment,
(I) Consistency check (II) Scoring of utterances, workers, and dialogues (III) Efficient allocation of workers.

(I)整合性のチェック
先ず、文脈の提示による作業者9の意識の共通化と対話品質を維持するために、
・作業者9には開始からの文脈を提示し
・作業者9は、その文脈を読んで理解することによって、これまでの発話者(作業者9)と同じ文脈を共有することができ、それにより同一ペアによって作成された発話と同様の品質を保持する。
(I) Consistency check First, in order to maintain the common consciousness of workers 9 and the quality of dialogue by presenting the context.
-Present the context from the beginning to the worker 9-The worker 9 can share the same context as the previous speaker (worker 9) by reading and understanding the context. Maintains the same quality as utterances created by the same pair.

次に、文脈の整合性を担保するために、
・1発話進むごとに、作業者9がそれまでの対話の内容が適切であるか否かをチェックする。これは、文脈の理解と同時に行うことができる。つまり、文脈を理解するために全て読んだ後、内容を理解できなければ不適切であると判断する。
・独立した作業者9によって対話コーパスを作成する際の問題点として整合性のある発話列が作成できない恐れがある点が挙げられるが、このチェックにより対話の整合性を担保する。
・作業者9は、直前の対話を不適切だと判断した場合、作業者9はそこでなされるであろう発話を作成する。
Then, to ensure the integrity of the context
-Every time one utterance progresses, the worker 9 checks whether or not the content of the dialogue so far is appropriate. This can be done at the same time as understanding the context. In other words, after reading everything to understand the context, if you cannot understand the content, it is judged to be inappropriate.
-The problem with creating a dialogue corpus by an independent worker 9 is that there is a risk that a consistent utterance sequence cannot be created, but this check ensures the consistency of the dialogue.
-If the worker 9 determines that the previous dialogue is inappropriate, the worker 9 creates an utterance that will be made there.

(II)発話、作業者、及び対話それぞれのスコアリング
先ず、発話と、作業者9の信頼度のスコアリングについて説明する。
・作業者9のレベルにはばらつきがあることが一般的であり、その結果、不適切な発話が作成される可能性がある。
・各発話に、パラメータとして与えられた多重度においてその発話が正しいと判定された割合を発話スコアとする。
・分岐後は、発話スコアが高い発話を継続させる。分岐後の発話の枝を延ばすと表現される場合がある。
・作業者9が作成したすべての発話の発話スコアの平均値をその作業者9の作業者スコアとする。
(II) Scoring of utterances, workers, and dialogues First, utterances and scoring of the reliability of workers 9 will be described.
-The level of worker 9 generally varies, and as a result, inappropriate utterances may be created.
-For each utterance, the ratio at which the utterance is judged to be correct at the multiplicity given as a parameter is defined as the utterance score.
・ After branching, continue utterance with a high utterance score. It may be described as extending the branch of the utterance after branching.
-The average value of the utterance scores of all the utterances created by the worker 9 is set as the worker score of the worker 9.

次に、作業者スコアを用いた対話のスコアリングについて説明する。
・各対話のスコアを算出する。
・分岐があった場合は最も指示されたパスを選択し、一本のパスを抽出する。
・そのパスに出現する作業者9の作業者スコアの相乗平均を求め、これをその対話のスコアとし、以下、対話スコアという。
Next, dialogue scoring using worker scores will be described.
-Calculate the score for each dialogue.
・ If there is a branch, select the most specified path and extract one path.
-The geometric mean of the worker scores of the workers 9 appearing in the path is calculated, and this is used as the score of the dialogue, which is hereinafter referred to as the dialogue score.

(III)作業者の割り当ての効率化
対話における発話列が長くなると文脈の理解とその内容のチェックに時間がかかる。このチェックを可能な限り省略し効率的にするために、同一の作業者9に同じタスクを優先的にアサインする。
・このために対話のタスク履歴に基づいた確率を用いてタスクを割り当てる。
ここでのタスクとは、作成予定の対話に相当し、以下の説明において、対話タスクという場合がある。作成予定の対話には、現在進行中の対話と、未だ開始されていない対話とを含む。
(III) Efficient allocation of workers When the utterance line in a dialogue becomes long, it takes time to understand the context and check its contents. In order to omit this check as much as possible and make it efficient, the same task is preferentially assigned to the same worker 9.
-For this purpose, assign tasks using probabilities based on the task history of the dialogue.
The task here corresponds to the dialogue to be created, and may be referred to as a dialogue task in the following description. Dialogues to be created include those that are currently in progress and those that have not yet started.

上述した(I)から(III)について、例を用いて説明する。先ず、(I)整合性のチェックについて図3から図5で説明する。 The above-mentioned (I) to (III) will be described with reference to examples. First, (I) consistency check will be described with reference to FIGS. 3 to 5.

図3は、対話に対する意識の共通化と対話品質の維持の方法とを説明するための図である。図3では、作業者A、B、C、Dを含む複数の異なる作業者9には、旅行代理店での交通機関、宿泊先等の予約の場面を想定してもらい、一連の会話を行ってもらった場合の例を示している。 FIG. 3 is a diagram for explaining a method of standardizing awareness of dialogue and maintaining dialogue quality. In FIG. 3, a plurality of different workers 9, including workers A, B, C, and D, are asked to imagine a situation of booking transportation, accommodation, etc. at a travel agency, and have a series of conversations. An example is shown when you receive it.

本実施例では、
・作業者9のペアの管理は行わず各作業者9を独立に受け付ける。
・各作業者9には、それまでの対話の文脈(生成された発話の列)を提示し、次の発話の作成を依頼する。
In this embodiment
-The pair of workers 9 is not managed, and each worker 9 is accepted independently.
-Each worker 9 is requested to present the context of the dialogue up to that point (the sequence of utterances generated) and to create the next utterance.

複数の作業者9は、携帯電話等の端末からネットワークを介して本実施例に係るサービスへ接続する。作業者9へは、少なくとも直前までの発話を提示する。対話を進行する場面の説明を更に提示してもよい。一方で、対話の場面は、直前までの発話から、作業者9により判断させてもよい。 The plurality of workers 9 connect to the service according to the present embodiment from a terminal such as a mobile phone via a network. The utterance at least immediately before is presented to the worker 9. Further explanations of the scenes in which the dialogue proceeds may be presented. On the other hand, the scene of the dialogue may be determined by the worker 9 from the utterances up to the last minute.

この例では、旅行代理店における予約に関する店員と顧客の対話を、複数の作業者9に行ってもらう。各作業者9は、状況を把握した上で、直前の発話に対して最も有り得る内容を次の発話として入力する。又は、直線の発話を不適切と判断した場合は修正する発話を入力する。 In this example, a plurality of workers 9 are asked to have a dialogue between a clerk and a customer regarding a reservation at a travel agency. After grasping the situation, each worker 9 inputs the most probable content for the immediately preceding utterance as the next utterance. Alternatively, if it is determined that the straight line utterance is inappropriate, enter the utterance to be corrected.

複数の作業者9のうち、最初に会話を入力する作業者Aは、自分は店員であると判断して最初の発話を入力する。例えば、1番目の発話として「どちらに行かれますか?」等が入力される。 Of the plurality of workers 9, the worker A who inputs the conversation first determines that he / she is a clerk and inputs the first utterance. For example, "Where are you going?" Is input as the first utterance.

1番目の発話に対して、1番目の発話を提示された作業者Bは、自分は顧客であると判断して、2番目の発話を入力する。例えば、2番目の発話として「シカゴに行こうと思います」等が入力される。 Worker B, who is presented with the first utterance for the first utterance, determines that he / she is a customer and inputs the second utterance. For example, "I'm going to Chicago" is input as the second utterance.

1番目及び2番目の発話を提示された作業者Cは、自分は店員であると判断して3番目の発話を入力する。例えば、3番目の発話として「何泊のご予定ですか?」等が入力される。 Worker C, who is presented with the first and second utterances, determines that he is a clerk and inputs the third utterance. For example, "How many nights are you planning?" Is input as the third utterance.

1番目から3番目の発話を提示された作業者Dは、自分は顧客であると判断して、4番目の発話を入力する。例えば、4番目の発話として「3泊くらいを考えてます」等が入力される。 Worker D, who is presented with the first to third utterances, determines that he is a customer and inputs the fourth utterance. For example, "I'm thinking about 3 nights" is entered as the fourth utterance.

このように、直前までの発話を作業者9に提供することで、発話毎に作業者9が変更されても、作業者9は、状況と自分の役割を把握することができる。更に、本実施例では、図4に示すような画面を作業者9の端末に表示させることで、直前までの対話の整合性を作業者9によりチェックさせる。 By providing the utterances up to the last minute to the worker 9 in this way, even if the worker 9 is changed for each utterance, the worker 9 can grasp the situation and his / her role. Further, in this embodiment, the screen as shown in FIG. 4 is displayed on the terminal of the worker 9, so that the worker 9 checks the consistency of the dialogue up to the last minute.

図4は、対話画面例を示す図である。図4に例示する対話画面G70は、発話履歴表示域71と、発話入力域72と、不適切チェック領域73と、終了チェック領域74とを有する。対話画面G70において、作業者Cは、発話履歴表示域71に表示れた対話の最初から直前までの2つの発話を読み、対話の状況を把握する。 FIG. 4 is a diagram showing an example of a dialogue screen. The dialogue screen G70 illustrated in FIG. 4 has an utterance history display area 71, an utterance input area 72, an inappropriate check area 73, and an end check area 74. On the dialogue screen G70, the worker C reads the two utterances from the beginning to the immediately preceding of the dialogue displayed in the utterance history display area 71, and grasps the situation of the dialogue.

作業者Cは、先ず、発話履歴表示域71に表示れた
1.どちらに行かれますか?
2.シカゴに行こうと思います
の発話から、最後(2番目)の発話が適切であるか否かを判断する。
Worker C was first displayed in the utterance history display area 71. Where are you going?
2. 2. From the utterances I'm going to Chicago, determine if the last (second) utterance is appropriate.

作業者Cは、最後の発話が適切であると判断した場合、最後の発話に続く適切な発話を発話入力域72に作成し入力する。一方、不適切であると判断した場合、作業者Cは、不適切チェック領域73にチェックを入れる。不適切チェック領域73にチェックを入れた場合、作業者Cに、最後の発話の代わりに、適切と考える発話を発話入力域72に入力して修正する。 When the worker C determines that the last utterance is appropriate, the worker C creates and inputs an appropriate utterance following the last utterance in the utterance input area 72. On the other hand, when it is determined that it is inappropriate, the worker C checks the inappropriate check area 73. When the inappropriate check area 73 is checked, the worker C is corrected by inputting an utterance considered to be appropriate into the utterance input area 72 instead of the last utterance.

不適切チェック領域73にチェックを入れた場合には、この修正は必須とすることが望ましい。修正すべき発話を作成させることで、作業者Cに最後の発話の適正判断を誠実に行わせることができる。本実施例では、このように発話毎に、次の作業者9に最後の発話の適正を判断させるため、最後の発話より以前の発話は、適正であると判断済みの発話であると言える。 When the inappropriate check area 73 is checked, it is desirable that this correction is indispensable. By having the utterance to be corrected created, the worker C can be made to make a proper judgment of the last utterance in good faith. In this embodiment, since the next worker 9 is made to judge the appropriateness of the last utterance for each utterance in this way, it can be said that the utterances before the last utterance are the utterances judged to be appropriate.

この例では、作業者Cは、不適切チェック領域73にチェックを入れずに、発話入力域72に「何泊のご予定ですか?」と発話を作成している。即ち、「シカゴに行こうと思います」の発話は適正であると判断し、この発話に続く次の発話を作成した場合である。 In this example, the worker C creates an utterance in the utterance input area 72 as "How many nights are you planning?" Without checking the inappropriate check area 73. That is, it is the case that the utterance of "I will go to Chicago" is judged to be appropriate and the next utterance following this utterance is created.

終了チェック領域74は、対話の終了であると判断した場合に、作業者Cは、終了チェック領域74にチェックを入れる。対話の終了とは、対話の目的が達成されたと判断した場合である。対話が宿泊に係る交通機関、ホテル等の予約を目的とする場合、出発地、目的地、滞在地、滞在日数等の情報を取得できたと判断した場合を対話の終了とする。このような必要な情報を得られた場合の他、質問に回答できた、相手の満足を得られた等が、対話の終了となる。 When it is determined that the end check area 74 is the end of the dialogue, the worker C checks the end check area 74. The end of the dialogue is when it is determined that the purpose of the dialogue has been achieved. When the purpose of the dialogue is to reserve transportation, hotels, etc. related to accommodation, the dialogue ends when it is judged that information such as the departure place, destination, place of stay, and length of stay can be obtained. In addition to the case where such necessary information is obtained, the dialogue ends when the question can be answered and the other party's satisfaction is obtained.

本実施例では、上述した不適切チェック領域73へチェックされた場合に、図5に示すように、発話の進行を分岐させる木構造(以下、発話木構造という)により複数の発話で構成される対話の進行状態を表現する。 In this embodiment, when the inappropriate check area 73 described above is checked, as shown in FIG. 5, a plurality of utterances are composed of a tree structure (hereinafter referred to as an utterance tree structure) that branches the progress of the utterance. Express the progress of the dialogue.

図5は、不適切チェックの有無に基づく発話木構造の例を説明するための図である。図5(A)では、作業者Aによる最初(1番目)の発話「どちらに行かれますか?」に対して、次の作業者Bが2番目の発話「シカゴに行こうと思います」を作成し、この対話が作業者Cに割り当てられた際の対話画面G70を示している。図4の対話画面G70と同様である。 FIG. 5 is a diagram for explaining an example of an utterance tree structure based on the presence or absence of an inappropriate check. In FIG. 5 (A), in response to the first (first) utterance "Where are you going?" By worker A, the next worker B is the second utterance "I will go to Chicago." Is created, and the dialogue screen G70 when this dialogue is assigned to the worker C is shown. This is the same as the dialogue screen G70 of FIG.

この例では、作業者Cは、作業者Aの発話に対する作業者Bの発話は適切であったと判断し、不適切チェックが無い状態で、作業者Cにより発話「何泊のご予定ですか?」が作成される。 In this example, the worker C judges that the utterance of the worker B is appropriate for the utterance of the worker A, and the utterance by the worker C "How many nights are you planning?" Without the inappropriate check. Is created.

この対話の進行状態は、発話木構造8aで表現される。発話木構造8aでは、発話を、その発話を作成した作業者9を表わすアルファベットのノードで簡潔に示す。図6〜図9も同様である。 The progress of this dialogue is represented by the utterance tree structure 8a. In the utterance tree structure 8a, the utterance is briefly indicated by a node of the alphabet representing the worker 9 who created the utterance. The same applies to FIGS. 6 to 9.

発話木構造8aは、最初(1番目)の発話Aから始まり、下へ2番目の発話B、更に下へ3番目の発話Cへと枝が伸びる。発話木構造8aには分岐が存在しない。即ち、この時点では、未だ不適切チェックがなされていないことを示す。 The utterance tree structure 8a starts from the first (first) utterance A, extends downward to the second utterance B, and further downwards to the third utterance C. There are no branches in the utterance tree structure 8a. That is, at this point, it indicates that the inappropriate check has not been performed yet.

図5(B)では、作業者Aによる最初(1番目)の発話「どちらに行かれますか?」に対して、次の作業者Dが2番目の発話「どこでも」を作成した状態の対話画面G70が示されている。 In FIG. 5 (B), a dialogue in which the next worker D creates the second utterance "anywhere" in response to the first (first) utterance "Where are you going?" By the worker A. The screen G70 is shown.

作業者Eは、直前の作業者Dの発話「どこでも」は不適切であると判断し、修正する発話を作成する。不適切チェック有りの状態で、発話Eが作成された場合の発話木構造8bを示している。発話木構造8bでは、最初(1番目)の発話Aから始まり、下へ2番目の発話Dと伸びるが、発話Dに対する不適切チェックにより、発話Eは発話Aの直下に位置付けされる。 The worker E determines that the utterance "anywhere" of the immediately preceding worker D is inappropriate, and creates an utterance to be corrected. The utterance tree structure 8b when the utterance E is created with the improper check is shown. In the utterance tree structure 8b, the utterance tree structure 8b starts from the first (first) utterance A and extends downward to the second utterance D, but the utterance E is positioned directly under the utterance A due to an inappropriate check for the utterance D.

以下の説明において、発話木構造8a、8b等のように特定しない限りにおいて、総称して発話木構造8という場合がある。 In the following description, unless otherwise specified such as the utterance tree structure 8a, 8b, etc., the utterance tree structure 8 may be generically referred to.

次に、(II)発話、作業者、及び対話それぞれのスコアリングについて図6〜図9で説明する。先ず、発話スコアリングについて説明する。本実施例では、
・発話が分岐した際に、チェックのための多重度をパラメータとして与える。
・多重度は奇数を与える。
・分岐が起きた際に、分岐が起きるか否かを多重度の数まで作業者に評価させる。多重度が1の場合は、分岐した際に分岐後の発話のみを用いることなる。多重度は3以上であることが好ましい。
・作業者9によって指示された割り合いを発話スコアとする。
Next, scoring of (II) utterance, worker, and dialogue will be described with reference to FIGS. 6 to 9. First, utterance scoring will be described. In this embodiment
-When the utterance branches, the multiplicity for checking is given as a parameter.
-The multiplicity gives an odd number.
-When a branch occurs, let the operator evaluate whether or not the branch occurs up to the number of multiplicities. When the multiplicity is 1, only the utterance after the branch is used when the branch is made. The multiplicity is preferably 3 or more.
-The utterance score is the ratio instructed by the worker 9.

先ず、発話スコアリングについて図6及び図7で説明する。図6は、多重度「1」の場合の発話スコアリングを説明するための図である。図6(A)では、図5(A)の発話木構造8aの各発話の発話スコアを示している。発話木構造8aでは、分岐が存在しないため、発話A、B及びCの全ての発話スコアUSが「1」を示す。 First, utterance scoring will be described with reference to FIGS. 6 and 7. FIG. 6 is a diagram for explaining utterance scoring when the multiplicity is “1”. FIG. 6 (A) shows the utterance score of each utterance of the utterance tree structure 8a of FIG. 5 (A). In the utterance tree structure 8a, since there is no branch, all the utterance scores US of the utterances A, B, and C show "1".

図6(B)では、発話木構造8cにおいて分岐の前後の発話スコアUSを説明する。分岐前の発話Dが作成された時点では、発話Aも発話Dも発話スコアUSは「1」である。発話Cの作成時に発話Aから分岐すると、即ち、発話Dが不適切であると判断されると、多重度が1の場合は、不適切と判断された発話Dの発話スコアUSは「0」となり、修正用の発話Cに発話スコアUS「1」が与えられる。 FIG. 6B describes the utterance score US before and after the branch in the utterance tree structure 8c. At the time when the utterance D before the branch is created, the utterance score US of both the utterance A and the utterance D is "1". When branching from utterance A when creating utterance C, that is, when utterance D is determined to be inappropriate, if the multiplicity is 1, the utterance score US of utterance D determined to be inappropriate is "0". Then, the utterance score US "1" is given to the utterance C for correction.

図7は、多重度「3」の場合の発話スコアリングを説明するための図である。図7(A)では、発話Aに応答して発話Dが作成された状態を示す。この状態では、発話Aの発話スコアUSは「1」であり、発話Dの発話スコアUSも「1」である。 FIG. 7 is a diagram for explaining utterance scoring when the multiplicity is “3”. FIG. 7A shows a state in which utterance D is created in response to utterance A. In this state, the utterance score US of utterance A is "1", and the utterance score US of utterance D is also "1".

図7(B)では、発話Dが不適切と判断され、修正用に発話Cが作成される。この時点では、本当に発話Dが不適切であるのかは断定できない。この状態での発話木構造8dでは、発話Dの発話スコアUSが「1」から「1/2」に変更され、発話Cには発話スコアUS「1/2」が与えられる。図7(B)の発話木構造8dに対して、図7(C)又は図7(D)の状態に遷移することが考えられる。 In FIG. 7B, the utterance D is determined to be inappropriate, and the utterance C is created for correction. At this point, it cannot be determined whether utterance D is really inappropriate. In the utterance tree structure 8d in this state, the utterance score US of the utterance D is changed from "1" to "1/2", and the utterance C is given the utterance score US "1/2". It is conceivable that the utterance tree structure 8d of FIG. 7 (B) transitions to the state of FIG. 7 (C) or FIG. 7 (D).

図7(C)では、発話Dを不適切と判断した、別の作業者Eにより発話Eが生成された状態を示している。発話Eの追加により、発話Dが不適切でないことは理解できるが、発話Cと発話Eとではいずれが適切かはまだ判定できない。この場合、発話Dが削除され、発話Cと発話Eの発話スコアUSが「1/2」ずつになる。 FIG. 7C shows a state in which the utterance E is generated by another worker E who determines that the utterance D is inappropriate. It can be understood that the utterance D is not inappropriate by adding the utterance E, but it cannot be determined yet which is more appropriate between the utterance C and the utterance E. In this case, the utterance D is deleted, and the utterance score US of the utterance C and the utterance E becomes "1/2" each.

図7(D)では、発話Dに対して不適切と判断されずに、発話Fが追加された状態を示している。したがって、発話Dの発話スコアUSは「1/2」から「2/3」へと変更され、発話Cの発話スコアUSは「1/2」から「1/3」へと変更される。 FIG. 7D shows a state in which the utterance F is added without being judged to be inappropriate for the utterance D. Therefore, the utterance score US of utterance D is changed from "1/2" to "2/3", and the utterance score US of utterance C is changed from "1/2" to "1/3".

次に、上述したように生成され変化する発話木構造8を用いて、作業者スコアリングが行われる。作業者スコアリングでは、作業者9が作成した全ての発話の発話スコアの平均値を算出し、作業者スコアとする。 Next, worker scoring is performed using the utterance tree structure 8 that is generated and changed as described above. In the worker scoring, the average value of the utterance scores of all the utterances created by the worker 9 is calculated and used as the worker score.

図8は、作業者スコアリングを説明するための図である。図8では、3つの発話木構造8e、8f、及び8gにおける各発話A〜Gの発話スコアUSを用いて、作業者A〜Gの作業者スコアWSを算出する場合で説明する。 FIG. 8 is a diagram for explaining worker scoring. FIG. 8 describes a case where the worker scores WS of the workers A to G are calculated by using the utterance scores US of the utterances A to G in the three utterance tree structures 8e, 8f, and 8g.

この例では、
作業者Aについて、
作業者スコアWS = (1+1+1)/3 = 1 を取得し、
作業者Bについて、
作業者スコアWS = (1/3+1+1)/3 = 0.78を取得し、
作業者Cについて、
作業者スコアWS = (1+2/3)/2 = 0.83を取得し、
作業者Dについて、
作業者スコアWS = (0+1/3)/2 = 0.17を取得し、
作業者Eについて、
作業者スコアWS = (1+1+1)/3 = 1を取得し、
作業者Fについて、
作業者スコアWS = (1+1)/2 = 1を取得し、
作業者Gについて、
作業者スコアWS = (2/3)/1 = 0.67
を取得する。
In this example
About worker A
Obtain the worker score WS A = (1 + 1 + 1) / 3 = 1 and
About worker B
Obtain the worker score WS B = (1/3 + 1 + 1) / 3 = 0.78,
About worker C
Worker score WS C = (1 + 2/3) / 2 = 0.83 is obtained,
About worker D
Obtain the worker score WS D = (0 + 1/3) / 2 = 0.17 and
About worker E
Obtain the worker score WS E = (1 + 1 + 1) / 3 = 1 and
About worker F
Obtain the worker score WS F = (1 + 1) / 2 = 1 and
About worker G
Worker score WS G = (2/3) / 1 = 0.67
To get.

作業者スコアWSが低い程、不適切な発話を作成する作業者9であることを示す。この作業者スコアWSに対して閾値を用いてフィルタリングすることで、不適切な発話を作成する作業者9を除外してもよい。この場合、不適切な発話の作成を抑制することができる。 The lower the worker score WS, the more the worker 9 creates an inappropriate utterance. By filtering the worker score WS using a threshold value, the worker 9 who creates an inappropriate utterance may be excluded. In this case, it is possible to suppress the creation of inappropriate utterances.

次に、対話スコアリングについて説明する。対話スコアリングは、最も支持されたパス上の発話を作成した作業者9の作業者スコアWSの相乗平均によって行われる。最も支持されたパスとは、発話の数が最も多い枝を選択することで定まる。 Next, dialogue scoring will be described. Dialogue scoring is performed by the geometric mean of the worker scores WS of worker 9 who created the utterances on the most favored path. The most favored path is determined by selecting the branch with the highest number of utterances.

図9は、対話スコアリングを説明するための図である。図9では、図8と同様の3つの発話木構造8e、8f、及び8gで表現されるそれぞれの対話の対話スコアDSを算出する場合で説明する。 FIG. 9 is a diagram for explaining dialogue scoring. In FIG. 9, the case of calculating the dialogue score DS of each dialogue represented by the three utterance tree structures 8e, 8f, and 8g similar to those in FIG. 8 will be described.

発話木構造8eで最も支持されたパスPeは、発話A、G、C、E、及びFの順の文脈である。したがって、パスPeを構成する発話を作成した作業者9の作業者スコアWSの相乗平均は、
(1×0.67×0.83×1×1)^(1/5)= 0.89
であり、対話スコアDSe=0.89を得る。
The most favored path Pe in the utterance tree structure 8e is the context of utterances A, G, C, E, and F in that order. Therefore, the geometric mean of the worker score WS of the worker 9 who created the utterances constituting the path Pe is
(1 x 0.67 x 0.83 x 1 x 1) ^ (1/5) = 0.89
And a dialogue score of DSe = 0.89 is obtained.

発話木構造8fで最も支持されたパスPfは、発話E、F、A、及びBの順の文脈である。したがって、パスPfを構成する発話を作成した作業者9の作業者スコアWSの相乗平均は、
(1×1×1×0.78)^(1/4) = 0.94
であり、対話スコアDSf=0.94を得る。
The most supported path Pf in the utterance tree structure 8f is the context of utterances E, F, A, and B in that order. Therefore, the geometric mean of the worker score WS of the worker 9 who created the utterances constituting the path Pf is
(1 x 1 x 1 x 0.78) ^ (1/4) = 0.94
The dialogue score DSf = 0.94 is obtained.

発話木構造8gで最も支持されたパスPgは、発話B、E、C、及びAの順の文脈である。したがって、パスPgを構成する発話を作成した作業者9の作業者スコアWSの相乗平均は、
(0.78×1×0.83×1)^(1/4)= 0.90
であり、対話スコアDSg=0.90を得る。
The most supported path Pg in the utterance tree structure 8g is the context of utterances B, E, C, and A in that order. Therefore, the geometric mean of the worker score WS of the worker 9 who created the utterances constituting the path Pg is
(0.78 × 1 × 0.83 × 1) ^ (1/4) = 0.90
The dialogue score DSg = 0.90 is obtained.

対話スコアDSが高い値、即ち、1に近い程、適切な文脈で表される対話であることを示す。この例では、対話スコアDSfが最も高い値「0.94」を示すため、パスPfによる文脈は適切な発話の連続を示すと考えられる。 The higher the dialogue score DS, that is, the closer it is to 1, the more appropriate the context is for the dialogue. In this example, since the dialogue score DSf shows the highest value "0.94", the context by the path Pf is considered to indicate a proper sequence of utterances.

次に、(III)作業者の割り当ての効率化について図10から図14で説明する。図10は、作業者割当手順の概要を説明するための図である。 Next, (III) efficiency improvement of worker allocation will be described with reference to FIGS. 10 to 14. FIG. 10 is a diagram for explaining an outline of the worker allocation procedure.

図10において、作業者リスト41は、作業者9の作業者IDを追加した順で取り出すキュー構造を持つリストであり、一例として、キュー構造はFIFO(First-In,First-Out)方式であればよい。この例では、作業者9のIDを右端から追加し、左端から作業者9のIDが取り出される。 In FIG. 10, the worker list 41 is a list having a queue structure in which the worker IDs of the workers 9 are taken out in the order in which the worker IDs are added. As an example, the queue structure may be in a FIFO (First-In, First-Out) system. Just do it. In this example, the ID of the worker 9 is added from the right end, and the ID of the worker 9 is taken out from the left end.

対話タスクテーブル42は、対話毎に発話を作成した作業者9を順に示したテーブルである。各対話は、対話タスクとして対話タスクテーブル42に登録され、以後、対話タスクテーブル42で管理される。対話の進行状況は、対話タスクテーブル42に記録された作業者9を特定する作業者IDで示される。 The dialogue task table 42 is a table in which the workers 9 who created the utterances for each dialogue are shown in order. Each dialogue is registered in the dialogue task table 42 as a dialogue task, and is subsequently managed in the dialogue task table 42. The progress of the dialogue is indicated by a worker ID that identifies the worker 9 recorded in the dialogue task table 42.

この例では、対話に参加可能な複数の作業者9として、作業者リスト41を参照すると、作業者w4、w9、w21、w10、w5が既に待ち状態である。更に、先頭の作業者w4を対話に割り当て、最後の作業者w5に続いて、作業者w7が作業者リスト41に追加される状況を示している。 In this example, as a plurality of workers 9 who can participate in the dialogue, referring to the worker list 41, the workers w4, w9, w21, w10, and w5 are already in the waiting state. Further, the first worker w4 is assigned to the dialogue, and the worker w7 is added to the worker list 41 following the last worker w5.

対話タスクテーブル42には、対話タスクd1、・・・、d5等が登録され、対話タスクd1では、作業者w4が最初の発話を作成後、最初の発話に対して、作業者w11が2番目の発話を作成した状態を示している。対話タスクd2、d3、及びd4等についても同様に、発話が作成された順(発話作成順)に、作業者IDが示される。対話タスクd5は、登録済みであるが、未だ、発話が作成されていない状態を示している。 Dialogue tasks d1, ..., D5, etc. are registered in the dialogue task table 42. In the dialogue task d1, after the worker w4 creates the first utterance, the worker w11 is second with respect to the first utterance. Shows the state in which the utterance of is created. Similarly, for the dialogue tasks d2, d3, d4, etc., the worker IDs are shown in the order in which the utterances are created (utterance creation order). The dialogue task d5 indicates a state in which the utterance has not been created yet, although it has been registered.

作業者9の対話への割り当ては、以下のような作業者割当手順に従って行う。
・手順(1)作業者リスト41(図10)の先頭(左)から作業者IDを取り出す。
・手順(2)対話タスクテーブル42に登録されているそれぞれの対話タスクに対して選択確率を求める。
選択確率 = 作業者IDの出現回数/発話個数
上式にて、発話個数には、取り出した作業者IDが最後となる対話タスクはカウントしない。
・手順(3)選択確率が最大の対話タスクを選択する。
最大の対話タスクが複数ある場合、発話個数が最も少ない対話タスクを選択する。最も少ない対話タスクが複数存在する場合、ランダムに1つの対話タスクを選択する。
The worker 9 is assigned to the dialogue according to the following worker assignment procedure.
-Procedure (1) The worker ID is taken out from the head (left) of the worker list 41 (FIG. 10).
-Procedure (2) Obtain the selection probability for each dialogue task registered in the dialogue task table 42.
Selection probability = Number of occurrences of worker ID / number of utterances In the above formula, the number of utterances does not count the dialogue task whose last worker ID is taken out.
-Procedure (3) Select the dialogue task with the highest selection probability.
If there are multiple largest dialogue tasks, select the one with the least number of utterances. If there are a plurality of the least interactive tasks, one interactive task is randomly selected.

図10に示すデータ例を用いて、上述した作業者割当手順に従った作業者割当処理について図11から図14で説明する。図11は、選択確率が最も高い作業者IDが1つのみの場合の作業者割当処理の例を示す図である。 Using the data example shown in FIG. 10, the worker allocation process according to the worker allocation procedure described above will be described with reference to FIGS. 11 to 14. FIG. 11 is a diagram showing an example of a worker allocation process when there is only one worker ID having the highest selection probability.

図11における作業者割当処理では、手順(1)により、作業者リスト41から作業者ID「w4」が取り出され、手順(2)により、対話タスクテーブル42が参照されて、取り出した作業者ID「w4」の選択確率を算出する。 In the worker allocation process in FIG. 11, the worker ID “w4” is extracted from the worker list 41 by the procedure (1), and the interactive task table 42 is referred to by the procedure (2), and the extracted worker ID is extracted. The selection probability of "w4" is calculated.

この例の場合、対話タスクd1では、作成済みの2つの発話のうち1つが作業者ID「w4」によるものであるため、選択確率「1/2」を得る。対話タスクd2では、作成済みの4つの発話のうち作業者ID「w4」による発話は存在しないため、選択確率「0」を得る。 In the case of this example, in the dialogue task d1, since one of the two created utterances is due to the worker ID “w4”, the selection probability “1/2” is obtained. In the dialogue task d2, since there is no utterance by the worker ID “w4” among the four created utterances, the selection probability “0” is obtained.

対話タスクd3では、作業者ID「w4」が最後に発話を作成しているため、選択確率の算出は行われない。選択確率の算出は抑止される。 In the dialogue task d3, since the worker ID "w4" creates the utterance at the end, the selection probability is not calculated. The calculation of the selection probability is suppressed.

対話タスクd4では、作成済みの2つの発話のうち作業者ID「w4」による発話は存在しないため、選択確率「0」を得る。対話タスクd5では、作成済みの発話は未だ存在しないため、選択確率「0」を得る。 In the dialogue task d4, since there is no utterance by the worker ID “w4” among the two created utterances, the selection probability “0” is obtained. In the dialogue task d5, since the created utterance does not exist yet, the selection probability “0” is obtained.

次に、手順(3)により、選択確率が最も高い対話タスクd1を選択し、発話作成順の最後に「w4」を追加する。対話タスクd1において、作業者ID「w11」の次に「w4」が追加される。作業者リスト41より、作業者ID「w4」の次は作業者ID「w9」である。作業者ID「w9」に対する作業者割当処理は図12で説明する。 Next, according to the procedure (3), the dialogue task d1 having the highest selection probability is selected, and "w4" is added to the end of the utterance creation order. In the dialogue task d1, "w4" is added after the worker ID "w11". From the worker list 41, the worker ID "w4" is followed by the worker ID "w9". The worker allocation process for the worker ID “w9” will be described with reference to FIG.

図12は、最も高い選択確率が複数存在する場合の作業者割当処理の第1例を示す図である。図12において、手順(1)により、作業者リスト41から作業者ID「w9」が取り出され、手順(2)により、対話タスクテーブル42が参照されて、取り出した作業者ID「w9」の選択確率を算出する。 FIG. 12 is a diagram showing a first example of the worker allocation process when a plurality of the highest selection probabilities exist. In FIG. 12, the worker ID “w9” is extracted from the worker list 41 by the procedure (1), the interactive task table 42 is referred to by the procedure (2), and the extracted worker ID “w9” is selected. Calculate the probability.

この例の場合、対話タスクd1〜d5において、作業者ID「w9」による発話は存在しないため、全ての対話タスクd1〜d5に対して選択確率「0」を得る。この場合、最大の対話タスクが複数ある場合に相当し、手順(3)により、発話個数の最も少ない対話タスクを選択する。 In the case of this example, in the dialogue tasks d1 to d5, since there is no utterance by the worker ID "w9", the selection probability "0" is obtained for all the dialogue tasks d1 to d5. In this case, it corresponds to the case where there are a plurality of maximum dialogue tasks, and the dialogue task with the smallest number of utterances is selected according to the procedure (3).

対話タスクd1の発話個数は「3」であり、対話タスクd2の発話個数は「4」であり、対話タスクd3の発話個数は「1」であり、対話タスクd4の発話個数は「2」であり、対話タスクd5の発話個数は「0」である。 The number of utterances of the dialogue task d1 is "3", the number of utterances of the dialogue task d2 is "4", the number of utterances of the dialogue task d3 is "1", and the number of utterances of the dialogue task d4 is "2". Yes, the number of utterances in the dialogue task d5 is "0".

従って、作業者ID「w9」に対して、対話タスクd5が選択される。発話個数が最も少ない対話タスクd5に作業者ID「w9」が割り当てられる。この例では、対話タスクd5対して、最初の発話として「w9」が記録される。そして、作業者リスト41より、作業者ID「w9」の次は作業者ID「w21」である。作業者ID「w21」に対する作業者割当処理は図13で説明する。 Therefore, the dialogue task d5 is selected for the worker ID “w9”. The worker ID "w9" is assigned to the dialogue task d5 with the smallest number of utterances. In this example, "w9" is recorded as the first utterance for the dialogue task d5. Then, from the worker list 41, the worker ID "w9" is followed by the worker ID "w21". The worker allocation process for the worker ID “w21” will be described with reference to FIG.

図13は、最も高い選択確率が複数存在する場合の作業者割当処理の第2例を示す図である。図13において、手順(1)により、作業者リスト41から作業者ID「w21」が取り出され、手順(2)により、対話タスクテーブル42が参照されて、取り出した作業者ID「w21」の選択確率を算出する。 FIG. 13 is a diagram showing a second example of the worker allocation process when a plurality of the highest selection probabilities exist. In FIG. 13, the worker ID “w21” is extracted from the worker list 41 by the procedure (1), the interactive task table 42 is referred to by the procedure (2), and the extracted worker ID “w21” is selected. Calculate the probability.

この例の場合、対話タスクd1〜d5において、作業者ID「w21」による発話は存在しないため、全ての対話タスクd1〜d5に対して選択確率「0」を得る。この場合、最大の対話タスクが複数ある場合に相当し、手順(3)により、発話個数の最も少ない対話タスクを選択する。 In the case of this example, since there is no utterance by the worker ID "w21" in the dialogue tasks d1 to d5, the selection probability "0" is obtained for all the dialogue tasks d1 to d5. In this case, it corresponds to the case where there are a plurality of maximum dialogue tasks, and the dialogue task with the smallest number of utterances is selected according to the procedure (3).

対話タスクd1の発話個数は「3」であり、対話タスクd2の発話個数は「4」であり、対話タスクd3の発話個数は「1」であり、対話タスクd4の発話個数は「2」であり、対話タスクd5の発話個数は「1」である。従って、発話個数の最も少ない対話タスクが2つ存在する。 The number of utterances of the dialogue task d1 is "3", the number of utterances of the dialogue task d2 is "4", the number of utterances of the dialogue task d3 is "1", and the number of utterances of the dialogue task d4 is "2". Yes, the number of utterances in the dialogue task d5 is "1". Therefore, there are two dialogue tasks with the smallest number of utterances.

この場合、手順(3)により、発話個数の最も少ない複数の対話タスクからランダムにいずれか1つを選択する。ランダム選択の方法は、特に限定しない。既存の関数などを用いればよい。 In this case, according to the procedure (3), one of the plurality of dialogue tasks with the smallest number of utterances is randomly selected. The random selection method is not particularly limited. An existing function or the like may be used.

作業者ID「w21」に対して、対話タスク「d3」と「d5」のうち対話タスク「d3」が選択されたものとする。対話タスクd3において、既に割り当てた作業者ID「w4」の次に作業者ID「w21」を追加する。 It is assumed that the dialogue task "d3" is selected from the dialogue tasks "d3" and "d5" for the worker ID "w21". In the dialogue task d3, the worker ID "w21" is added next to the already assigned worker ID "w4".

作業者リスト41より、作業者ID「w21」の次は作業者ID「w10」である。作業者ID「w10」は、対話タスクテーブル42に存在しない。作業者ID「w9」と同様の状況を示す。従って、最も発話個数の少ない対話タスクd5に追加される。そして、作業者リスト41より、作業者ID「w10」の次は作業者ID「w5」である。作業者ID「w5」に対する作業者割当処理は図14で説明する。 From the worker list 41, the worker ID "w21" is followed by the worker ID "w10". The worker ID "w10" does not exist in the interactive task table 42. The situation similar to that of the worker ID "w9" is shown. Therefore, it is added to the dialogue task d5 with the smallest number of utterances. Then, from the worker list 41, the worker ID "w10" is followed by the worker ID "w5". The worker allocation process for the worker ID “w5” will be described with reference to FIG.

図14は、最も高い選択確率が複数存在する場合の作業者割当処理の第3例を示す図である。図14において、手順(1)により、作業者リスト41から作業者ID「w5」が取り出され、手順(2)により、対話タスクテーブル42が参照されて、取り出した作業者ID「w5」の選択確率を算出する。 FIG. 14 is a diagram showing a third example of the worker allocation process when a plurality of the highest selection probabilities exist. In FIG. 14, the worker ID “w5” is extracted from the worker list 41 by the procedure (1), the interactive task table 42 is referred to by the procedure (2), and the extracted worker ID “w5” is selected. Calculate the probability.

この例の場合、対話タスクd1では、作成済みの3つの発話のうち作業者ID「w5」による発話は存在しないため、選択確率「0」を得る。対話タスクd2では、作成済みの4つの発話のうち2つが作業者ID「w5」によるものであるため、選択確率「1/2」(=2/4)を得る。 In the case of this example, in the dialogue task d1, since there is no utterance by the worker ID “w5” among the three created utterances, the selection probability “0” is obtained. In the dialogue task d2, since two of the four created utterances are due to the worker ID "w5", the selection probability "1/2" (= 2/4) is obtained.

対話タスクd3では、対話タスクd1と同様に、作業者ID「w5」による発話は存在しないため、選択確率「0」を得る。対話タスクd4では、作成済みの2つの発話のうち1つが作業者ID「w5」によるものであるため、選択確率「1/2」を得る。対話タスクd5も、対話タスクd1と同様に、作業者ID「w5」による発話は存在しないため、選択確率「0」を得る。 In the dialogue task d3, as in the dialogue task d1, since there is no utterance by the worker ID “w5”, the selection probability “0” is obtained. In the dialogue task d4, since one of the two created utterances is due to the worker ID "w5", the selection probability "1/2" is obtained. Similar to the dialogue task d1, the dialogue task d5 also has a selection probability of “0” because there is no utterance by the worker ID “w5”.

この例の場合、対話タスクd1〜d5において、作業者ID「w5」に関して、選択確率が最も高い対話タスクは「d2」と「d4」であり複数存在する。従って、手順(3)により、発話個数の最も少ない対話タスクを選択する。 In the case of this example, in the dialogue tasks d1 to d5, the dialogue tasks having the highest selection probability with respect to the worker ID "w5" are "d2" and "d4", and there are a plurality of dialogue tasks. Therefore, according to the procedure (3), the dialogue task with the smallest number of utterances is selected.

発話個数は、対話タスクd2とd4に対してカウントすればよい。対話タスクd2の発話個数は「4」であり、対話タスクd4の発話個数は「2」である。従って、発話個数の最も少ない対話タスクd4が選択される。 The number of utterances may be counted for the dialogue tasks d2 and d4. The number of utterances of the dialogue task d2 is "4", and the number of utterances of the dialogue task d4 is "2". Therefore, the dialogue task d4 with the smallest number of utterances is selected.

上述したような作業者割当処理を作業者リスト41から作業者IDを順に取り出すごとに繰り返す。一方、作業者リスト41へは、作業者割当処理とは独立して随時作業者IDを追加する処理を行う。 The worker allocation process as described above is repeated every time the worker ID is sequentially taken out from the worker list 41. On the other hand, the worker ID is added to the worker list 41 at any time independently of the worker allocation process.

本実施例に係る種々の処理は、図15に示すようなシステム構成において行われる。図15は、本実施例におけるシステム構成例を示す図である。図15に示すシステム1000は、サーバ装置100と、携帯端末、PC(Personal Computer)等を含む複数の作業者端末3と、1以上の利用者端末6とを有し、サーバ装置100と複数の作業者端末3及び1以上の利用者端末とはネットワーク2を介して接続される。 Various processes according to this embodiment are performed in the system configuration as shown in FIG. FIG. 15 is a diagram showing a system configuration example in this embodiment. The system 1000 shown in FIG. 15 includes a server device 100, a plurality of worker terminals 3 including a mobile terminal, a PC (Personal Computer), and one or more user terminals 6, and the server device 100 and a plurality of user terminals 6. The worker terminal 3 and one or more user terminals are connected via the network 2.

サーバ装置100は、本実施例に係る対話コーパス作成処理を実行する装置であり、不特定多数の作業者9に、複数の対話のそれぞれの目的に応じた発話を作成させることで、より利用価値の高い対話事例を蓄積して対話コーパスを作成する。 The server device 100 is a device that executes the dialogue corpus creation process according to the present embodiment, and is more useful by having an unspecified number of workers 9 create utterances according to the purpose of each of the plurality of dialogues. Create a dialogue corpus by accumulating high dialogue cases.

複数の作業者端末3は、作業者9により利用される端末であり、各作業者9は、作業者端末3をサーバ装置100にネットワーク2を介して接続することで、ネットワーク2を介して行われる対話に参加するこができる。 The plurality of worker terminals 3 are terminals used by the worker 9, and each worker 9 connects the worker terminal 3 to the server device 100 via the network 2 to perform the operation via the network 2. You can participate in the dialogue.

1以上の利用者端末6は、サーバ装置100が累積した、対話に係る一連の会話データ(対話コーパス)を利用する利用者7により利用される端末であり、利用者7は、利用者端末6をサーバ装置100にネットワーク2を介して接続し、サーバ装置100から会話データを取得する。 The one or more user terminals 6 are terminals used by the user 7 who uses a series of conversation data (dialogue corpus) related to the dialogue accumulated by the server device 100, and the user 7 is the user terminal 6. Is connected to the server device 100 via the network 2, and conversation data is acquired from the server device 100.

サーバ装置100は、コンピュータによって制御される情報処理装置であって、CPU(Central Processing Unit)11と、主記憶装置12と、補助記憶装置13と、入力装置14と、表示装置15と、通信I/F(インターフェース)17と、ドライブ装置18とを有し、バスB1に接続される。 The server device 100 is an information processing device controlled by a computer, and is a CPU (Central Processing Unit) 11, a main storage device 12, an auxiliary storage device 13, an input device 14, a display device 15, and a communication I. It has a / F (interface) 17 and a drive device 18, and is connected to the bus B1.

CPU11は、主記憶装置12に格納されたプログラムに従ってサーバ装置100を制御するプロセッサに相当する。主記憶装置12には、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU11にて実行されるプログラム、CPU11での処理に必要なデータ、CPU11での処理にて得られたデータ等を記憶又は一時保存する。 The CPU 11 corresponds to a processor that controls the server device 100 according to a program stored in the main storage device 12. A RAM (Random Access Memory), a ROM (Read Only Memory), or the like is used in the main storage device 12, and is obtained by a program executed by the CPU 11, data required for processing by the CPU 11, and processing by the CPU 11. Store or temporarily store the collected data.

補助記憶装置13には、HDD(Hard Disk Drive)等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置13に格納されているプログラムの一部が主記憶装置12にロードされ、CPU11に実行されることによって、各種処理が実現される。 An HDD (Hard Disk Drive) or the like is used in the auxiliary storage device 13, and data such as a program for executing various processes is stored in the auxiliary storage device 13. Various processes are realized by loading a part of the program stored in the auxiliary storage device 13 into the main storage device 12 and executing the program in the CPU 11.

入力装置14は、マウス、キーボード等を有し、管理者がサーバ装置100による処理に必要な各種情報を入力するために用いられる。表示装置15は、CPU11の制御のもとに必要な各種情報を表示する。入力装置14と表示装置15とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。通信I/F17は、有線又は無線などのネットワークを通じて通信を行う。通信I/F17による通信は無線又は有線に限定されるものではない
サーバ装置100によって行われる処理を実現するプログラムは、例えば、CD−ROM(Compact Disc Read-Only Memory)等の記憶媒体19によってサーバ装置100に提供される。
The input device 14 has a mouse, a keyboard, and the like, and is used by the administrator to input various information necessary for processing by the server device 100. The display device 15 displays various necessary information under the control of the CPU 11. The input device 14 and the display device 15 may be a user interface using an integrated touch panel or the like. The communication I / F 17 communicates through a network such as wired or wireless. Communication by communication I / F17 is not limited to wireless or wired. A program that realizes processing performed by the server device 100 is a server using a storage medium 19 such as a CD-ROM (Compact Disc Read-Only Memory). Provided to device 100.

ドライブ装置18は、ドライブ装置18にセットされた記憶媒体19(例えば、CD−ROM等)とサーバ装置100とのインターフェースを行う。 The drive device 18 interfaces the storage medium 19 (for example, a CD-ROM or the like) set in the drive device 18 with the server device 100.

また、記憶媒体19に、後述される本実施の形態に係る種々の処理を実現するプログラムを格納し、この記憶媒体19に格納されたプログラムは、ドライブ装置18を介してサーバ装置100にインストールされる。インストールされたプログラムは、サーバ装置100により実行可能となる。 Further, a program for realizing various processes according to the present embodiment described later is stored in the storage medium 19, and the program stored in the storage medium 19 is installed in the server device 100 via the drive device 18. To. The installed program can be executed by the server device 100.

尚、プログラムを格納する記憶媒体19はCD−ROMに限定されず、コンピュータが読み取り可能な、データとしての構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。コンピュータ読取可能な記憶媒体として、CD−ROMの他に、DVDディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。 The storage medium 19 for storing the program is not limited to the CD-ROM, and one or more non-transitory, tangible (tangible) having a structure as data that can be read by a computer. ) Any medium. As the computer-readable storage medium, in addition to the CD-ROM, a portable recording medium such as a DVD disk or a USB memory, or a semiconductor memory such as a flash memory may be used.

複数の作業者端末3は、コンピュータによって制御されるタブレット型、携帯電話等の情報処理端末であって、CPU11aと、主記憶装置12aと、ユーザI/F(インターフェース)16aと、通信I/F17aと、ドライブ装置18aとを有し、バスB1に接続される。 The plurality of worker terminals 3 are information processing terminals such as tablet-type and mobile phones controlled by a computer, and include a CPU 11a, a main storage device 12a, a user I / F (interface) 16a, and a communication I / F 17a. And a drive device 18a, which are connected to the bus B1.

CPU11aは、主記憶装置12aに格納されたプログラムに従って作業者端末3を制御するプロセッサに相当する。主記憶装置12aには、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU11aにて実行されるプログラム、CPU11aでの処理に必要なデータ、CPU11aでの処理にて得られたデータ等を記憶又は一時保存する。主記憶装置12aに格納されているプログラムが、CPU11aに実行されることによって、各種処理が実現される。 The CPU 11a corresponds to a processor that controls the worker terminal 3 according to a program stored in the main storage device 12a. A RAM (Random Access Memory), a ROM (Read Only Memory), or the like is used in the main storage device 12a, and a program executed by the CPU 11a, data required for processing by the CPU 11a, and a process obtained by the CPU 11a are obtained. Store or temporarily store the collected data. Various processes are realized by executing the program stored in the main storage device 12a in the CPU 11a.

ユーザI/F16aは、CPU11aの制御のもとに必要な各種情報を表示し、また、ユーザによる操作入力を可能とするタッチパネル等である。通信I/F17aによる通信は無線又は有線に限定されるものではない。 The user I / F 16a is a touch panel or the like that displays various information required under the control of the CPU 11a and enables the user to input operations. Communication by communication I / F17a is not limited to wireless or wired.

作業者端末3によって行われる処理を実現するプログラムは、ネットワーク2を介して外部装置からダウンロードされる。或いは、予め作業者端末3の主記憶装置12a又は記憶媒体19aに記憶されていても良い。主記憶装置12a及び/又は記憶媒体19aが記憶部130aに相当する。 The program that realizes the processing performed by the worker terminal 3 is downloaded from the external device via the network 2. Alternatively, it may be stored in advance in the main storage device 12a or the storage medium 19a of the worker terminal 3. The main storage device 12a and / or the storage medium 19a corresponds to the storage unit 130a.

ドライブ装置18aは、ドライブ装置18aにセットされた記憶媒体19a(例えば、SD(Secure Digital)メモリカード等)と作業者端末3とのインターフェースを行う。尚、記憶媒体19aは、コンピュータが読み取り可能な、データとしての構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。 The drive device 18a interfaces the storage medium 19a (for example, SD (Secure Digital) memory card or the like) set in the drive device 18a with the worker terminal 3. The storage medium 19a may be one or more non-transitory, tangible media having a structure as data that can be read by a computer.

利用者端末6のハードウェア構成は、作業者端末3と同様であるためその詳細な説明を省略する。また、作業者端末3及び利用者端末6は、デスクトップ型、ノートブック型、ラップトップ型等の情報処理端末であっても良く、そのハードウェア構成は、サーバ装置100のハードウェア構成と同様であるので、その説明を省略する。 Since the hardware configuration of the user terminal 6 is the same as that of the worker terminal 3, detailed description thereof will be omitted. Further, the worker terminal 3 and the user terminal 6 may be information processing terminals such as a desktop type, a notebook type, and a laptop type, and the hardware configuration thereof is the same as the hardware configuration of the server device 100. Since there is, the description thereof will be omitted.

図16は、本実施例のシステムにおける全体処理の概要を説明するための図である。図16では、本実施例のシステムにおける全体処理の概要を処理シーケンスを用いて説明する。 FIG. 16 is a diagram for explaining an outline of the overall processing in the system of this embodiment. In FIG. 16, an outline of the overall processing in the system of this embodiment will be described using a processing sequence.

作業者9が作業者端末3から対話参加要求3aをサーバ装置100へ送信する(ステップS1)。対話参加要求3aには作業者IDが含まれている。作業者IDは、対話参加要求3aを行う前にサーバ装置100から取得しておいても良いし、初めての対話参加要求3aに応じてサーバ装置100が作業者IDを付与し、作業者端末3に通知してもよい。以後は、サーバ装置100から与えられた作業者IDを指定して、対話参加要求3aをサーバ装置100へと送信する。 The worker 9 transmits the dialogue participation request 3a from the worker terminal 3 to the server device 100 (step S1). The worker ID is included in the dialogue participation request 3a. The worker ID may be acquired from the server device 100 before the dialogue participation request 3a is performed, or the server device 100 assigns the worker ID in response to the first dialogue participation request 3a and the worker terminal 3 May be notified to. After that, the worker ID given by the server device 100 is specified, and the dialogue participation request 3a is transmitted to the server device 100.

サーバ装置100では、対話参加要求3aで指定される作業者IDを用いて、作業者IDを割り当てる対話を特定する作業者割当処理を行って(ステップS2)、対話参加要求3aの要求元である作業者端末3に対話タスク提示を行って、対話タスクを作業者端末3に表示させる(ステップS4)。対話タスク提示3bには、対話前提情報、発話履歴情報等が含まれる。対話前提情報は、対話がなされる場面(前提)の説明を含み、作業者9に自身の役割を理解させるための情報である。発話履歴情報は、対話画面G70に表示される既になされた対話の内容に相当する。 The server device 100 uses the worker ID specified in the dialogue participation request 3a to perform a worker allocation process for specifying the dialogue for which the worker ID is assigned (step S2), and is the request source of the dialogue participation request 3a. The dialogue task is presented to the worker terminal 3 and the dialogue task is displayed on the worker terminal 3 (step S4). The dialogue task presentation 3b includes dialogue premise information, utterance history information, and the like. The dialogue premise information includes an explanation of the scene (premise) in which the dialogue is performed, and is information for making the worker 9 understand his / her role. The utterance history information corresponds to the content of the already performed dialogue displayed on the dialogue screen G70.

作業者端末3では、対話画面G70がユーザI/F16aに表示され、作業者9により発話が作成されると(ステップS5)、発話作成情報3cがサーバ装置100へ送信される(ステップS6)。発話作成情報3cには、不適切チェックの有無、終了有無、作業者9が対話画面G70の発話入力域72に入力した発話を表わす発話データ等を含む。 On the worker terminal 3, the dialogue screen G70 is displayed on the user I / F16a, and when the utterance is created by the worker 9 (step S5), the utterance creation information 3c is transmitted to the server device 100 (step S6). The utterance creation information 3c includes the presence / absence of an inappropriate check, the presence / absence of termination, utterance data representing the utterance input by the worker 9 in the utterance input area 72 of the dialogue screen G70, and the like.

サーバ装置100は、発話作成情報3cの受信に応じて、発話作成処理を行う(ステップS7)。発話作成処理において、サーバ装置100は、発話データを記憶部130に蓄積し、作業者9に割り当てた対話タスクに対応付けて発話データを特定する発話IDを追加し、対話タスクにおける発話スコアを更新する(ステップS7)。このようなステップS1〜S7が適宜繰り返される。 The server device 100 performs the utterance creation process in response to the reception of the utterance creation information 3c (step S7). In the utterance creation process, the server device 100 stores the utterance data in the storage unit 130, adds an utterance ID that identifies the utterance data in association with the dialogue task assigned to the worker 9, and updates the utterance score in the dialogue task. (Step S7). Such steps S1 to S7 are repeated as appropriate.

一方、利用者7が利用者端末6から対話データ取得要求6aを行うと(ステップS8)、サーバ装置100は、対話データ取出処理を行う(ステップS9)。対話データ取出処理において、サーバ装置100は、全ての対話を対象にして、発話スコアに基づいて作業者9に対する作業者スコアを算出する。また、サーバ装置100は、対話毎に対話に関連付けられた発話毎の発話スコアに基づいて対話スコアを算出する。 On the other hand, when the user 7 makes the dialogue data acquisition request 6a from the user terminal 6 (step S8), the server device 100 performs the dialogue data retrieval process (step S9). In the dialogue data retrieval process, the server device 100 calculates the worker score for the worker 9 based on the utterance score for all the dialogues. Further, the server device 100 calculates the dialogue score for each dialogue based on the utterance score for each utterance associated with the dialogue.

そして、所定条件に基づくスコア付き対話データ6bを提供する(ステップS10)。所定条件は、例えば、利用者7が所望する対話スコアの閾値等であり、対話データ取得要求6aで指定されてもよいし、対話データ取出処理にて予め設定されたデフォルトの閾値であってもよい。 Then, the dialogue data 6b with a score based on a predetermined condition is provided (step S10). The predetermined condition is, for example, a threshold value of the dialogue score desired by the user 7, may be specified in the dialogue data acquisition request 6a, or may be a default threshold value preset in the dialogue data retrieval process. Good.

図17は、サーバ装置の機能構成例を示す図である。図17において、サーバ装置100は、主に、初期化部50と、作業者登録部51と、作業者割当部52と、発話作成部55と、対話データ取出部57と、ユーザI/F60とを有する。初期化部50と、作業者登録部51と、作業者割当部52と、発話作成部55と、対話データ取出部57と、ユーザI/F60とは、対応するプログラムをCPU11aが実行することで行われる処理に相当する。 FIG. 17 is a diagram showing a functional configuration example of the server device. In FIG. 17, the server device 100 mainly includes an initialization unit 50, a worker registration unit 51, a worker allocation unit 52, an utterance creation unit 55, a dialogue data extraction unit 57, and a user I / F 60. Has. The initialization unit 50, the worker registration unit 51, the worker allocation unit 52, the utterance creation unit 55, the dialogue data extraction unit 57, and the user I / F60 are such that the CPU 11a executes a corresponding program. Corresponds to the processing performed.

記憶部130には、作業者リスト41、対話タスクテーブル42、発話テーブル43、発話データDB44、作業者スコアテーブル45、スコア付き対話データ6b等が記憶される。 The storage unit 130 stores the worker list 41, the dialogue task table 42, the utterance table 43, the utterance data DB 44, the worker score table 45, the dialogue data 6b with a score, and the like.

初期化部50は、本実施例に係るシステムの運用開始時、対話コーパスの作成をリセット等する際に作業者リスト41、対話タスクテーブル42等を初期化する。 The initialization unit 50 initializes the worker list 41, the dialogue task table 42, and the like when resetting the creation of the dialogue corpus at the start of operation of the system according to the present embodiment.

作業者登録部51は、ユーザI/F60を介して対話参加要求3aの受信に応じて、対話参加要求3aで指定される作業者IDを作業者リスト41に登録する処理部である。 The worker registration unit 51 is a processing unit that registers the worker ID specified in the dialogue participation request 3a in the worker list 41 in response to the reception of the dialogue participation request 3a via the user I / F60.

作業者割当部52は、ユーザI/F60を介して対話参加要求3aの受信に応じて、1発話ごとに作業者9を特定し、特定した作業者9に発話を作成してもらう対話タスクを選択し、対話タスク提示3bを作業者端末9に行う処理部である。1発話ごとに作業者9を特定する処理は、作業者割当部52により行われる処理の一部であり、作業者ID取出部に相当する。作業者割当部52は、更に、対話タスク生成部54を含む対話タスク選択部53を有する。 The worker allocation unit 52 identifies the worker 9 for each utterance in response to the reception of the dialogue participation request 3a via the user I / F60, and asks the specified worker 9 to create an utterance. This is a processing unit that selects and performs the dialogue task presentation 3b on the worker terminal 9. The process of identifying the worker 9 for each utterance is a part of the process performed by the worker allocation unit 52, and corresponds to the worker ID extraction unit. The worker allocation unit 52 further has a dialogue task selection unit 53 including a dialogue task generation unit 54.

対話タスク選択部53は、作業者割当部52から呼び出される処理部であり、選択部に相当する。対話タスク選択部53は、上述した作業者割当手順に従って、作業者9に割り当てる対話タスクを選択する。対話タスク選択部53は、対話タスク生成部54を呼び出して、対話タスクを生成させ、生成した対話タスクをユーザI/F60を介して作業者端末3に送信して表示させる。 The dialogue task selection unit 53 is a processing unit called from the worker allocation unit 52, and corresponds to the selection unit. The dialogue task selection unit 53 selects the dialogue task to be assigned to the worker 9 according to the worker allocation procedure described above. The dialogue task selection unit 53 calls the dialogue task generation unit 54 to generate a dialogue task, and transmits the generated dialogue task to the worker terminal 3 via the user I / F60 to display it.

発話作成部55は、ユーザI/F60を介して作業者端末3から発話作成情報3cを受信すると、対話タスクテーブル42を更新する。発話作成情報3cから取得される発話データは、新たに付与された発話IDと共に発話データDB44に蓄積される。発話データDB44は、対話コーパス1aに相当する。 When the utterance creation unit 55 receives the utterance creation information 3c from the worker terminal 3 via the user I / F60, the utterance creation unit 55 updates the dialogue task table 42. The utterance data acquired from the utterance creation information 3c is accumulated in the utterance data DB 44 together with the newly assigned utterance ID. The utterance data DB 44 corresponds to the dialogue corpus 1a.

発話作成部55は、更に、発話情報更新部56を有し、発話情報更新部56を呼び出すことにより、発話データを追加し、対話タスクの発話スコアを再計算させ更新させる。 The utterance creation unit 55 further has an utterance information update unit 56, and by calling the utterance information update unit 56, the utterance data is added, and the utterance score of the dialogue task is recalculated and updated.

発話情報更新部56は、発話作成情報3cに基づき、発話テーブル43で管理される発話木構造を更新し、発話スコアを更新する。 The utterance information update unit 56 updates the utterance tree structure managed in the utterance table 43 based on the utterance creation information 3c, and updates the utterance score.

対話データ取出部57は、ユーザI/F60を介して利用者端末6から対話データ取得要求6aを受信すると、発話テーブル43を参照して、作業者スコアと、対話スコアとを算出し、スコア付き対話データ6bを出力する。対話データ6bの一部又は全部を利用者端末6に提供してもよい。利用者7がサーバ装置100の管理者である場合、入力装置114から対話データ取得要求6aを行ってもよい。 When the dialogue data acquisition unit 57 receives the dialogue data acquisition request 6a from the user terminal 6 via the user I / F60, the dialogue data acquisition unit 57 refers to the utterance table 43, calculates the worker score and the dialogue score, and has a score. The dialogue data 6b is output. A part or all of the dialogue data 6b may be provided to the user terminal 6. When the user 7 is the administrator of the server device 100, the dialogue data acquisition request 6a may be made from the input device 114.

対話データ取出部57は、更に、作業者スコア算出部58と、発話スコア算出部59とを有する。対話データ取出部57は、作業者スコア算出部58を呼び出して、発話テーブル43を用いて作業者9それぞれの作業者スコアを算出させる。作業者スコア算出部58によって作業者スコアテーブル45が記憶部130に出力され記憶される。 The dialogue data extraction unit 57 further includes a worker score calculation unit 58 and an utterance score calculation unit 59. The dialogue data extraction unit 57 calls the worker score calculation unit 58 to calculate the worker score of each worker 9 using the utterance table 43. The worker score calculation unit 58 outputs and stores the worker score table 45 in the storage unit 130.

対話データ取出部57は、発話スコア算出部59を呼び出して、作業者スコアテーブル45を用いて対話タスクごとの対話スコアを算出する。対話データ取出部57によってスコア付き対話データ6bが記憶部130に出力され記憶される。 The dialogue data extraction unit 57 calls the utterance score calculation unit 59 and calculates the dialogue score for each dialogue task using the worker score table 45. The dialogue data extraction unit 57 outputs the scored dialogue data 6b to the storage unit 130 and stores it.

ユーザI/F60は、サーバ装置100と作業者端末3の作業者9とのインタフェース、及びサーバ装置100と利用者端末6の利用者7とインタフェースを、通信I/F117を介して行う。 The user I / F 60 performs an interface between the server device 100 and the worker 9 of the worker terminal 3 and an interface between the server device 100 and the user 7 of the user terminal 6 via the communication I / F 117.

次に、記憶部130に記憶される種々のデータ構成について図18から図23について説明する。 Next, FIGS. 18 to 23 will be described with respect to various data configurations stored in the storage unit 130.

図18は、作業者リストのデータ構成例を示す図である。図18に示す作業者リスト41は、図10で説明したように、作業者9の作業者IDを追加した順で取り出すキュー構造を持つリストである。 FIG. 18 is a diagram showing an example of data structure of the worker list. As described with reference to FIG. 10, the worker list 41 shown in FIG. 18 is a list having a queue structure in which the worker IDs of the workers 9 are taken out in the order of addition.

この例では、作業者リスト41の左から順に追加順に、w4、w9、w21、w10、w5、w7、w8、そしてw40が示されている。作業者リスト41の長さは、作業者IDの追加及び取り出しにより伸縮し、作業者リスト41は拡張可能な記憶領域である。 In this example, w4, w9, w21, w10, w5, w7, w8, and w40 are shown in order of addition from the left of the worker list 41. The length of the worker list 41 is expanded and contracted by adding and taking out the worker ID, and the worker list 41 is an expandable storage area.

図19は、対話タスクテーブルのデータ構成例を示す図である。図19において、対話タスクテーブル42は、対話タスク毎に、発話を作成した順で作業者IDを記録したテーブルであり、対話ID、作業者IDのリスト等の項目を有する。 FIG. 19 is a diagram showing an example of data configuration of the interactive task table. In FIG. 19, the dialogue task table 42 is a table in which worker IDs are recorded in the order in which utterances are created for each dialogue task, and has items such as a dialogue ID and a list of worker IDs.

対話IDは、対話タスクを特定する識別情報である。全ての対話タスクはタスクテーブル42に登録され管理される。作業者IDのリストは、発話作成毎に、作業者IDを作成順に記録した一覧である。 The dialogue ID is identification information that identifies the dialogue task. All interactive tasks are registered and managed in the task table 42. The list of worker IDs is a list in which worker IDs are recorded in the order of creation for each utterance creation.

この例では、対話ID「d1」に対して、作業者ID「w4」及び「W11」が記録されている。対話ID「d2」に対して、作業者ID「w5」、「w7」、「w5」、及び「W8」が記録されている。 In this example, the worker IDs "w4" and "W11" are recorded for the dialogue ID "d1". Worker IDs "w5", "w7", "w5", and "W8" are recorded for the dialogue ID "d2".

図20は、発話テーブルのデータ構成例を示す図である。図20において、発話テーブル43は、対話タスクに対して作成された発話を発話木構造8で記録し管理するテーブルである。発話テーブル43は、対話ID、発話ID、親発話、作業者ID、発話スコア(US)、支持数等の項目を有する。 FIG. 20 is a diagram showing an example of data structure of the utterance table. In FIG. 20, the utterance table 43 is a table for recording and managing the utterances created for the dialogue task in the utterance tree structure 8. The utterance table 43 has items such as a dialogue ID, an utterance ID, a parent utterance, an operator ID, an utterance score (US), and a number of supporters.

対話IDは、対話を特定する識別情報を示し、対話タスクテーブル42に登録された識別情報である。発話IDは、作成された発話を表わす発話データと関連付けられて発話データDB44で管理されている識別情報である。 The dialogue ID indicates identification information that identifies the dialogue, and is identification information registered in the dialogue task table 42. The utterance ID is identification information that is associated with the utterance data representing the created utterance and is managed in the utterance data DB 44.

親発話は、発話木構造8において、親の関係にある発話IDを示す。作業者IDは、発話を作成した作業者9を特定する識別情報を示す。発話スコア(US)は、支持数に基づいて算出された値を示し、発話の追加毎に更新される。支持数は、発話の追加毎に加算又は減算された値を示し、発話スコアの算出時に参照される。 The parent utterance indicates an utterance ID having a parental relationship in the utterance tree structure 8. The worker ID indicates identification information that identifies the worker 9 who created the utterance. The utterance score (US) indicates a value calculated based on the number of supporters, and is updated every time an utterance is added. The number of support indicates a value added or subtracted for each additional utterance, and is referred to when calculating the utterance score.

このデータ例では、対話ID「d2」に関して、発話ID「u21」〜「u27」が記録されている。発話ID「u21」のレコードでは、自身が親発話に相当するため、親発話IDは存在せず、発話作成者は作業者ID「w1」の作業者9であり、発話スコアは「1」であり、支持数「1」を示している。 In this data example, the utterance IDs "u21" to "u27" are recorded with respect to the dialogue ID "d2". In the record of the utterance ID "u21", since the utterance ID corresponds to the parent utterance, the utterance ID does not exist, the utterance creator is the worker 9 of the worker ID "w1", and the utterance score is "1". Yes, it shows the number of support "1".

発話ID「u22」のレコードでは、親発話IDは「u21」であり、発話作成者は作業者ID「w4」の作業者9であり、発話スコアは「0」であり、支持数「0」を示している。発話ID「u23」のレコードでは、親発話IDは「u21」であり、発話作成者は作業者ID「w7」の作業者9であり、発話スコアは「2/3」であり、支持数「2」を示している。発話ID「u24」のレコードでは、親発話IDは「u21」であり、発話作成者は作業者ID「w2」の作業者9であり、発話スコアは「1/3」であり、支持数「1/3」を示している。 In the record of the utterance ID "u22", the parent utterance ID is "u21", the utterance creator is the worker 9 of the worker ID "w4", the utterance score is "0", and the number of support is "0". Is shown. In the record of the utterance ID "u23", the parent utterance ID is "u21", the utterance creator is the worker 9 of the worker ID "w7", the utterance score is "2/3", and the number of support is "2/3". 2 ”is shown. In the record of the utterance ID "u24", the parent utterance ID is "u21", the utterance creator is the worker 9 of the worker ID "w2", the utterance score is "1/3", and the number of support " 1/3 "is shown.

発話ID「u25」のレコードでは、親発話IDは「u23」であり、発話作成者は作業者ID「w3」の作業者9であり、発話スコアは「1」であり、支持数「1」を示している。発話ID「u26」のレコードでは、親発話IDは「u25」であり、発話作成者は作業者ID「w5」の作業者9であり、発話スコアは「1」であり、支持数「1」を示している。発話ID「u27」のレコードでは、親発話IDは「u26」であり、発話作成者は作業者ID「w6」の作業者9であり、発話スコアは「1」であり、支持数「1」を示している。 In the record of the utterance ID "u25", the parent utterance ID is "u23", the utterance creator is the worker 9 of the worker ID "w3", the utterance score is "1", and the number of support is "1". Is shown. In the record of the utterance ID "u26", the parent utterance ID is "u25", the utterance creator is the worker 9 of the worker ID "w5", the utterance score is "1", and the number of support is "1". Is shown. In the record of the utterance ID "u27", the parent utterance ID is "u26", the utterance creator is the worker 9 of the worker ID "w6", the utterance score is "1", and the number of support is "1". Is shown.

このようなデータにより、発話木構造8kを表わすことができる。発話木構造8kは、対話d2を構成する発話作成の系図を表わしている。ノードは発話を示し、発話IDがノード内に示されている。また、枝に作業者IDを示し、ノード近傍に発話スコアを示している。 With such data, the utterance tree structure 8k can be represented. The utterance tree structure 8k represents a genealogy of utterance creation that constitutes dialogue d2. The node indicates an utterance, and the utterance ID is indicated in the node. In addition, the worker ID is shown on the branch, and the utterance score is shown near the node.

図21は、発話データDBのデータ構成例を示す図である。図21において、発話データDB44は、作業者端末3から受信した発話データを発話IDに対応付けて記憶し管理するデータベースであり、発話ID、発話データ等の項目を有する。 FIG. 21 is a diagram showing a data configuration example of the utterance data DB. In FIG. 21, the utterance data DB 44 is a database that stores and manages utterance data received from the worker terminal 3 in association with the utterance ID, and has items such as the utterance ID and the utterance data.

発話IDは、作業者端末3から受信した発話データ毎に一意に付与される識別情報であり、発話データDB44で全ての発話データが発話IDにより管理される。発話IDにより、発話データDB44と発話テーブル43とが関連付けされる。 The utterance ID is identification information uniquely assigned to each utterance data received from the worker terminal 3, and all the utterance data is managed by the utterance ID in the utterance data DB 44. The utterance ID associates the utterance data DB 44 with the utterance table 43.

発話データは、作業者端末3から受信した発話作成情報3cから取得した、作業者9が作成した発話を表わすデータである。一例として、発話データは、テキスト、音声データ、対話状況を表現した画像や動画等である。 The utterance data is data representing the utterance created by the worker 9 acquired from the utterance creation information 3c received from the worker terminal 3. As an example, the utterance data is text, voice data, an image or a moving image expressing a dialogue situation, or the like.

このデータ例では、発話ID「u11」の発話データは「どちらへおでかけですか」であり、発話ID「u12」の発話データは「シカゴに行きます」であり、発話ID「u13」の発話データは「楽しんできてください」等が記録されている。他の発話IDについても同様に、作業者9が作成した内容そのものが示される。 In this data example, the utterance data of the utterance ID "u11" is "Where are you going?", The utterance data of the utterance ID "u12" is "Go to Chicago", and the utterance data of the utterance ID "u13". "Please enjoy" etc. are recorded. Similarly, for the other utterance IDs, the content itself created by the worker 9 is shown.

図22は、作業者スコアテーブルのデータ構成例を示す図である。図22において、作業者スコアテーブル45は、作業者9毎の作業者スコアを記録し管理するテーブルであり、作業者ID、作業者スコア等の項目を有する。 FIG. 22 is a diagram showing an example of data structure of the worker score table. In FIG. 22, the worker score table 45 is a table for recording and managing the worker score for each worker 9, and has items such as a worker ID and a worker score.

作業者IDは、作業者リスト41に1度以上追加されたことのある作業者IDを示す。作業者IDによって、発話テーブル43と作業者スコアテーブル45とが関連付けされる。
作業者スコアは、発話テーブル43の作業者IDに対応付けられている発話スコアを用いて算出されたスコアを示し、作業者9の発話作成に対する誠実な貢献度(作成した発話の内容の信頼度)を示す。
The worker ID indicates a worker ID that has been added to the worker list 41 at least once. The utterance table 43 and the worker score table 45 are associated with each other by the worker ID.
The worker score indicates a score calculated using the utterance score associated with the worker ID of the utterance table 43, and the degree of sincere contribution to the utterance creation of the worker 9 (reliability of the content of the created utterance). ) Is shown.

図23は、スコア付き対話データのデータ構成例を示す図である。図23において、スコア付き対話データ6bは、対話タスクを評価した結果を示すテーブルであり、対話ID、対話スコア、発話1、発話2、発話3等の項目を有する。 FIG. 23 is a diagram showing a data structure example of dialogue data with a score. In FIG. 23, the scored dialogue data 6b is a table showing the result of evaluating the dialogue task, and has items such as dialogue ID, dialogue score, utterance 1, utterance 2, and utterance 3.

対話IDは、対話タスクを特定する識別情報であり、対話タスクテーブル42に存在する対話IDのいずれかを示す。対話スコアは、発話テーブル43の発話スコアに基づいて、最も支持されたパスを特定し、特定したパス上で示される発話スコアを用いて算出された値を示し、対話タスクの完成度を示す。対話スコアが「1」の場合に最も完成度が高く、「0」に近付くほど完成度が低いことを示す。発話1、発話2、発話3等は、最も支持されたパス上でなされた発話データを示す。 The dialogue ID is identification information that identifies the dialogue task, and indicates any of the dialogue IDs existing in the dialogue task table 42. The dialogue score identifies the most supported path based on the utterance score of the utterance table 43, indicates a value calculated using the utterance score shown on the identified path, and indicates the degree of completion of the dialogue task. When the dialogue score is "1", the degree of completion is the highest, and the closer it is to "0", the lower the degree of completion. Utterance 1, utterance 2, utterance 3, etc. indicate utterance data made on the most supported path.

このデータ例では、対話ID「d1」について、対話スコアは「1」を示し、最も支持されたパス上でなわれた発話は、発話1「どちらへおでかけですか」、発話2「シカゴに行きます」、発話3「楽しんできてください」等であったことが示されている。 In this data example, for the dialogue ID "d1", the dialogue score is "1", and the utterances made on the most supported path are utterance 1 "Where are you going?" And utterance 2 "Go to Chicago." It is shown that it was "Masu", utterance 3 "Please enjoy", etc.

対話ID「d3」について、対話スコアは「0.75」を示し、最も支持されたパス上でなわれた発話は、発話1「どこへ行きますか」、発話2「見送りです」、発話3「[終了]」が示されている。作業者9がこの対話は直前の発話で完結したと判断し、対話画面G70の終了チェック領域74をチェックした場合に、発話3のように[終了]が示される。 For the dialogue ID "d3", the dialogue score is "0.75", and the utterances made on the most supported path are utterance 1 "where are you going", utterance 2 "see off", utterance 3 "[End]" is shown. When the worker 9 determines that this dialogue is completed in the immediately preceding utterance and checks the end check area 74 of the dialogue screen G70, [End] is indicated as in utterance 3.

次に、各処理部50〜58における処理について説明する。以下の図において、点線はデータの流れを示し、実線は処理の流れを示す。先ず、初期化部50による初期化処理について説明する。 Next, the processing in each processing unit 50 to 58 will be described. In the figure below, the dotted line shows the data flow and the solid line shows the processing flow. First, the initialization process by the initialization unit 50 will be described.

図24は、初期化処理を説明するためのフローチャート図である。図24において、初期化部50は、対話数を取得する(ステップS201)。対話数の取得は、記憶部130に予め設定された対話数を読み込むことでもよいし、入力画面を表示装置115に表示して、サーバ装置100の管理者等により初期設定として入力させてもよい。初期化部50は、作業者リスト41を空にし(ステップS202)、対話数に基づいて、対話タスクテーブル42を初期化する(ステップS203)。 FIG. 24 is a flowchart for explaining the initialization process. In FIG. 24, the initialization unit 50 acquires the number of dialogues (step S201). The number of dialogues may be acquired by reading the number of dialogues preset in the storage unit 130, or by displaying an input screen on the display device 115 and having the administrator of the server device 100 input the number of dialogues as an initial setting. .. The initialization unit 50 empties the worker list 41 (step S202) and initializes the dialogue task table 42 based on the number of dialogues (step S203).

対話タスクテーブル42の初期化の一例として、対話数「5」が指定された場合、対話タスクを識別する対話IDを5個生成し、対話タスクテーブル42に登録する。対話ID「d1」、「d2」、「d3」、「d4」、及び「d5」が生成された場合、対話ID毎にレコードが対話タスクテーブル42に生成される。 As an example of initialization of the dialogue task table 42, when the number of dialogues "5" is specified, five dialogue IDs that identify the dialogue tasks are generated and registered in the dialogue task table 42. When the dialogue IDs "d1", "d2", "d3", "d4", and "d5" are generated, a record is generated in the dialogue task table 42 for each dialogue ID.

次に、作業者登録部51による作業者登録処理と、作業者割当部52による作業者割当処理とについて説明する。図25は、作業者登録処理と作業者割当処理とを説明するためのフローチャート図である。 Next, the worker registration process by the worker registration unit 51 and the worker allocation process by the worker allocation unit 52 will be described. FIG. 25 is a flowchart for explaining the worker registration process and the worker allocation process.

図25において、作業者登録部51は、対話参加要求3aをユーザI/F60を介して受信すると、対話参加要求3aから作業者IDを取得して、作業者リスト41へ追加する(ステップS211)。作業者登録部51は、対話参加要求3aの受信毎に、同様の処理を行う。 In FIG. 25, when the worker registration unit 51 receives the dialogue participation request 3a via the user I / F60, the worker registration unit 51 acquires the worker ID from the dialogue participation request 3a and adds it to the worker list 41 (step S211). .. The worker registration unit 51 performs the same process each time the dialogue participation request 3a is received.

一方、作業者割当部52は、所定間隔で、作業者リスト41から順に作業者IDを1つ取り出して(ステップS221)、対話タスク選択部53を呼び出して作業者ID及び対話タスクテーブル42を通知して、対話タスク選択部53により対話タスク選択処理を行う(ステップS222)。作業者IDに対して割り当てる対話タスクが対話IDにより特定される。作業者割当部52によるステップS221は作業者ID取出部に相当し、対話タスク選択部53によるステップS222は選択部に相当する。 On the other hand, the worker allocation unit 52 takes out one worker ID in order from the worker list 41 at predetermined intervals (step S221), calls the dialogue task selection unit 53, and notifies the worker ID and the dialogue task table 42. Then, the dialogue task selection unit 53 performs the dialogue task selection process (step S222). The dialogue task to be assigned to the worker ID is specified by the dialogue ID. Step S221 by the worker allocation unit 52 corresponds to the worker ID extraction unit, and step S222 by the dialogue task selection unit 53 corresponds to the selection unit.

タスク選択処理により対話タスクが特定されると、作業者割当部52は、作業者リスト41は空か否かを判定する(ステップS224)。作業者リスト41が空でない場合(ステップS224のNO)、作業者割当部52は、ステップS221へと戻り、上記同様の処理を繰り返す。一方、作業者リスト41が空の場合(ステップS224のYES)、作業者割当部52は、この作業者割当処理を終了する。 When the interactive task is specified by the task selection process, the worker allocation unit 52 determines whether or not the worker list 41 is empty (step S224). If the worker list 41 is not empty (NO in step S224), the worker allocation unit 52 returns to step S221 and repeats the same process as described above. On the other hand, when the worker list 41 is empty (YES in step S224), the worker allocation unit 52 ends the worker allocation process.

図26は、図25のステップS222における対話タスク選択処理を説明するためのフローチャート図である。図26において、対話タスク選択部53は、作業者割当部52から作業者ID及び対話タスクテーブル42を受け取ると、対話タスクテーブル42の全ての対話IDに対して選択確率を算出する(ステップS231)。 FIG. 26 is a flowchart for explaining the dialogue task selection process in step S222 of FIG. 25. In FIG. 26, when the dialogue task selection unit 53 receives the worker ID and the dialogue task table 42 from the worker allocation unit 52, the dialogue task selection unit 53 calculates the selection probabilities for all the dialogue IDs in the dialogue task table 42 (step S231). ..

上述した作業者割当手順に従って、対話IDごとに選択確率が求められる。対話タスクが、通知された作業者IDで終わっている場合には、
選択確率 = 0
とする。それ以外では、
選択確率 = 作業者IDの出現回数/発話個数
により算出する。
The selection probability is obtained for each dialogue ID according to the worker allocation procedure described above. If the interactive task ends with the notified worker ID,
Selection probability = 0
And. Otherwise
Selection probability = Calculated based on the number of occurrences / number of utterances of the worker ID.

対話タスク選択部53は、選択確率の最大値を持つ対話IDを対話タスクテーブル42から選択し(ステップS232)、選択した対話IDの数は1つか否かを判断する(ステップS233)。選択した対話IDの数は1つの場合(ステップS233のYES)、対話タスク選択部53は、ステップS237へと進む。 The dialogue task selection unit 53 selects the dialogue ID having the maximum selection probability from the dialogue task table 42 (step S232), and determines whether or not the number of selected dialogue IDs is one (step S233). When the number of selected dialogue IDs is one (YES in step S233), the dialogue task selection unit 53 proceeds to step S237.

一方、選択した対話IDの数が複数の場合(ステップS233のNO)、対話タスク選択部53は、発話個数が最小の対話IDを選択し(ステップS234)、選択した対話IDの数は1つか否かを判断する(ステップS235)。選択した対話IDの数は1つの場合(ステップS235のYES)、対話タスク選択部53は、ステップS237へと進む。 On the other hand, when the number of selected dialogue IDs is plural (NO in step S233), the dialogue task selection unit 53 selects the dialogue ID having the smallest number of utterances (step S234), and the number of selected dialogue IDs is one. It is determined whether or not (step S235). When the number of selected dialogue IDs is one (YES in step S235), the dialogue task selection unit 53 proceeds to step S237.

一方、選択した対話IDの数が複数の場合(ステップS235のNO)、対話タスク選択部53は、選択した複数の対話IDからランダムに1つを選択し(ステップS236)、対話タスク生成部54を呼び出して、対話ID及び発話テーブル43を通知し、対話タスク生成部54により対話タスク生成処理を行う(ステップS237)。対話IDに対応する対話タスクが生成される。 On the other hand, when the number of selected dialogue IDs is plural (NO in step S235), the dialogue task selection unit 53 randomly selects one from the selected plurality of dialogue IDs (step S236), and the dialogue task generation unit 54 Is called to notify the dialogue ID and the utterance table 43, and the dialogue task generation unit 54 performs the dialogue task generation process (step S237). A dialogue task corresponding to the dialogue ID is generated.

対話タスク選択部53は、対話タスクを取得すると、作業者割当部52への戻り値として設定し、この対話タスク選択処理を終了する。 When the dialogue task selection unit 53 acquires the dialogue task, it sets it as a return value to the worker allocation unit 52 and ends the dialogue task selection process.

図27は、図26のステップS237における対話タスク生成処理を説明するためのフローチャート図である。図27では、対話IDで特定された対話タスクが発話の作成毎に、<ケース1>→<ケース2>→<ケース3>→<ケース4>の順に遷移した場合に対応付けて説明する。対話タスク生成部54から指定される対話IDの発話木構造8は、<ケース1>、<ケース2>、<ケース3>、又は<ケース4>のいずれかに相当する。 FIG. 27 is a flowchart for explaining the dialogue task generation process in step S237 of FIG. 26. In FIG. 27, a case where the dialogue task specified by the dialogue ID transitions in the order of <case 1> → <case 2> → <case 3> → <case 4> for each utterance creation will be described. The utterance tree structure 8 of the dialogue ID designated by the dialogue task generation unit 54 corresponds to any one of <Case 1>, <Case 2>, <Case 3>, or <Case 4>.

対話タスク生成部54は、対話タスク生成部54から受け付けた発話テーブル43と対話IDとを用いて、発話テーブル43における指定された対話IDに対応付けられる発話IDを発話木構造8に従ってたどり、末端の発話IDのうち、発話スコアが0でない発話IDを取得する(ステップS241)。 The dialogue task generation unit 54 traces the utterance ID associated with the designated dialogue ID in the utterance table 43 according to the utterance tree structure 8 by using the utterance table 43 and the dialogue ID received from the dialogue task generation unit 54, and ends. Of the utterance IDs of the above, the utterance ID whose utterance score is not 0 is acquired (step S241).

対話タスク生成部54は、取得した発話IDの数が1であったか2であったかを判断する(ステップS242)。 The dialogue task generation unit 54 determines whether the number of acquired utterance IDs is 1 or 2 (step S242).

取得した発話IDは1つであった場合、対話タスク生成部54は、発話テーブル43から取得した発話IDを用いて発話データDB44を参照し発話履歴情報を取得して、対話タスクを作成する(ステップS243)。 When there is only one utterance ID acquired, the dialogue task generation unit 54 refers to the utterance data DB 44 using the utterance ID acquired from the utterance table 43, acquires utterance history information, and creates a dialogue task ( Step S243).

この場合は<ケース1>に相当する。親の発話ID「A」に対して子の発話IDは「D」のみである。従って、ステップS243では、発話データDB44から発話ID「A」で特定される発話データと、発話ID「D」で特定される発話データとにより、<ケース1>の発話木構造8に従って時系列に並べることで発話履歴情報を取得する。この発話履歴情報を含む対話タスクが作成される。 In this case, it corresponds to <Case 1>. The utterance ID of the child is only "D" with respect to the utterance ID "A" of the parent. Therefore, in step S243, the utterance data specified by the utterance ID “A” from the utterance data DB 44 and the utterance data specified by the utterance ID “D” are arranged in chronological order according to the utterance tree structure 8 of <Case 1>. Get utterance history information by arranging them. A dialogue task containing this utterance history information is created.

その後、対話タスク生成部54は、作成した対話タスクを戻り値として設定し、この対話タスク生成処理を終了する。 After that, the dialogue task generation unit 54 sets the created dialogue task as a return value, and ends the dialogue task generation process.

ステップS242において取得した発話IDは2つであると判断した場合、対話タスク生成部54は、発話テーブル43から発話IDのそれぞれの支持数を取得し、取得した支持数の合計値が2を示すか3を示すかを判断する(ステップS244)。 When it is determined that the number of utterance IDs acquired in step S242 is two, the dialogue task generation unit 54 acquires the number of support for each utterance ID from the utterance table 43, and the total value of the acquired number of support indicates 2. It is determined whether or 3 is shown (step S244).

ステップS244において指示数の合計値が2を示すと判断した場合、対話タスク生成部54は、最後に追加された発話IDを除く発話IDを用いて発話データDB44を参照し発話履歴情報を取得して、対話タスクを作成する(ステップS245)。 When it is determined in step S244 that the total value of the number of instructions indicates 2, the dialogue task generation unit 54 refers to the utterance data DB 44 using the utterance ID excluding the last added utterance ID, and acquires the utterance history information. To create an interactive task (step S245).

この場合は<ケース2>又は<ケース3>に相当する。<ケース2>の場合、最後に追加された発話IDは「C」であるため、この発話ID「C」が除かれる。従って、発話データDB44から発話ID「A」で特定される発話データと、発話ID「D」で特定される発話データとにより、<ケース2>の発話木構造8に従って時系列に並べることで発話履歴情報を取得する。この発話履歴情報を含む対話タスクが作成される。 In this case, it corresponds to <Case 2> or <Case 3>. In the case of <Case 2>, since the last added utterance ID is "C", this utterance ID "C" is excluded. Therefore, the utterance data specified by the utterance ID "A" from the utterance data DB 44 and the utterance data specified by the utterance ID "D" are arranged in chronological order according to the utterance tree structure 8 of <Case 2>. Get history information. A dialogue task containing this utterance history information is created.

<ケース3>の場合、最後に追加された発話IDは「E」であるため、この発話ID「E」が除かれる。更に、発話ID「D」の発話は不適切であると判断されているため考慮せず、発話データDB44から発話ID「A」で特定される発話データと、発話ID「C」で特定される発話データとにより、<ケース3>の発話木構造8に従って時系列に並べることで発話履歴情報を取得する。この発話履歴情報を含む対話タスクが作成される。 In the case of <Case 3>, since the last added utterance ID is "E", this utterance ID "E" is excluded. Further, since it is determined that the utterance of the utterance ID "D" is inappropriate, it is not considered, and the utterance data specified by the utterance ID "A" and the utterance ID "C" are specified from the utterance data DB44. Based on the utterance data, the utterance history information is acquired by arranging them in chronological order according to the utterance tree structure 8 of <Case 3>. A dialogue task containing this utterance history information is created.

その後、対話タスク生成部54は、作成した対話タスクを戻り値として設定し、この対話タスク生成処理を終了する。 After that, the dialogue task generation unit 54 sets the created dialogue task as a return value, and ends the dialogue task generation process.

ステップS244において取得した指示数の合計値が3を示すと判断した場合、対話タスク生成部54は、発話テーブル44を参照して、発話スコアの最も高い発話を選択して、対話タスクを作成する(ステップS246)。 When it is determined that the total value of the number of instructions acquired in step S244 indicates 3, the dialogue task generation unit 54 refers to the utterance table 44, selects the utterance with the highest utterance score, and creates a dialogue task. (Step S246).

この場合は<ケース4>に相当する。<ケース4>の場合、発話スコアの最も高い発話IDは「F」である。発話ID「F」を有するパスに従って、発話データDB44から発話ID「A」で特定される発話データと、発話ID「D」で特定される発話データと、発話ID「F」で特定される発話データとにより、<ケース4>の発話木構造8に従って時系列に並べることで発話履歴情報を取得する。この発話履歴情報を含む対話タスクが作成される。 In this case, it corresponds to <Case 4>. In the case of <Case 4>, the utterance ID having the highest utterance score is "F". According to the path having the utterance ID "F", the utterance data specified by the utterance ID "A" from the utterance data DB44, the utterance data specified by the utterance ID "D", and the utterance specified by the utterance ID "F". Based on the data, the utterance history information is acquired by arranging them in chronological order according to the utterance tree structure 8 of <Case 4>. A dialogue task containing this utterance history information is created.

その後、対話タスク生成部54は、作成した対話タスクを戻り値として設定し、この対話タスク生成処理を終了する。 After that, the dialogue task generation unit 54 sets the created dialogue task as a return value, and ends the dialogue task generation process.

次に、発話作成部55による発話作成処理を説明する。図28は、発話作成処理を説明するためのフローチャート図である。図28において、発話作成部55は、ユーザI/F60を介して発話作成情報3cを受信すると、発話作成情報3c内の発話データに発話IDを付与して、発話データDB44に記録し、発話IDを対話タスクテーブル42へ追加する(ステップS251)。 Next, the utterance creation process by the utterance creation unit 55 will be described. FIG. 28 is a flowchart for explaining the utterance creation process. In FIG. 28, when the utterance creation unit 55 receives the utterance creation information 3c via the user I / F60, it assigns the utterance ID to the utterance data in the utterance creation information 3c, records it in the utterance data DB 44, and records the utterance ID. Is added to the interactive task table 42 (step S251).

そして、発話作成部55は、発話作成情報3cから不適切チェック有無を取得して、取得した不適切チェック有無と、発話IDと、発話テーブル43とを発話情報更新部56に通知して、発話情報更新処理を行う(ステップS252)。発話情報更新処理により発話テーブル43が更新され、発話作成部55は、この発話作成処理を終了する。 Then, the utterance creation unit 55 acquires the presence / absence of the inappropriate check from the utterance creation information 3c, notifies the utterance information update unit 56 of the acquired improper check presence / absence, the utterance ID, and the utterance table 43, and utters. Information update processing is performed (step S252). The utterance table 43 is updated by the utterance information update process, and the utterance creation unit 55 ends the utterance creation process.

次に、発話情報更新部56による発話情報更新処理について説明する。図29は、図28のステップS252における発話情報更新処理を説明するためのフローチャート図である。 Next, the utterance information update process by the utterance information update unit 56 will be described. FIG. 29 is a flowchart for explaining the utterance information update process in step S252 of FIG. 28.

図29において、発話情報更新部56は、発話IDを新しく追加するのか否かを判断する(ステップS261)。発話木構造8pの最後の発話ID「D」を親発話IDとする発話IDが他になければ、新たに追加する発話であると判断する。 In FIG. 29, the utterance information updating unit 56 determines whether or not to newly add the utterance ID (step S261). If there is no other utterance ID having the last utterance ID "D" of the utterance tree structure 8p as the parent utterance ID, it is determined that the utterance is newly added.

一例として、図28では、割り当てた対話が発話木構造8pで表現される場合は、新たな発話IDの追加であると判断する。一方、割り当てた対話が発話木構造8qで表現される場合は、新たな発話IDは新たな追加ではないと判断する。 As an example, in FIG. 28, when the assigned dialogue is represented by the utterance tree structure 8p, it is determined that a new utterance ID is added. On the other hand, when the assigned dialogue is represented by the utterance tree structure 8q, it is determined that the new utterance ID is not a new addition.

ステップS261において新しく追加すると判断した場合、発話情報更新部56は、更に、最後の発話が不適切であるか否かを判断する(ステップS262)。不適切チェック無しの場合、発話情報更新部56は、最後の発話は不適切でないと判定し、発話テーブル43に新たな発話IDを追加登録し、支持数に1を設定する(ステップS263)。 When it is determined in step S261 that a new utterance is to be added, the utterance information update unit 56 further determines whether or not the last utterance is inappropriate (step S262). If there is no inappropriate check, the utterance information update unit 56 determines that the last utterance is not inappropriate, additionally registers a new utterance ID in the utterance table 43, and sets the number of support to 1. (Step S263).

最後の発話ID「D」を親発話IDとした、支持数「1」の新たな発話IDのレコードが発話テーブル43に追加される。発話木構造8pは発話木構造8p−1に遷移する。そして、発話情報更新部56は、ステップS268へと進む。 A record of a new utterance ID having a support number of "1" with the last utterance ID "D" as the parent utterance ID is added to the utterance table 43. The utterance tree structure 8p transitions to the utterance tree structure 8p-1. Then, the utterance information update unit 56 proceeds to step S268.

一方、ステップS262において、不適切チェック有りの場合、発話情報更新部56は、最後の発話は不適切であると判定し、発話テーブル43に新たな発話IDを追加登録し、最後の発話IDと同じ親発話IDを設定し、支持数を1に設定する(ステップS264)。 On the other hand, in step S262, when there is an inappropriate check, the utterance information update unit 56 determines that the last utterance is inappropriate, additionally registers a new utterance ID in the utterance table 43, and sets it as the last utterance ID. The same parent utterance ID is set, and the number of supports is set to 1 (step S264).

最後の発話IDと同じ親発話IDが設定され、支持数「1」の新たな発話IDのレコードが発話テーブル43に追加される。発話木構造8pは発話木構造8p−2に遷移する。そして、発話情報更新部56は、ステップS268へと進む。 The same parent utterance ID as the last utterance ID is set, and a record of a new utterance ID with a support number of "1" is added to the utterance table 43. The utterance tree structure 8p transitions to the utterance tree structure 8p-2. Then, the utterance information update unit 56 proceeds to step S268.

ステップS261において新しく追加しないと判断した場合、発話情報更新部56は、更に、最後の発話が不適切であるか否かを判断する(ステップS265)。不適切チェック無しの場合、発話情報更新部56は、最後の発話は不適切でないと判定し、発話テーブル43において、親発話IDに対して支持数を1増やし、新たな発話IDを追加登録し、その支持数を1に設定する(ステップS266)。 If it is determined in step S261 that no new utterance is to be added, the utterance information updating unit 56 further determines whether or not the last utterance is inappropriate (step S265). If there is no inappropriate check, the utterance information update unit 56 determines that the last utterance is not inappropriate, increases the number of support by 1 with respect to the parent utterance ID in the utterance table 43, and additionally registers a new utterance ID. , The number of supports is set to 1 (step S266).

親発話IDのレコードの支持数が1加算され、支持数「1」の新たな発話IDのレコードが発話テーブル43に追加される。発話木構造8q発話木構造8q−1に遷移する。そして、発話情報更新部56は、ステップS268へと進む。 The number of support of the record of the parent utterance ID is added by 1, and the record of the new utterance ID with the number of support "1" is added to the utterance table 43. Speaking tree structure 8q Transition to the utterance tree structure 8q-1. Then, the utterance information update unit 56 proceeds to step S268.

一方、ステップS265において、不適切チェック有りの場合、発話情報更新部56は、最後の発話は不適切であると判定する。そして、発話情報更新部56は、発話テーブルにおいて、最後の発話IDに対して支持数を0に設定し、新たな発話IDを追加登録し、最後の発話IDと同じ親発話IDを設定し、支持数を1に設定する(ステップS267)。 On the other hand, in step S265, when there is an inappropriate check, the utterance information updating unit 56 determines that the last utterance is inappropriate. Then, the utterance information update unit 56 sets the number of support to 0 for the last utterance ID in the utterance table, additionally registers a new utterance ID, sets the same parent utterance ID as the last utterance ID, and sets the same parent utterance ID. The number of supports is set to 1 (step S267).

最後の発話IDのレコードの支持数が0に設定さら、最後の発話IDと同じ親発話IDを持ち、支持数「1」の新たな発話IDのレコードが発話テーブル43に追加される。発話木構造8q発話木構造8q−2に遷移する。そして、発話情報更新部56は、ステップS268へと進む。 The number of support of the record of the last utterance ID is set to 0. Further, the record of the new utterance ID having the same parent utterance ID as the last utterance ID and the number of support "1" is added to the utterance table 43. The utterance tree structure 8q transitions to the utterance tree structure 8q-2. Then, the utterance information update unit 56 proceeds to step S268.

ステップS268では、発話情報更新部56は、支持数が変化したノードと、その兄弟ノードそれぞれに対して、発話スコアを算出し、それぞれのレコードに設定する。発話スコアは、
支持数 ÷ 兄弟ノードの合計支持数
により得られる。
In step S268, the utterance information update unit 56 calculates the utterance score for each of the node whose support number has changed and its sibling node, and sets it in each record. The utterance score is
Support number ÷ Obtained by the total support number of sibling nodes.

発話木構造8p−1では、新たな発話ID「N」の兄弟ノードは存在しないため、発話スコアは「1」となる。 In the utterance tree structure 8p-1, since there is no sibling node of the new utterance ID “N”, the utterance score is “1”.

また、発話木構造8p−2では、新たな発話ID「N」の兄弟ノードは発話ID「D」である。従って、発話ID「N」の発話スコアに「1/2」が設定され、発話ID「D」の発話スコアに「1/2」が設定される。 Further, in the utterance tree structure 8p-2, the sibling node of the new utterance ID “N” is the utterance ID “D”. Therefore, "1/2" is set in the utterance score of the utterance ID "N", and "1/2" is set in the utterance score of the utterance ID "D".

一方、発話木構造8q−1では、支持数の変化した発話ID「D」には発話ID「C」の兄弟ノードが存在するため、発話ID「D」の発話スコアに「2/3」が設定され、発話ID「C」の発話スコアに「1/3」が設定される。発話ID「N」に兄弟は存在しないため、発話スコアは「1」となる。 On the other hand, in the utterance tree structure 8q-1, since the utterance ID “D” whose support number has changed has a sibling node of the utterance ID “C”, the utterance score of the utterance ID “D” is “2/3”. It is set, and "1/3" is set in the utterance score of the utterance ID "C". Since there are no siblings in the utterance ID "N", the utterance score is "1".

また、発話木構造8q−2では、支持数の変化した発話ID「D」には、発話ID「C」と、新たに追加した発話ID「N」とが兄弟ノードとして存在している。発話ID「D」の発話スコアは「0」であり、削除された状態を示す。兄弟ノードの、発話ID「C」の発話スコアに「1/2」が設定され、発話ID「N」の発話スコアに「1/2」が設定される。 Further, in the utterance tree structure 8q-2, the utterance ID "C" and the newly added utterance ID "N" exist as sibling nodes in the utterance ID "D" whose support number has changed. The utterance score of the utterance ID "D" is "0", indicating a deleted state. The utterance score of the utterance ID "C" of the sibling node is set to "1/2", and the utterance score of the utterance ID "N" is set to "1/2".

次に、対話データ取出部57による対話データ取出処理を説明する。図30は、対話データ取出処理を説明するためのフローチャート図である。図30において、対話データ取出部57は、ユーザI/F60から対話データ取得要求6aの通知を受けると、作業者スコア算出部58を呼び出して、発話テーブル43を通知し、作業者スコア算出処理を行う(ステップS271)。対話データ取出部57は、作業者スコア算出部58から、戻り値として、作業者9毎に発話作成の内容に対する信頼度を示した作業者スコアテーブル45を取得する。 Next, the dialogue data retrieval process by the dialogue data retrieval unit 57 will be described. FIG. 30 is a flowchart for explaining the dialogue data retrieval process. In FIG. 30, when the dialogue data acquisition unit 57 receives the notification of the dialogue data acquisition request 6a from the user I / F60, it calls the worker score calculation unit 58, notifies the utterance table 43, and performs the worker score calculation process. (Step S271). The dialogue data extraction unit 57 acquires, as a return value, a worker score table 45 indicating the reliability of the content of the utterance creation for each worker 9 from the worker score calculation unit 58.

そして、対話データ取出部57は、対話スコア算出部59を呼び出して、作業者スコア算出部58から得た作業者スコアテーブル45を通知し、対話スコア算出処理を行う(ステップS272)。対話データ取出部57は、対話スコア算出部59から、戻り値として、対話毎に文脈の適切さを示したスコア付き対話データ6bを取得する。 Then, the dialogue data extraction unit 57 calls the dialogue score calculation unit 59, notifies the worker score table 45 obtained from the worker score calculation unit 58, and performs the dialogue score calculation process (step S272). The dialogue data extraction unit 57 acquires scored dialogue data 6b indicating the appropriateness of the context for each dialogue as a return value from the dialogue score calculation unit 59.

次に、作業者スコア算出部58による作業者スコア算出処理について説明する。図31は、図30のステップS271における作業者スコア算出処理を説明するためのフローチャート図である。 Next, the worker score calculation process by the worker score calculation unit 58 will be described. FIG. 31 is a flowchart for explaining the worker score calculation process in step S271 of FIG. 30.

図31において、作業者スコア算出部58は、発話テーブル43を参照して、作業者ID毎に、発話数と発話スコアの合計とを求める(ステップS281)。 In FIG. 31, the worker score calculation unit 58 refers to the utterance table 43 and obtains the total number of utterances and the utterance score for each worker ID (step S281).

そして、作業者スコア算出部58は、作業者ID毎に、求めた発話数と発話スコアの合計とから平均値を算出し、作業者IDと算出した平均値とを対応付けた作業者スコアテーブル45を作成する(ステップS282)。作業者スコア算出部58は、作成した作業者スコアテーブル45を戻り値に設定し、この作業者スコア算出処理を終了する。 Then, the worker score calculation unit 58 calculates an average value from the obtained number of utterances and the total of the utterance scores for each worker ID, and the worker score table in which the worker ID and the calculated average value are associated with each other. 45 is created (step S282). The worker score calculation unit 58 sets the created worker score table 45 as a return value, and ends the worker score calculation process.

次に、対話スコア算出部59による対話スコア算出処理について説明する。図32は、図30のステップS272における対話スコア算出処理を説明するためのフローチャート図である。 Next, the dialogue score calculation process by the dialogue score calculation unit 59 will be described. FIG. 32 is a flowchart for explaining the dialogue score calculation process in step S272 of FIG. 30.

図32において、対話スコア算出部59は、発話テーブル43を参照して、対話ID毎に、発話木構造8の親子関係に従い、発話スコアに基づいて発話IDを選択することで、最も支持されたパスを特定する(ステップS291)。2以上の発話IDに対して同一の親発話IDが対応付けられている場合、対話スコア算出部59は、発話スコアが最大値の発話IDを選択する。 In FIG. 32, the dialogue score calculation unit 59 is most supported by selecting the utterance ID based on the utterance score according to the parent-child relationship of the utterance tree structure 8 for each dialogue ID with reference to the utterance table 43. The path is specified (step S291). When the same parent utterance ID is associated with two or more utterance IDs, the dialogue score calculation unit 59 selects the utterance ID having the maximum utterance score.

対話スコア算出部59は、発話テーブル43を参照して、対話ID毎に、特定したパス上の発話IDに対応付けられた作業者IDを取得する(ステップS292)。更に、対話スコア算出部59は、作業者スコアテーブル45を参照して、対話ID毎に、特定したパス上の発話IDに対応付けられた作業者IDを取得する(ステップS293)。 The dialogue score calculation unit 59 refers to the utterance table 43 and acquires the worker ID associated with the utterance ID on the specified path for each dialogue ID (step S292). Further, the dialogue score calculation unit 59 refers to the worker score table 45 and acquires the worker ID associated with the utterance ID on the specified path for each dialogue ID (step S293).

また、対話スコア算出部59は、パス毎に、作業者スコアの合計値と、対話IDの総数とを用いて相乗平均を算出する(ステップS294)。 In addition, the dialogue score calculation unit 59 calculates the geometric mean for each pass using the total value of the worker scores and the total number of dialogue IDs (step S294).

そして、対話スコア算出部59は、各対話IDに対して、最も支持されたパスの発話IDの順に、発話データDB44から発話データを取得して、対話IDと、対話スコアと、発話データとを対応付けたスコア付き対話データ6bを作成する(ステップS295)。対話スコア算出部59は、作成したスコア付き対話データ6bを戻り値に設定して、この対話スコア算出処理を終了する。 Then, the dialogue score calculation unit 59 acquires utterance data from the utterance data DB 44 in the order of the utterance IDs of the most supported paths for each dialogue ID, and obtains the dialogue ID, the dialogue score, and the utterance data. The associated dialogue data 6b with a score is created (step S295). The dialogue score calculation unit 59 sets the created dialogue data 6b with a score as a return value, and ends the dialogue score calculation process.

上述より、本実施例では、作業者9のペアを作る必要がないため、ペアを作って時間を調整する等の作業コストを削減することができる。ペアを作る場合には、ペアの管理コストの負担や高い作業単価のために、一定の費用を用いて作成できる対話コーパスのサイズが小さくなる。そのため、小規模な対話コーパスしか作ることが出来なかった。 From the above, in this embodiment, since it is not necessary to make a pair of workers 9, it is possible to reduce the work cost such as making a pair and adjusting the time. When creating a pair, the size of the dialogue corpus that can be created at a fixed cost becomes small due to the burden of managing the pair and the high unit cost of work. Therefore, only a small dialogue corpus could be created.

一方、本実施例では、個別の作業者9による対話の発話作業が可能となるため、作業者9は、作業者端末3を用いて、任意の場所や時間に作業を行える。そのため不特定多数の作業者9が作業にあたることができ、大規模な対話コーパスの作成を可能とする。また、不特定多数の個別の作業者9に作業を発注する方法であるクラウドソーシングを利用できるようになる。 On the other hand, in the present embodiment, since the individual worker 9 can perform the utterance work of the dialogue, the worker 9 can perform the work at an arbitrary place and time by using the worker terminal 3. Therefore, an unspecified number of workers 9 can perform the work, and a large-scale dialogue corpus can be created. In addition, crowdsourcing, which is a method of ordering work from an unspecified number of individual workers 9, can be used.

更に、不適切な発話を作成する作業者9を作業者スコアに基づいて特定することが可能であり、作業者スコアにより作業者9をフィルタリングすることにより不適切な発話の作成を抑制できる。また、発話の適切さを示すスコアを算出可能であるため、質の良い対話を特定でき、対話の内容(対話の流れの発話データのセット)を提供可能である。 Further, it is possible to identify the worker 9 who creates an inappropriate utterance based on the worker score, and by filtering the worker 9 by the worker score, the creation of an inappropriate utterance can be suppressed. In addition, since it is possible to calculate a score indicating the appropriateness of utterance, it is possible to identify a high-quality dialogue and provide the content of the dialogue (a set of utterance data in the flow of the dialogue).

また、選択確率を用いた作業者9の対話への割り当てにより、作業者9の負荷を下げることができ、これにより作業単価を低く抑えることができる。 Further, by assigning the worker 9 to the dialogue using the selection probability, the load on the worker 9 can be reduced, and thus the work unit price can be kept low.

クラウドソーシングでは、作業可能な作業者9の数は時系列上で一定ではないが、その数の如何によらず適切な作業の割り当てを行うことができる。 In crowdsourcing, the number of workers 9 who can work is not constant in time series, but appropriate work can be assigned regardless of the number.

本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、主々の変形や変更が可能である。 The present invention is not limited to the specifically disclosed examples, and major modifications and modifications can be made without departing from the scope of claims.

以上の本実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から、1発話ごとに取り出し、
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択し、
前記複数の作業者により前記対話を完成させた対話データを得る
処理をコンピュータに実行させる対話コーパス作成プログラム。
(付記2)
前記対話を割り当てた作業者の作業者端末に、該対話の対話情報の表示と、該対話情報で示される直前の発話の内容が不適切である場合のチェックと、前記発話データの入力領域とを有する作成画面を表示させ、
前記作業者端末から、少なくとも前記発話データと、前記不適切のチェック有無とを受信すると、受信した該発話データを、前記対話の進行に従って親子関係を持つ木構造で管理し、前記不適切のチェック有りの場合、前記受信した発話データを、親の発話データから枝分かれさせて直前の発話データと兄弟関係として前記記憶部に記録し、
直後の発話データと共に受信した前記不適切のチェックの有無に応じて、前記直前の発話データの不適切さを判定する
処理を前記コンピュータに実行させる付記1記載の対話コーパス作成プログラム。
(付記3)
前記木構造では、受信した前記発話データに対して、支持数を付与し、
前記直前の発話データに対して兄弟関係の別の発話データが存在する場合、受信した前記発話データと共に受信した前記不適切のチェックの有無に応じて、該直前の発話データの前記支持数を増減する
処理を前記コンピュータに実行させる付記2記載の対話コーパス作成プログラム。
(付記4)
前記支持数が増減した発話データと、該発話データの兄弟関係の発話データとに対して、前記支持数の合計に対する該発話データそれぞれの支持数の割合により、発話スコアを算出し前記記憶部に記憶する
処理を前記コンピュータに実行させる付記3記載の対話コーパス作成プログラム。
(付記5)
前記記憶部を参照して、作業者ID毎に、作成した前記発話データの個数と、前記発話スコアの合計値とを取得し、
前記作業者ID毎に、前記発話スコアの平均値を算出して、該作業者IDに算出した該平均値を対応付けて前記記憶部に記憶する
処理を前記コンピュータに実行させる付記4記載の対話コーパス作成プログラム。
(付記6)
前記記憶部を参照して、対話毎の発話データの木構造の親子関係と、前記発話スコアとに基づいて、該対話において最も支持された一連の発話データのつながりによるパスを特定し、
前記パス毎に、前記発話データを作成した作業者の作業者IDに対応付けられた前記平均値を前記記憶部から取得して合計し、合計した値とパスの総数とを用いて相乗平均を算出し、対話を特定する対話IDと算出した相乗平均とを対応付けて前記記憶部に記憶する
処理を前記コンピュータに実行させる付記5記載の対話コーパス作成プログラム。
(付記7)
前記パス上の親子関係に従って発話データを順に並べ、前記相乗平均と共に前記対話IDに対応付けたスコア付き対話データを作成する
処理を前記コンピュータに実行させる付記6記載の対話コーパス作成プログラム。
(付記8)
前記コンピュータに、
前記複数の対話それぞれにおいて、該対話に参加した作業者の作業者IDの記録に、取り出された前記作業者IDが存在する割合を算出させ、
最も高い割合の対話の最後に取り出された前記作業者IDを追加し、追加した該作業者IDで特定される作業者を該最も高い割合の対話に割り当てさせる
ことを特徴とする付記1乃至7のいずれか一項記載の対話コーパス作成プログラム。
(付記9)
前記コンピュータに、
前記最も高い割合の対話が複数存在する場合、該複数の対話から、取り出された前記作業者IDの出現回数が最も多い対話を選択する
ことを特徴とする付記8記載の対話コーパス作成プログラム。
(付記10)
前記コンピュータに、
前記最も高い割合の対話が複数存在し、かつ、取り出された前記作業者IDの出現回数が同数の場合、該複数の対話から、ランダムに対話を1つを選択する。
ことを特徴とする付記8記載の対話コーパス作成プログラム。
(付記11)
2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から、1発話ごとに取り出し、
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択し、
前記複数の作業者により前記対話を完成させた対話データを得る
処理をコンピュータが行う対話コーパス作成方法。
(付記12)
2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から、1発話ごとに取り出す作業者ID取出部と、
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択する選択部と
前記複数の作業者により前記発話データを作成させ、作成された発話データを収集する発話作成部と
を有する情報処理装置。
The following additional notes will be further disclosed with respect to the above embodiments including the present embodiment.
(Appendix 1)
From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. Take out for each utterance
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on, select the dialogue to which the worker who creates the utterance data is assigned, and
A dialogue corpus creation program that causes a computer to execute a process of obtaining dialogue data that completes the dialogue by the plurality of workers.
(Appendix 2)
Displaying the dialogue information of the dialogue on the worker terminal of the worker to which the dialogue is assigned, checking when the content of the utterance immediately before being indicated by the dialogue information is inappropriate, and the input area of the utterance data. Display the creation screen with
When at least the utterance data and the presence / absence of the inappropriate check are received from the worker terminal, the received utterance data is managed by a tree structure having a parent-child relationship according to the progress of the dialogue, and the inappropriate check is performed. If there is, the received utterance data is branched from the parent's utterance data and recorded in the storage unit as a sibling relationship with the immediately preceding utterance data.
The dialogue corpus creation program according to Appendix 1, which causes the computer to execute a process of determining the inappropriateness of the immediately preceding utterance data according to the presence or absence of the inappropriateness check received together with the immediately preceding utterance data.
(Appendix 3)
In the tree structure, a support number is given to the received utterance data, and the support number is given.
When another utterance data having a sibling relationship exists with respect to the immediately preceding utterance data, the number of supports of the immediately preceding utterance data is increased or decreased depending on the presence or absence of the inappropriate check received together with the received utterance data. The interactive corpus creation program according to Appendix 2, which causes the computer to execute the processing to be performed.
(Appendix 4)
The utterance score is calculated from the utterance data in which the number of support increases or decreases and the utterance data of the sibling relationship of the utterance data, and the ratio of the number of support of each of the utterance data to the total number of support is calculated and stored in the storage unit. The interactive corpus creation program according to Appendix 3, which causes the computer to execute a process of storing data.
(Appendix 5)
With reference to the storage unit, the number of the created utterance data and the total value of the utterance score are acquired for each worker ID.
The dialogue according to Appendix 4, wherein an average value of the utterance scores is calculated for each worker ID, and a process of associating the calculated average value with the worker ID and storing the calculated average value in the storage unit is executed by the computer. Corpus creation program.
(Appendix 6)
With reference to the storage unit, the path of the most supported series of utterance data in the dialogue is identified based on the parent-child relationship of the tree structure of the utterance data for each dialogue and the utterance score.
For each pass, the average value associated with the worker ID of the worker who created the speech data is acquired from the storage unit and totaled, and the geometric mean is calculated using the total value and the total number of passes. The dialogue corpus creation program according to Appendix 5, which causes the computer to execute a process of associating a calculated dialogue ID for specifying a dialogue with a calculated geometric mean and storing it in the storage unit.
(Appendix 7)
The dialogue corpus creation program according to Appendix 6, wherein the computer is made to execute a process of arranging utterance data in order according to a parent-child relationship on the path and creating dialogue data with a score associated with the dialogue ID together with the geometric mean.
(Appendix 8)
On the computer
In each of the plurality of dialogues, the ratio of the extracted worker IDs present in the record of the worker IDs of the workers who participated in the dialogue is calculated.
Addendum 1 to 7, characterized in that the worker ID taken out at the end of the highest percentage of dialogue is added, and the worker specified by the added worker ID is assigned to the highest percentage of dialogue. The dialogue corpus creation program described in any one of the above.
(Appendix 9)
On the computer
The dialogue corpus creation program according to Appendix 8, wherein when a plurality of the dialogues having the highest ratio exist, the dialogue having the largest number of occurrences of the worker ID extracted is selected from the plurality of dialogues.
(Appendix 10)
On the computer
When a plurality of the highest ratio dialogues exist and the number of occurrences of the extracted worker IDs is the same, one dialogue is randomly selected from the plurality of dialogues.
The dialogue corpus creation program described in Appendix 8 characterized by the above.
(Appendix 11)
From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. Take out for each utterance
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on, select the dialogue to which the worker who creates the utterance data is assigned, and
A method of creating a dialogue corpus in which a computer performs a process of obtaining dialogue data in which the dialogue is completed by the plurality of workers.
(Appendix 12)
From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. The worker ID extraction section that retrieves each utterance,
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. A selection unit that selects the dialogue to which a worker who creates the utterance data is assigned according to a worker allocation procedure based on the above, and a utterance creation unit that causes the plurality of workers to create the utterance data and collects the created utterance data. Information processing device with.

3 作業者端末
3a 対話参加要求
3b 対話タスク提示
6 利用者端末
6a 対話データ取得要求
6b スコア付き対話データ
7 利用者
9 作業者
41 作業者リスト
42 対話タスクテーブル
43 発話テーブル
44 発話データDB
45 作業者スコアテーブル
50 初期化部
51 作業者登録部
52 作業者割当部
53 対話タスク選択部
54 対話タスク生成部
55 発話作成部
56 発話情報更新部
57 対話データ取出部
58 作業者スコア算出部
59 対話スコア算出部
60 ユーザI/F
100 サーバ装置
3 Worker terminal 3a Dialogue participation request 3b Dialogue task presentation 6 User terminal 6a Dialogue data acquisition request 6b Dialogue data with score 7 User 9 Worker 41 Worker list 42 Dialogue task table 43 Speech table 44 Speech data DB
45 Worker score table 50 Initialization unit 51 Worker registration unit 52 Worker allocation unit 53 Dialogue task selection unit 54 Dialogue task generation unit 55 Speaking creation unit 56 Speaking information update unit 57 Dialogue data extraction unit 58 Worker score calculation unit 59 Dialogue score calculation unit 60 User I / F
100 server device

Claims (6)

2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から、1発話ごとに取り出し、
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択し、
前記複数の作業者により前記対話を完成させた対話データを得る
処理をコンピュータに実行させる対話コーパス作成プログラム。
From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. Take out for each utterance
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on, select the dialogue to which the worker who creates the utterance data is assigned, and
A dialogue corpus creation program that causes a computer to execute a process of obtaining dialogue data that completes the dialogue by the plurality of workers.
前記対話を割り当てた作業者の作業者端末に、該対話の対話情報の表示と、該対話情報で示される直前の発話の内容が不適切である場合のチェックと、前記発話データの入力領域とを有する作成画面を表示させ、
前記作業者端末から、少なくとも前記発話データと、前記不適切のチェック有無とを受信すると、受信した該発話データを、前記対話の進行に従って親子関係を持つ木構造で管理し、前記不適切のチェック有りの場合、前記受信した発話データを、親の発話データから枝分かれさせて直前の発話データと兄弟関係として前記記憶部に記録し、
直後の発話データと共に受信した前記不適切のチェックの有無に応じて、前記直前の発話データの不適切さを判定する
処理を前記コンピュータに実行させる請求項1記載の対話コーパス作成プログラム。
Displaying the dialogue information of the dialogue on the worker terminal of the worker to which the dialogue is assigned, checking when the content of the utterance immediately before being indicated by the dialogue information is inappropriate, and the input area of the utterance data. Display the creation screen with
When at least the utterance data and the presence / absence of the inappropriate check are received from the worker terminal, the received utterance data is managed by a tree structure having a parent-child relationship according to the progress of the dialogue, and the inappropriate check is performed. If there is, the received utterance data is branched from the parent's utterance data and recorded in the storage unit as a sibling relationship with the immediately preceding utterance data.
The interactive corpus creation program according to claim 1, wherein the computer executes a process of determining the inappropriateness of the immediately preceding utterance data according to the presence or absence of the inappropriateness check received together with the immediately preceding utterance data.
前記木構造では、受信した前記発話データに対して、支持数を付与し、
前記直前の発話データに対して兄弟関係の別の発話データが存在する場合、受信した前記発話データと共に受信した前記不適切のチェックの有無に応じて、該直前の発話データの前記支持数を増減する
処理を前記コンピュータに実行させる請求項2記載の対話コーパス作成プログラム。
In the tree structure, a support number is given to the received utterance data, and the support number is given.
When another utterance data having a sibling relationship exists with respect to the immediately preceding utterance data, the number of supports of the immediately preceding utterance data is increased or decreased depending on the presence or absence of the inappropriate check received together with the received utterance data. The interactive corpus creation program according to claim 2, wherein the computer executes the processing to be performed.
前記支持数が増減した発話データと、該発話データの兄弟関係の発話データとに対して、前記支持数の合計に対する該発話データそれぞれの支持数の割合により、発話スコアを算出し前記記憶部に記憶する
処理を前記コンピュータに実行させる請求項3記載の対話コーパス作成プログラム。
The utterance score is calculated from the utterance data in which the number of support increases or decreases and the utterance data of the sibling relationship of the utterance data, and the ratio of the number of support of each of the utterance data to the total number of support is calculated and stored in the storage unit. The interactive corpus creation program according to claim 3, wherein the computer executes a memorizing process.
2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から、1発話ごとに取り出し、
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択し、
前記複数の作業者により前記対話を完成させた対話データを得る
処理をコンピュータが行う対話コーパス作成方法。
From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. Take out for each utterance
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on, select the dialogue to which the worker who creates the utterance data is assigned, and
A method of creating a dialogue corpus in which a computer performs a process of obtaining dialogue data in which the dialogue is completed by the plurality of workers.
2者の対話に係る対話情報に基づいて1発話を表わす発話データを作成する作業者の作業者IDを、複数の作業者の作業者IDを該対話へ参加可能な順に記憶した記憶部から、1発話ごとに取り出す作業者ID取出部と、
前記記憶部で管理される、複数の対話それぞれ毎に時系列に該対話に参加した作業者の作業者IDの記録を参照して、取り出した前記作業者IDの作業者の過去の参加状況に基づく作業者割当手順に従って、前記発話データを作成する作業者を割り当てる該対話を選択する選択部と
前記複数の作業者により前記発話データを作成させ、作成された発話データを収集する発話作成部と
を有する情報処理装置。
From the storage unit that stores the worker IDs of the workers who create utterance data representing one utterance based on the dialogue information related to the dialogue between the two parties in the order in which the worker IDs of a plurality of workers can participate in the dialogue. The worker ID extraction section that retrieves each utterance,
With reference to the record of the worker ID of the worker who participated in the dialogue in chronological order for each of the plurality of dialogues managed by the storage unit, the past participation status of the worker with the extracted worker ID can be obtained. According to the worker allocation procedure based on the above, the selection unit that selects the dialogue to which the worker who creates the utterance data is assigned, and the utterance creation unit that causes the plurality of workers to create the utterance data and collects the created utterance data. Information processing device with.
JP2017040681A 2017-03-03 2017-03-03 Dialogue corpus creation program, dialogue corpus creation method, and information processing device Active JP6760138B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017040681A JP6760138B2 (en) 2017-03-03 2017-03-03 Dialogue corpus creation program, dialogue corpus creation method, and information processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017040681A JP6760138B2 (en) 2017-03-03 2017-03-03 Dialogue corpus creation program, dialogue corpus creation method, and information processing device

Publications (2)

Publication Number Publication Date
JP2018146720A JP2018146720A (en) 2018-09-20
JP6760138B2 true JP6760138B2 (en) 2020-09-23

Family

ID=63588808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017040681A Active JP6760138B2 (en) 2017-03-03 2017-03-03 Dialogue corpus creation program, dialogue corpus creation method, and information processing device

Country Status (1)

Country Link
JP (1) JP6760138B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2024031394A (en) * 2022-08-26 2024-03-07 日本電信電話株式会社 Analysis support method, analysis support device and program

Also Published As

Publication number Publication date
JP2018146720A (en) 2018-09-20

Similar Documents

Publication Publication Date Title
US11295221B2 (en) Learning user preferences in a conversational system
JP7401619B2 (en) conversation business tools
CN108629549A (en) A kind of schedule processing method and processing device
JP2018028939A (en) Classification support device, classification support method, and classification support program
WO2023112745A1 (en) Information processing method, information processing device and information processing program
CN117971661A (en) Large model testing method, device, electronic equipment and storage medium
JP6760138B2 (en) Dialogue corpus creation program, dialogue corpus creation method, and information processing device
CN117670367A (en) Complaint work order processing method, complaint work order processing device, terminal equipment and storage medium
JP5267269B2 (en) Conference management apparatus and method
JP5338601B2 (en) Conference facilitator selection method, apparatus and program
JP4824043B2 (en) Knowledge structure construction method of natural language dialogue agent, automatic response creation method and automatic response creation apparatus using knowledge structure
JP7084775B2 (en) Information processing equipment and programs
JP6502564B1 (en) Personnel management system, personnel management program and personnel management method
US11318373B2 (en) Natural speech data generation systems and methods
JP7677328B2 (en) Information processing device and information processing method
JP6639431B2 (en) Item judgment device, summary sentence display device, task judgment method, summary sentence display method, and program
EP3663940A1 (en) Information processing device and information processing method
JP2014134859A (en) Device, method, and program handling message
JP7436012B2 (en) Knowledge sharing support device, knowledge sharing support method, program, and recording medium
JP5488200B2 (en) Dialog apparatus, dialog method, and program
JP7654197B1 (en) Question and answer generation system, method, and program
JP2022059725A (en) Information processor, information processing system, and program
CN117238293B (en) Hotel travel interaction method and device based on large language model and computing equipment
CN117311963B (en) Interactive control method, device, equipment and storage medium
US20240362950A1 (en) Information processing method, information processing system, and recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200804

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200817

R150 Certificate of patent or registration of utility model

Ref document number: 6760138

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150