JP7500057B2 - Communication management device and method - Google Patents
Communication management device and method Download PDFInfo
- Publication number
- JP7500057B2 JP7500057B2 JP2020112961A JP2020112961A JP7500057B2 JP 7500057 B2 JP7500057 B2 JP 7500057B2 JP 2020112961 A JP2020112961 A JP 2020112961A JP 2020112961 A JP2020112961 A JP 2020112961A JP 7500057 B2 JP7500057 B2 JP 7500057B2
- Authority
- JP
- Japan
- Prior art keywords
- communication
- agent
- speech
- text
- mobile communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 title claims description 244
- 238000000034 method Methods 0.000 title claims description 22
- 238000007726 management method Methods 0.000 claims description 124
- 238000001514 detection method Methods 0.000 claims description 80
- 238000012545 processing Methods 0.000 claims description 45
- 238000010295 mobile communication Methods 0.000 claims description 43
- 238000012544 monitoring process Methods 0.000 claims 1
- 239000003795 chemical substances by application Substances 0.000 description 154
- 230000006870 function Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 25
- 230000015572 biosynthetic process Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Computer And Data Communications (AREA)
- Telephonic Communication Services (AREA)
Description
本発明の実施形態は、音声及びテキストを使用したコミュニケーション(認識共有、意思疎通など)支援技術に関する。 An embodiment of the present invention relates to technology that supports communication (sharing awareness, communicating, etc.) using voice and text.
音声コミュニケーションの一例として、トランシーバ(transceiver)がある。トランシーバは、無線電波の送信機能と受信機能を兼ね備えた無線機であり、1人のユーザが複数人のユーザと通話(一方向又は双方向の情報伝達)を行うことができる。トランシーバの活用例は、工事現場やイベント会場、ホテルや旅館などの施設等で目にすることができる。また、タクシー無線もトランシーバ活用の一例として挙げることができる。 One example of voice communication is a transceiver. A transceiver is a wireless device that has both radio wave transmission and reception functions, allowing one user to talk to multiple users (one-way or two-way information transmission). Examples of transceivers in use can be seen at construction sites, event venues, hotels, inns, and other facilities. Another example of a transceiver in use is a taxi radio.
状態又は状況変化を伝達するエージェントを含むコミュニケーショングループを形成し、複数のユーザ間での情報伝達を支援するコミュニケーションシステムを提供することを目的とする。 The objective is to provide a communication system that forms a communication group including agents that communicate status or situation changes, and supports the communication of information between multiple users.
実施形態のコミュニケーションシステムは、複数の各ユーザがそれぞれ携帯する移動通信端末を通じて、ユーザの発話音声が他のユーザの移動通信端末に同報配信する。コミュニケーションシステムは、前記各移動通信端末が無線通信で接続するコミュニケーション管理装置と、監視対象の状態検出機器から出力される検出情報が入力され、前記コミュニケーション管理装置に接続するエージェント装置と、を含む。前記コミュニケーション管理装置は、移動通信端末から受信した発話音声データを他の複数の移動通信端末それぞれに同報配信する第1制御部と、受信した発話音声データを音声認識処理して得られる発話音声認識結果を、ユーザ同士のコミュニケーション履歴として時系列に蓄積するとともに、前記各移動通信端末において前記コミュニケーション履歴が同期して表示されるようにテキスト配信制御を行う第2制御部と、を有するコミュニケーション制御部を備える。前記エージェント装置は、前記検出情報に基づくエージェント発話テキストを生成し、前記コミュニケーション管理装置に送信する発話テキスト送信部を備える。そして、前記コミュニケーション制御部は、合成音声処理によって生成された前記エージェント発話テキストの合成音声データを、複数の前記移動通信端末それぞれに同報配信するとともに、受信した前記エージェント発話テキストを、ユーザ同士の前記コミュニケーション履歴に含ませて時系列に蓄積し、前記各移動通信端末へのテキスト配信制御を行う。 In the communication system of the embodiment, a user's speech is broadcast to the mobile communication terminals of other users through a mobile communication terminal carried by each of the users. The communication system includes a communication management device to which each of the mobile communication terminals is connected by wireless communication, and an agent device to which detection information output from a state detection device to be monitored is input and connected to the communication management device. The communication management device includes a communication control unit having a first control unit that broadcasts speech data received from the mobile communication terminal to each of the other multiple mobile communication terminals, and a second control unit that accumulates the speech recognition results obtained by speech recognition processing of the received speech data in chronological order as a communication history between users and controls text distribution so that the communication history is displayed synchronously on each of the mobile communication terminals. The agent device includes a speech text transmission unit that generates an agent speech text based on the detection information and transmits it to the communication management device. The communication control unit then broadcasts the synthetic voice data of the agent utterance text generated by the synthetic voice processing to each of the multiple mobile communication terminals, and stores the received agent utterance text in chronological order by including it in the communication history between users, and controls the text distribution to each of the mobile communication terminals.
(第1実施形態)
図1から図7は、第1実施形態を説明するための図である。図1は、本実施形態に係るコミュニケーションシステムのネットワーク構成図である。コミュニケーションシステムは、コミュニケーション管理装置(以下、管理装置と称する)100を中心に、音声及びテキストを用いた情報伝達支援機能を提供する。以下では、施設管理を一例に、コミュニケーションシステムを適用した態様について説明する。
First Embodiment
1 to 7 are diagrams for explaining the first embodiment. FIG. 1 is a network configuration diagram of a communication system according to this embodiment. The communication system provides an information transmission support function using voice and text, centered around a communication management device (hereinafter referred to as a management device) 100. Below, an aspect in which the communication system is applied will be described, taking facility management as an example.
管理装置100は、複数の各ユーザがそれぞれ携帯するユーザ端末(移動通信端末)500が無線通信で接続し、ユーザの発話音声を他のユーザ端末500に同報配信する。
The management device 100 is connected via wireless communication to user terminals (mobile communication terminals) 500 carried by each of a number of users, and broadcasts the user's speech to the
ユーザ端末500は、例えば、スマートフォンなどの多機能携帯電話機やPDA(Personal Digital Assistant)、タブレット型端末などの持ち運び可能な携帯端末(モバイル端末)である。ユーザ端末500は、通信機能、演算機能及び入力機能を備え、IP(Internet protocol)網又は移動通信回線網(Mobile communication network)を通じて無線通信で管理装置100と接続し、データ通信を行う。
The
ユーザの発話音声が他の複数のユーザ端末500に同報配信される範囲(又は後述するコミュニケーション履歴が同期して表示される範囲)は、コミュニケーショングループとして設定され、対象ユーザ(現場ユーザ)のユーザ端末500それぞれが登録される。そして、図1に示すように、本実施形態では、施設管理における監視対象の状態検出機器(センサ機器1)から出力される検出情報が入力され、無線通信又は有線通信で管理装置100に接続するエージェント装置300が、複数のユーザが登録されるコミュニケーショングループの一員(エージェント)として登録される。
The range in which the user's speech is broadcast to multiple other user terminals 500 (or the range in which the communication history, described later, is displayed synchronously) is set as a communication group, and each of the
監視対象が、温泉である場合、温泉の状態とは、例えば、温度である。この場合、状態検出機器は、温度センサ1等の計測機器である。温度センサ1は、検出情報として検出温度をエージェント装置300に出力する。エージェント装置300は、検出温度が入力されると、検出温度に基づくエージェント発話テキストを生成して管理装置100に送信する。つまり、エージェント装置300は、ユーザ端末500を携帯するユーザと同様の、コミュニケーショングループ内の一員として、検出情報に基づく発話を行う機器であり、状態検出機器に代わって発話する発話代理者として位置付けられる。
When the object to be monitored is a hot spring, the state of the hot spring is, for example, the temperature. In this case, the state detection device is a measuring device such as a temperature sensor 1. The temperature sensor 1 outputs the detected temperature to the agent device 300 as detection information. When the detected temperature is input, the agent device 300 generates an agent utterance text based on the detected temperature and transmits it to the management device 100. In other words, the agent device 300 is a device that makes utterances based on the detection information as a member of a communication group, similar to the user who carries the
エージェント装置300は、デスクトップ型コンピュータやタブレット型コンピュータ、ラップトップ型コンピュータである。エージェント装置300は、IP網又は移動通信回線網を通じ、無線通信又は有線通信でのデータ通信機能及び演算機能(CPU等)を備えている。また、エージェント装置300は、ディスプレイ装置(又はタッチパネル方式の表示装置)及び文字入力手段を備えるように構成することもできる。また、エージェント装置300は、本実施形態の各機能を備えた専用機器であってもよい。 The agent device 300 is a desktop computer, tablet computer, or laptop computer. The agent device 300 has a data communication function for wireless or wired communication via an IP network or a mobile communication line network, and a calculation function (CPU, etc.). The agent device 300 can also be configured to have a display device (or a touch panel type display device) and character input means. The agent device 300 may also be a dedicated device equipped with each of the functions of this embodiment.
本実施形態のコミュニケーションシステムは、複数の各ユーザがハンズフリーで対話を行うことができることを前提とした、認識共有や意思疎通のための情報伝達を支援する。それとともに、施設管理における監視対象の状態又は状況変化を伝達するエージェントを含むコミュニケーショングループを形成し、エージェントの発話機能によって今まで人手で行っていた監視対象の状態又は状況変化の情報取得及び伝達の効率化を支援する。 The communication system of this embodiment supports the transmission of information for sharing awareness and communicating, on the premise that multiple users can converse hands-free. At the same time, a communication group is formed including an agent that communicates the status or changes in situation of monitored objects in facility management, and the agent's speech function helps to improve the efficiency of obtaining and transmitting information on the status or changes in situation of monitored objects, which was previously done manually.
特に、施設の設備管理は、人的な労働力で支えられており、設備機器を操作・制御する作業が必ず存在する。このような設備機器の操作・制御は、設備機器の状態や状況を継続的に確認して行う必要があり、そのためには、ユーザが、設備機器を訪れて状況を確認したり、状態検出機器の設置場所に訪れて検出情報を確認したりしなければならない。このため、多大な労力が必要であった。一方で、近年は、IoT(Internetof Things)化によるセンサ機器と、設備機器の操作や制御等との連携が注目されているが、コスト面の課題等により、上述のように、人的な労力により支えられているのが実情である。 In particular, facility equipment management is supported by human labor, and there is always work to operate and control equipment. Such equipment operation and control requires continuous checking of the equipment's status and condition, which requires the user to visit the equipment to check its status or to visit the installation site of the status detection device to check the detection information. This requires a great deal of labor. Meanwhile, in recent years, attention has been focused on the linkage between sensor devices and the operation and control of equipment through the Internet of Things (IoT), but due to cost issues and other factors, as mentioned above, the reality is that this is supported by human labor.
本実施形態では、設備機器の操作・制御を人手で行う際に、設備機器の状態や状況を把握するための検出情報を出力するセンサ機器等がユーザコミュニケーショングループの一員として検出情報に基づく発話を行う仕組みを導入して、ユーザの労力の軽減を実現する。これと共に、既設のセンサ機器等の状態検出機器に対し、検出情報を受信するエージェント装置300を設備管理の現場に設置するだけでユーザコミュニケーショングループに容易に参加することができるシンプルで低コストなシステム構成を実現する。 In this embodiment, when equipment is operated and controlled manually, a mechanism is introduced in which sensor devices, etc. that output detection information to grasp the state and situation of the equipment, make speech based on the detection information as a member of a user communication group, thereby reducing the labor of the user. At the same time, a simple and low-cost system configuration is realized in which existing sensor devices and other status detection devices can easily join a user communication group simply by installing an agent device 300 that receives detection information at the facility management site.
図2は、管理装置100、エージェント装置300、ユーザ端末500の各構成ブロック図である。
Figure 2 is a block diagram of the configuration of the management device 100, the agent device 300, and the
管理装置100は、制御装置110、記憶装置120及び通信装置130を含む。通信装置130は、複数の各ユーザ端末500との間の通信接続管理及びデータ通信制御を行い、同じ内容の発話音声及び発話テキストを複数の各ユーザ端末500に一斉に送る同報配信通信制御を行う。
The management device 100 includes a control device 110, a storage device 120, and a communication device 130. The communication device 130 manages communication connections and controls data communications between the
制御装置110は、ユーザ管理部111、コミュニケーション制御部112、音声認識部113及び音声合成部114を含んで構成されている。記憶装置120は、ユーザ情報121、グループ情報122、コミュニケーション履歴(コミュニケーションログ)情報123、音声認識辞書124、及び音声合成辞書125を含んで構成されている。
The control device 110 includes a
エージェント装置300は、管理対象の設備に設けられた状態検出装置(センサ機器1)と無線又は有線で接続され、通信部310を介して状態検出装置から出力される検出情報を受け付けるセンサ情報取得部320を備えている。また、制御部(判定部)330、発話テキスト送信部340、設定管理部350、及び記憶部360を備えている。
The agent device 300 is connected wirelessly or wired to a status detection device (sensor device 1) installed in the equipment to be managed, and includes a sensor
ユーザ端末500は、通信・通話部510、コミュニケーションApp制御部520、マイク530、スピーカー540、タッチパネル等の表示入力部550、及び記憶部560を含んで構成されている。なお、スピーカー540は、実際には、イヤホンやヘッドホン(有線又はワイヤレス)などで構成される。
The
図3は、各種情報の一例を示す図であり、ユーザ情報121は、本コミュニケーションシステムを利用するユーザ登録情報である。ユーザ管理部111は、所定の管理画面を通じて、ユーザID、ユーザ名、属性、グループを設定することができるように制御する。また、エージェント装置300もユーザ登録される。グループ情報122は、コミュニケーショングループを区画するグループ識別情報である。コミュニケーショングループID別に伝達情報の送受信及び同報配信を制御し、異なるコミュニケーショングループ間で情報が混在しないように制御される。ユーザ情報121において、グループ情報122に登録されたコミュニケーショングループを、各ユーザに紐付けることができる。
Figure 3 is a diagram showing an example of various information, where
本実施形態のユーザ管理部111は、後述する第1制御(発話音声データの同報配信)及び第2制御(エージェント発話テキストまたは/及びユーザの発話音声認識結果のテキスト同報配信)の対象となる、複数のユーザが登録されたコミュニケーショングループを設定する機能を提供しつつ、エージェント装置300をコミュニケーショングループに登録する機能を提供する。
The
なお、グループ分けについては、本実施形態のコミュニケーションシステムを導入する施設等に応じて施設を複数の部門に分割して管理することもできる。例えば、宿泊施設を一例に説明すると、ベルパーソン(荷物運び)、コンシェルジュ、ハウスキーピング(清掃)をそれぞれ異なるグループに設定し、客室管理をそれぞれのグループ毎に細分化したコミュニケーション環境を構築することもできる。他の観点として、役割的にコミュニケーションが不要なケースも考えられる。例えば、料理の配膳係と、ベルパーソン(荷物運び)は、直接コミュニケーションをとる必要がないのでグループを分けることができる。また、地理的にコミュニケーションが不要なケースも考えられ、例えば、A支店、B支店などが地理的に離れており、かつ頻繁にコミュニケーションをする必要がない場合などは、グループを分けることができる。 Regarding grouping, a facility can be divided into multiple departments for management depending on the facility in which the communication system of this embodiment is introduced. For example, in the case of an accommodation facility, bellpersons (luggage carriers), concierges, and housekeepers (cleaning) can each be set in different groups, and a communication environment can be created in which guest room management is subdivided for each group. From another perspective, there may be cases where communication is not required due to roles. For example, food servers and bellpersons (luggage carriers) can be separated into groups because they do not need to communicate directly. There may also be cases where communication is not required due to geographical reasons. For example, if branch A and branch B are geographically separated and there is no need for frequent communication, the groups can be separated.
したがって、エージェント装置300が登録されたコミュニケーショングループ、エージェント装置300が登録されていないコミュニケーショングループ、複数のエージェント装置300が登録されたコミュニケーショングループなど、様々なコミュニケーショングループを混在して設定することができる。施設内に管理対象の設備が複数存在する場合は、各設備別にエージェント装置300を個別に設置することができ、また、同じ設備であっても、状態検出機器が複数設置されている場合は、各状態検出機器に対してエージェント装置300をそれぞれ設置し、1つのコミュニケーショングループに登録することもできる。 Therefore, it is possible to set up a mixture of various communication groups, such as a communication group in which an agent device 300 is registered, a communication group in which an agent device 300 is not registered, and a communication group in which multiple agent devices 300 are registered. If there are multiple pieces of equipment to be managed within a facility, an agent device 300 can be installed separately for each piece of equipment. Also, if multiple status detection devices are installed in the same facility, an agent device 300 can be installed for each status detection device and registered in one communication group.
管理装置100のコミュニケーション制御部112は、第1制御部と第2制御部の各制御部として機能する。第1制御部は、ユーザ端末500から受信した発話音声データを他の複数のユーザ端末500それぞれに同報配信制御を行う。第2制御部は、受信した発話音声データを音声認識処理して得られる発話音声認識結果を、ユーザ同士のコミュニケーション履歴123として時系列に蓄積するとともに、各ユーザ端末500においてコミュニケーション履歴123が同期して表示されるようにテキスト配信制御を行う。
The
第1制御部としての機能は、発話音声データの同報配信である。発話音声データには、テキスト(例えば、エージェント発話テキスト)から音声合成処理によって人工的に生成された音声データと、ユーザが発声した音声データとが含まれる。音声合成部114は、音声合成辞書125を用いて、エージェント発話テキストの文字に対応する音声データを合成し、音声合成データを生成する。このとき、音声合成データを構成する音声データの素材は、任意である。
The function of the first control unit is to broadcast speech data. The speech data includes speech data artificially generated by speech synthesis processing from text (e.g., agent utterance text) and speech data uttered by the user. The
第2制御部としての機能は、エージェント発話テキスト及びユーザの発話音声認識結果のテキスト同報配信である。本実施形態では、ユーザ端末500において入力された音声及びユーザ端末500において再生される音声は、すべてテキスト化されてコミュニケーション履歴123に時系列に蓄積され、各ユーザ端末500において同期して表示されるように制御される。音声認識部113は、音声認識辞書124を用いて音声認識処理を行い発話音声認識結果としてテキストデータを出力する。音声認識処理については公知の技術を適用することができる。
The function of the second control unit is to broadcast the agent's spoken text and the user's spoken voice recognition results. In this embodiment, all voices input to the
そして、エージェント装置300は、状態検出機器から出力される検出情報に基づくエージェント発話テキストを生成し、管理装置100に送信する発話テキスト送信部340を備えている。管理装置100のコミュニケーション制御部112は、第1制御の機能として、発話テキスト送信部340から受信したエージェント発話テキストに対して合成音声処理を行ってエージェント発話テキストの合成音声データを生成して、複数のユーザ端末500それぞれに同報配信する。それとともに、第2制御の機能として、発話テキスト送信部340から受信したエージェント発話テキストを、ユーザ同士のコミュニケーション履歴123に含ませて時系列に蓄積し、各ユーザ端末500へのテキスト配信制御を行う。
The agent device 300 is equipped with a speech
なお、コミュニケーション履歴情報123は、各ユーザの発話内容とエージェント装置300のエージェント発話テキストとが時間情報と共に、テキストベースで時系列に蓄積されたログ情報である。各テキストに対応する音声データは、音声ファイルとして所定の記憶領域に格納しておくことができ、例えば、コミュニケーション履歴123には、音声ファイルの格納場所を記録する。コミュニケーション履歴情報123は、コミュニケーショングループ別にそれぞれ生成され、蓄積される。
The
図4は、各ユーザ端末500で表示されるコミュニケーション履歴123の一例を示す図である。ユーザ端末500それぞれは、管理装置100からリアルタイムに又は所定のタイミングでコミュニケーション履歴123を受信し、複数のユーザ間で表示同期が取られ、時系列に過去のコミュニケーションログを参照することができる。
Figure 4 is a diagram showing an example of the
なお、表示欄Dにおいて、合成音声データに対応するテキストには、音声マークMを表示したり、発話者自身の発話テキストには、表示欄DにおいてマイクマークHを表示したりすることができる。 In addition, in the display field D, a voice mark M can be displayed for text that corresponds to the synthetic voice data, and a microphone mark H can be displayed for the speaker's own spoken text in the display field D.
図4の例のように、各ユーザ端末500は、自分の発話内容及び自分以外の他のユーザの発話内容と共に、エージェント装置300の発話内容が表示欄Dに時系列に表示され、管理装置100に蓄積されるコミュニケーション履歴123がログ情報として共有される。
As shown in the example of FIG. 4, each
図5は、エージェント装置300で使用される設定管理情報の一例を示す図である。エージェント装置300が発話を行う条件及び発話テキストの内容が設定管理情報として登録されている。制御部330は、設定管理情報において設定された判定条件に基づいて、検出情報が判定条件を満たすか否かを判断する判定部として機能する。
Figure 5 is a diagram showing an example of setting management information used by the agent device 300. The conditions under which the agent device 300 will speak and the contents of the spoken text are registered as setting management information. The
図5の例では、「設定1」において、条件:温度が36度未満、エージェント発話テキスト「温度が36度を下回りました」が設定されている。「設定2」では、条件:温度が42度以上、エージェント発話テキスト「温度が42度を超えました」が設定されている。制御部330は、センサ情報取得部320によって任意の時間間隔で取得される検出情報を用いて、設定管理情報に設定された判定条件とマッチングし、判定条件を満たすか否かを判定する。
In the example of FIG. 5, in "setting 1," the condition is set as follows: temperature is less than 36 degrees, and the agent utterance text is "The temperature has fallen below 36 degrees." In "setting 2," the condition is set as follows: temperature is 42 degrees or more, and the agent utterance text is "The temperature has exceeded 42 degrees." The
発話テキスト送信部340は、制御部330によって判定条件を満たすと判定された場合、設定管理情報の発話テキストを抽出してエージェント発話テキストデータを生成し、管理装置100に送信する。
When the
設定管理情報は、エージェント装置300が備える管理情報登録画面を通じて入力したり、互いに異なる判定条件及び発話テキストの複数のペアが記録された設定管理情報ファイルを他のコンピュータ装置で作成し、エージェント装置300に記憶させたりすることができる。 The setting management information can be input through a management information registration screen provided on the agent device 300, or a setting management information file in which multiple pairs of different judgment conditions and speech texts are recorded can be created on another computer device and stored in the agent device 300.
図6は、本実施形態のコミュニケーションシステムの処理フローを示す図である。 Figure 6 shows the processing flow of the communication system of this embodiment.
各ユーザは、ユーザ端末500において、コミュニケーションApp制御部520を起動し、コミュニケーションApp制御部520が管理装置100との接続処理を行う。そして、所定のログイン画面から自分のユーザID及びパスワードを入力して管理装置100にログインする。ログイン認証処理は、ユーザ管理部111によって遂行される。ログイン後の各ユーザ端末500は、任意のタイミングで又は所定の時間間隔で、管理装置100との間で情報取得処理を行う。
Each user starts the communication
ユーザAが発話すると、コミュニケーションApp制御部520は、発話音声を集音し、発話音声データを管理装置100に送信する(S501a)。管理装置100の音声認識部113は、受信した発話音声データを音声認識処理し(S101)、発話内容の音声認識結果を出力する。コミュニケーション制御部112は、音声認識結果をコミュニケーション履歴123に記憶し、発話音声データを記憶装置120に記憶する(S102)。
When user A speaks, the communication
コミュニケーション制御部112は、発話したユーザA以外の他のユーザ端末500それぞれにユーザAの発話音声データを同報送信する。また、コミュニケーション履歴123に記憶したユーザAの発話内容(テキスト)を、表示同期のために、ユーザA自身を含むコミュニケーショングループ内の各ユーザ端末500に送信する(S103)。
The
ユーザA以外の各ユーザ端末500のコミュニケーションApp制御部520は、受信した発話音声データの自動再生処理を行い、発話音声出力を行いつつ(S502b,S502c)、音声出力された発話音声に対応するテキスト形式の発話内容を表示欄Dに表示させる。
The communication
続いて、エージェント装置300は、状態検出機器から出力される検出情報を監視し、検出情報が判定条件を満たすと判別された場合、発話テキスト送信部340は、判定結果に基づいてエージェント発話テキストを生成し、管理装置100に送信する(S301)。
Next, the agent device 300 monitors the detection information output from the status detection device, and if it is determined that the detection information satisfies the judgment condition, the speech
このとき、エージェント発話テキストには、センサ値等の検出情報が含まれていてもいなくてもよい。つまり、判定条件を満たす状態であることを通知する内容であればよく、例えば、「温度が下がってきました」、「温度が高すぎます」などのセンサ値自体を含まない発話テキストであってもよい。また、「温度が36度を下回りました。現在の温度は、35.1度です」のように、センサ値を含むように、エージェント発話テキストを生成することもできる。実測値を含むことで、緊急対応しなければならないのか、対応までに時間的猶予があるのかなどをユーザに知らせることができる。 At this time, the agent utterance text may or may not include detection information such as sensor values. In other words, it is sufficient if the content notifies that the state satisfies the judgment condition, and it may be utterance text that does not include the sensor value itself, such as "The temperature is dropping" or "The temperature is too high." In addition, the agent utterance text can be generated to include the sensor value, such as "The temperature has dropped below 36 degrees. The current temperature is 35.1 degrees." By including the actual measured value, it is possible to inform the user whether emergency action is required or whether there is time to respond.
管理装置100のコミュニケーション制御部112は、受信したエージェント発話テキストをコミュニケーション履歴123に記憶し(S104)、音声合成部114は、エージェント発話テキストに対応する合成音声を生成し(S105)、生成した合成音声データを記憶装置120に記憶する。
The
コミュニケーション制御部112は、コミュニケーショングループに登録されたすべてのユーザ端末500それぞれにエージェント装置300の発話音声データを同報送信する。また、コミュニケーション履歴123に記憶したエージェント発話テキストを、表示同期のために、コミュニケーショングループ内の各ユーザ端末500に送信する(S106)。
The
各ユーザ端末500のコミュニケーションApp制御部520は、受信したエージェントの発話音声データの自動再生処理を行い、発話音声出力を行いつつ(S503a,S503b,S503c)、発話音声に対応するテキスト形式のエージェント発話内容を表示欄Dに表示させる。
The communication
図7は、本実施形態のコミュニケーションシステムが適用された第1事例に基づく処理フローを示す図である。 Figure 7 shows the processing flow based on the first example in which the communication system of this embodiment is applied.
図7に示すように、エージェント装置300のセンサ情報取得部320は、任意のタイミング又は所定の時間間隔で、状態検出機器(センサ機器1)が出力する温泉の温度情報を取得する(S3001)。制御部330は、温泉情報が取得される度に、温泉の温度が設定管理情報として登録された判定条件を満たすか否かの判定処理を行う(S3002)。
As shown in FIG. 7, the sensor
温泉の温度が、判定条件を満たす温度である場合(S3003のYES)、発話テキスト送信部340は、設定管理情報に設定されている発話テキストを抽出し、エージェント発話テキストデータ「温度が36度を下回りました」を生成する(S3004)。発話テキスト送信部340は、生成したエージェント発話テキストを管理装置100に送信する(S3005)。
If the temperature of the hot spring meets the judgment condition (YES in S3003), the speech
管理装置100の音声合成部114は、受信したエージェント発話テキストの合成音声データを生成する(S1001)。また、管理装置100のコミュニケーション制御部112は、エージェント装置300から受信したエージェント発話テキストを、ユーザ同士のコミュニケーション履歴123に含ませて時系列に記憶する(S1002)。
The
コミュニケーション制御部112は、表示同期のため、テキスト形式のエージェント発話テキストを、ユーザ端末500に送信すると共に(S1003)、エージェント発話内容の合成音声データを複数の各ユーザ端末500に同報配信する(S1004)。
To synchronize the display, the
各ユーザ端末500のコミュニケーションApp制御部520は、テキスト形式のエージェント発話内容を表示欄Dに表示させ、かつ合成音声データの自動再生処理を行い、音声出力を行う。このとき、各ユーザ端末500の表示欄Dにおいて、同じエージェント発話内容が同期して表示され、かつエージェント発話内容「温度が36度を下回りました」の音声出力がそれぞれ行われる。
The communication
続いて、エージェント発話内容を聞いたユーザCが、「ちょっと手が離せません」と発話すると、コミュニケーションApp制御部520は、発話音声を集音し、発話音声データを管理装置100に送信する。管理装置100の音声認識部113は、受信した発話音声データを音声認識処理し(1005)、発話内容の音声認識結果を出力する。コミュニケーション制御部112は、音声認識結果をコミュニケーション履歴123に記憶し、発話音声データを記憶装置120に記憶する(S1006)。
Next, when User C, having heard the agent's speech, says, "I can't take my hands off the phone," the communication
コミュニケーション制御部112は、発話したユーザC以外の他のユーザ端末500それぞれにユーザCの発話音声データを同報送信する(1008)。また、コミュニケーション履歴123に記憶したユーザCの発話内容「ちょっと手が離せません」を、表示同期のために、ユーザC自身を含むコミュニケーショングループ内の各ユーザ端末500に送信する(S1007)。
The
各ユーザ端末500のコミュニケーションApp制御部520は、受信した発話音声データの自動再生処理を行い、「ちょっと手が離せません」の発話音声出力を行い、音声出力された発話音声に対応するテキスト形式の発話内容「ちょっと手が離せません」を表示欄Dに表示させる。なお、発話したユーザCのユーザ端末500には、自分が発話した発話音声データが送信されないように管理装置100側で制御される。
The communication
ユーザCの発言を聞いたユーザBは、「隣に居るので私が対応します」と発話すると、コミュニケーションApp制御部520は、発話音声を集音し、発話音声データを管理装置100に送信する。管理装置100の音声認識部113は、受信した発話音声データを音声認識処理し(1009)、発話内容の音声認識結果を出力する。コミュニケーション制御部112は、音声認識結果をコミュニケーション履歴123に記憶し、発話音声データを記憶装置120に記憶する(S1010)。
When User B, who has heard User C's statement, says, "I'm right next to you, so I'll handle it," the communication
コミュニケーション制御部112は、発話したユーザB以外の他のユーザ端末500それぞれにユーザBの発話音声データを同報送信する(1012)。また、コミュニケーション履歴123に記憶したユーザBの発話内容「隣に居るので私が対応します」を、表示同期のために、ユーザB自身を含むコミュニケーショングループ内の各ユーザ端末500に送信する(S1011)。
The
各ユーザ端末500のコミュニケーションApp制御部520は、受信した発話音声データの自動再生処理を行い、「隣に居るので私が対応します」の発話音声出力を行い、音声出力された発話音声に対応するテキスト形式の発話内容「隣に居るので私が対応します」を表示欄Dに表示させる。このときも、発話したユーザBのユーザ端末500には、自分が発話した発話音声データが送信されないように管理装置100側で制御される。
The communication
(第2実施形態)
図8から図11は、第2実施形態を説明するための図である。図8は、本実施形態に係るコミュニケーションシステムのネットワーク構成図である。本実施形態のコミュニケーションシステムは、上記第1実施形態に対し、ユーザ端末500において発話されたユーザからの問い掛けに応じてエージェント機能を提供する態様である。なお、上記第1実施形態と同様の構成については、同符号を付して説明を省略する。
Second Embodiment
8 to 11 are diagrams for explaining the second embodiment. Fig. 8 is a network configuration diagram of a communication system according to this embodiment. In contrast to the first embodiment, the communication system of this embodiment provides an agent function in response to a question from a user spoken at a
図9は、本実施形態のコミュニケーション管理装置100、エージェント装置300、ユーザ端末500の各構成ブロック図である。第1実施形態の図2に対し、エージェント装置300の構成が一部変更・追加され、ユーザ端末500でのユーザの発話をトリガーに、エージェント装置300が、検出情報に基づくエージェント発話テキストを生成して管理装置100に送信する。
Figure 9 is a block diagram of the communication management device 100, agent device 300, and
具体的には、管理装置100のコミュニケーション制御部111は、ユーザ端末500から受信した発話音声の音声認識結果をエージェント装置300に送信する機能を備える。エージェント装置300は、ユーザの発話音声の音声認識結果を受信するテキスト受信部370と、テキスト形式の音声認識結果を解析するテキスト解析部380と、テキスト解析部380の解析結果に基づいて、エージェント発話テキストを提供するか否かを判定する制御部(情報提供部)330Aと、を備える。発話テキスト送信部340は、制御部330Aの判定結果に基づいて、エージェント発話テキストを生成し、管理装置100に送信する。
Specifically, the
図10は、本実施形態のコミュニケーションシステムの第2事例に基づく処理フローを示す図である。 Figure 10 shows the processing flow based on the second example of the communication system of this embodiment.
図10に示すように、ユーザCが、「今のB温泉の温度を教えて」と発話すると、コミュニケーションApp制御部520は、発話音声を集音し、発話音声データを管理装置100に送信する。管理装置100の音声認識部113は、受信した発話音声データを音声認識処理し(1005)、発話内容の音声認識結果を出力する。コミュニケーション制御部112は、音声認識結果をコミュニケーション履歴123に記憶し、発話音声データを記憶装置120に記憶する(S1006)。
As shown in FIG. 10, when user C says, "Tell me the current temperature of hot spring B," the communication
コミュニケーション制御部112は、発話したユーザC以外の他のユーザ端末500それぞれにユーザCの発話音声データを同報送信する(1008)。一方、コミュニケーション履歴123に記憶したユーザCの発話内容「今のB温泉の温度を教えて」を、表示同期のために、ユーザC自身を含むコミュニケーショングループ内の各ユーザ端末500に送信するとともに、エージェント装置300にもテキスト形式の発話内容「今のB温泉の温度を教えて」を送信する(S1007A)。
The
エージェント装置300は、テキスト受信部370を介して「今のB温泉の温度を教えて」の発話テキストを受信する。受信した発話テキストは、テキスト解析部380によって解析され、例えば、周知の形態素解析を行って、キーワードを抽出する(S3101)。例えば、「B温泉」、「温度」、「教えて」の各キーワードを抽出する。
The agent device 300 receives the spoken text "Tell me the current temperature of hot spring B" via the
エージェント装置300の制御部(情報提供部)330Aは、テキスト解析部380の解析結果であるキーワードを用いて、情報提供判定処理を行う(3102)。例えば、設定管理情報として、エージェント装置300の管理対象の名称(B温泉)、エージェント装置300に接続される状態検出機器によって検出される検出属性(温度)、質問文例示情報(「教えて」、「は?」、「いくつ」、「知りたい」)などを登録しておく。なお、本実施形態においても、これらの設定管理情報の登録処理は、設定管理部350を通じて行われる。
The control unit (information provision unit) 330A of the agent device 300 performs information provision determination processing using keywords that are the analysis results of the text analysis unit 380 (3102). For example, as setting management information, the name of the object managed by the agent device 300 (Hot Spring B), detection attributes (temperature) detected by a status detection device connected to the agent device 300, and example question sentence information ("Tell me," "Huh?", "How many," "I want to know") are registered. Note that in this embodiment as well, the registration processing of this setting management information is performed through the
制御部(情報提供部)330Aは、ユーザCの音声認識結果に、状態検出機器又は検出情報に対する問い掛けに関するキーワードが含まれているか否かを判定し、含まれていると判定された場合に(S3103のYES)、センサ情報取得部320を通じて検出情報を取得する(3001)。上記例示の場合、ユーザCの音声認識結果に、「B温泉」が含まれており、かつ検出属性の「温度」と、質問文「教えて」が入っているので、制御部330Aは、情報提供判定結果として「可」を出力する。
The control unit (information provision unit) 330A determines whether the voice recognition result of user C includes keywords related to the state detection device or a question about the detection information, and if it is determined that the keywords are included (YES in S3103), it acquires the detection information through the sensor information acquisition unit 320 (3001). In the above example, the voice recognition result of user C includes "B Hot Spring", and also includes the detection attribute "temperature" and the question "tell me", so the
なお、上記説明では、複数のエージェント装置300がコミュニケーショングループに登録されていることを想定し、各エージェント装置300が自身に対する問い掛けかを判断するために、エージェント装置300の管理対象の名称が含まれているかを判定要素として取り入れている。しかしながら、例えば、コミュニケーショングループに1つのエージェント装置300しか登場しない場合は、「温度教えて」などのユーザの発話で、状態検出機器から検出情報を取得するように構成することができる。また、状態検出機器の名称(温度センサ)などを情報提供判定情報として登録し、ユーザCが、「温度センサの値は?」というような問い掛けに対して、エージェント装置300が、検出情報に基づく発話を行うように構成することができる。 In the above explanation, it is assumed that multiple agent devices 300 are registered in a communication group, and in order for each agent device 300 to determine whether a question is directed at itself, the inclusion of the name of the object managed by the agent device 300 is used as a determination factor. However, for example, if only one agent device 300 appears in a communication group, it is possible to configure the system so that detection information is obtained from the status detection device in response to a user utterance such as "Tell me the temperature." In addition, the name of the status detection device (temperature sensor) etc. can be registered as information provision determination information, and the agent device 300 can be configured to make a statement based on the detection information in response to a question from user C such as "What's the temperature sensor reading?".
エージェント装置300のセンサ情報取得部320は、制御部330Aの判定結果が「可」である場合に、状態検出機器(センサ機器1)が出力する温泉の温度情報を取得する(S3001)。発話テキスト送信部340は、設定管理情報に設定されている発話テキストを抽出し、エージェント発話テキストデータ「現在の温度は37.5度です」を生成する(S3004)。発話テキスト送信部340は、生成したエージェント発話テキストを管理装置100に送信する(S3005)。このとき、定型文「現在の温度は○○度です」を設定管理情報として登録しておき、「○○」の部分を検出情報「37.5」に置き換えて、エージェント発話テキストを生成することができる。
When the
管理装置100の音声合成部114は、受信したエージェント発話テキストの合成音声データを生成する(S1001)。また、管理装置100のコミュニケーション制御部112は、エージェント装置300から受信したエージェント発話テキストを、ユーザ同士のコミュニケーション履歴123に含ませて時系列に記憶する(S1002)。
The
コミュニケーション制御部112は、表示同期のため、テキスト形式のエージェント発話テキストを、ユーザ端末500に送信すると共に(S1003)、エージェント発話内容の合成音声データを複数の各ユーザ端末500に同報配信する(S1004)。
To synchronize the display, the
各ユーザ端末500のコミュニケーションApp制御部520は、テキスト形式のエージェント発話内容を表示欄Dに表示させ、かつ合成音声データの自動再生処理を行い、音声出力を行う。このとき、各ユーザ端末500の表示欄Dにおいて、同じエージェント発話内容が同期して表示され、かつエージェント発話内容「現在の温度は○○度です」の音声出力がそれぞれ行われる。
The communication
続いて、エージェント発話内容を音声で聞いたユーザCが、「基準温度よりも高いですがボイラー入れてください」と発話すると、コミュニケーションApp制御部520は、発話音声を集音し、発話音声データを管理装置100に送信する。管理装置100の音声認識部113は、受信した発話音声データを音声認識処理し(1009)、発話内容の音声認識結果を出力する。コミュニケーション制御部112は、音声認識結果をコミュニケーション履歴123に記憶し、発話音声データを記憶装置120に記憶する(S1010)。
Next, when User C, who has heard the agent's speech, says, "It's higher than the reference temperature, please turn on the boiler," the communication
コミュニケーション制御部112は、発話したユーザC以外の他のユーザ端末500それぞれにユーザCの発話音声データを同報送信する(1012)。また、コミュニケーション履歴123に記憶したユーザCの発話内容「基準温度よりも高いですがボイラー入れてください」を、表示同期のために、ユーザC自身を含むコミュニケーショングループ内の各ユーザ端末500に送信する(S1012)。
The
図11は、本実施形態のユーザ端末500に表示される画面例である。図11に示すように、各ユーザ端末500は、自分の発話内容及び自分以外の他のユーザの発話内容と共に、エージェント装置300への問い掛けや呼び掛けに対する発話内容と、問い掛けや呼び掛けをトリガーに発話したエージェント装置300の発話内容が表示欄Dに時系列に表示される。そして、管理装置100に蓄積されるコミュニケーション履歴123がログ情報として共有される。
Figure 11 is an example of a screen displayed on the
本実施形態は、エージェント装置300が、ユーザの問い掛けや呼び掛けを理解して、その都度、状態検出機器の検出情報に基づくエージェント発話テキストを生成して提供するので、エージェント装置300がコミュニケーショングループ内の疑似ユーザとして登場し、ユーザ同士の情報伝達の会話により近いコミュニケーション環境を提供することができる。 In this embodiment, the agent device 300 understands the user's questions and calls, and generates and provides agent utterance text based on the detection information of the status detection device each time. Therefore, the agent device 300 appears as a pseudo user in the communication group, and a communication environment that is closer to a conversation in which users communicate information between each other can be provided.
また、上記例示の施設以外にも、警備業におけるビル施設、物流業のバース(発着所)などがある。また、状態検出機器は、温度センサ以外にも、本コミュニケーションシステムの適用シーンに合わせて、様々な検出機器を用いることができる。 In addition to the facilities listed above, other examples include building facilities in the security industry and berths (departure and arrival points) in the logistics industry. In addition to temperature sensors, various other detection devices can be used as condition detection devices depending on the application scenario of this communication system.
例えば、状態検出機器として、カメラがある。人の動きや混雑度を、カメラで撮影した画像を用いて解析・判定し、「浴場に多数移動した」、「フロントに行列ができている」などの解析結果をトリガーに、エージェント装置300がこれらの解析結果に対するエージェント発話テキストを管理装置100に送信し、ユーザ端末500に合成音声通知及びテキスト表示通知を行うことができる。また、混雑等に関する他の例としては、例えば、駐車場の混雑度を解析・判定し、「もうすぐ駐車場が満車になります」、「第2駐車場の準備をお願いします」などをユーザ端末500に合成音声通知及びテキスト表示通知を行うこともできる。
For example, a camera is an example of a status detection device. Images captured by the camera are used to analyze and determine people's movements and the degree of congestion. Analysis results such as "a large number of people have moved to the bath area" or "there is a line at the front desk" are used as triggers for the agent device 300 to send agent utterance text in response to these analysis results to the management device 100, and a synthetic voice notification and a text display notification can be made to the
また、エージェント装置300が、特定の人物をカメラ画像から抽出する機能を備えるように構成することもできる。この場合、例えば、予め登録された人物画像と撮影された画像とのマッチング処理を行い、状態検出機器であるカメラが設置された場所の情報を用いて、「誰が何処に到着した」という解析結果を得ることができる。このような解析結果をトリガーとして使用し、例えば、「~さんが、~にいます」というエージェント発話テキストをエージェント装置300が出力し、管理装置100を通じて各ユーザ端末500に合成音声で通知することができる。
The agent device 300 can also be configured to have a function for extracting a specific person from a camera image. In this case, for example, a matching process can be performed between a preregistered person image and a captured image, and an analysis result such as "who arrived where" can be obtained using information on the location where the camera, which is a status detection device, is installed. Such an analysis result can be used as a trigger to cause the agent device 300 to output agent utterance text such as "Mr./Ms. ~ is at ~", and a notification can be sent to each
また、他の例としては、状態検出機器として重量センサを適用することができる。例えば、エレベーター等に使われている重量センサと連携し、10分間に5回以上重量オーバーの発生を検知したことをトリガーに、エージェント装置300が「エレベーターが混雑しています」などのエージェント発話テキストを出力し、管理装置100を通じて合成音声で各ユーザ端末500(各ユーザ)に通知する。各ユーザは、必要に応じて人通り整理に向かうことができる。 As another example, a weight sensor can be used as a status detection device. For example, by linking with a weight sensor used in elevators, etc., and detecting five or more occurrences of weight exceeding the limit within a ten-minute period, the agent device 300 will output an agent speech text such as "The elevator is crowded," and notify each user terminal 500 (each user) by synthetic voice via the management device 100. Each user can then head out to direct pedestrian traffic as necessary.
さらに、状態検出機器としてGPS装置(位置情報検出機器)を適用することができる。例えば、人力で引く荷車などにGPS装置を取り付けておき、エージェント装置300は、GPS装置から荷車の位置情報を取得可能に構成する。そして、エージェント装置300は、予め設定されたルートや進入禁止場所と荷車の現在位置とをマッチングし、ルートから所定の範囲ズレていることや進入禁止場所への侵入を検知することができる。そして、これらを検知した場合に、「ルートは間違っていませんか?」、「そこは進入禁止場所です」といったエージェント発話テキストを出力し、管理装置100を通じて合成音声で各ユーザ端末500(各ユーザ)に通知する。このとき、進入禁止場所への侵入は、ユーザ端末500のユーザ以外にも施設利用者も想定される。この場合、通知を受けた各ユーザ端末500のユーザは、進入禁止場所へ向かい、施設利用者に適切にガイドすることができる。
Furthermore, a GPS device (position information detection device) can be applied as the state detection device. For example, a GPS device is attached to a cart pulled by human power, and the agent device 300 is configured to be able to obtain the position information of the cart from the GPS device. The agent device 300 can match the current position of the cart with a preset route or a prohibited entry place, and detect a predetermined range of deviation from the route or an intrusion into a prohibited entry place. When the agent device 300 detects these, it outputs an agent speech text such as "Is the route wrong?" or "That is a prohibited entry place," and notifies each user terminal 500 (each user) by synthetic voice through the management device 100. At this time, it is assumed that not only the user of the
なお、コミュニケーション管理装置100が、エージェント装置300の各機能を備えるように構成することもできる。すなわち、図2又は図9で示したエージェント装置300の機能が、コミュニケーション管理装置100内にエージェント部として設けられる。そして、状態検出機器による検出情報が、コミュニケーション管理装置100に送信されるように構成する。このとき、状態検出機器は、データ通信機能を内的に備えていてもよく、また、状態検出機器を個別のデータ通信機器に接続し、データ通信機器を介してコミュニケーション管理装置100の検出情報を送信できるように構成してもよい。コミュニケーション管理装置100のエージェント部は、監視対象の状態検出機器から出力される検出情報を受け付け、検出情報に基づくエージェント発話テキストを生成し、上記実施形態同様に、コミュニケーショングループの一員として動作することができる。 The communication management device 100 can also be configured to have the functions of the agent device 300. That is, the functions of the agent device 300 shown in FIG. 2 or FIG. 9 are provided as an agent unit within the communication management device 100. Then, the detection information by the status detection device is configured to be transmitted to the communication management device 100. In this case, the status detection device may be internally equipped with a data communication function, or the status detection device may be connected to a separate data communication device so that the detection information of the communication management device 100 can be transmitted via the data communication device. The agent unit of the communication management device 100 can receive detection information output from the monitored status detection device, generate agent utterance text based on the detection information, and operate as a member of a communication group, similar to the above embodiment.
(第3実施形態)
図12から図15は、第3実施形態を説明するための図である。なお、上記第1,第2実施形態と同様の構成については、同符号を付して説明を省略する。
Third Embodiment
12 to 15 are diagrams for explaining the third embodiment. Note that the same components as those in the first and second embodiments are given the same reference numerals and the description thereof will be omitted.
本実施形態のコミュニケーション管理装置100は、上述のグループ通話機能に加えて、個別通話機能を備えている。図12は、本実施形態のグループ通話モード中の個別通話モード割り込み処理の一例を説明するための図である。図12に示すように、エージェント装置300から発信されるエージェント発話テキストに基づく合成音声を、グループ通話中のコミュニケーショングループ内の特定のユーザだけに向けて送信する。 The communication management device 100 of this embodiment has an individual call function in addition to the group call function described above. FIG. 12 is a diagram for explaining an example of an individual call mode interrupt process during group call mode in this embodiment. As shown in FIG. 12, a synthetic voice based on the agent utterance text sent from the agent device 300 is transmitted only to a specific user in the communication group during the group call.
上述のように、エージェント装置300は、コミュニケーショングループ内のメンバ(エージェント)として登録される。本実施形態では、管理装置100を通じたエージェントと特定のユーザとの間の個別通話機能を提供する。 As described above, the agent device 300 is registered as a member (agent) in a communication group. In this embodiment, an individual call function is provided between the agent and a specific user through the management device 100.
図13は、本実施形態の管理装置(コミュニケーション管理装置)100、エージェント装置300、ユーザ端末500の各構成ブロック図である。図13に示すように、上記第1実施形態及び第2実施形態において説明した第1制御部及び第2制御部は、グループ通話制御部112Aとして示されている。コミュニケーション制御部112は、グループ通話制御部112A及び個別通話制御部112Bを備えるように構成される。
Figure 13 is a block diagram of the management device (communication management device) 100, agent device 300, and
管理装置100は、コミュニケーショングループに登録された複数のユーザを含むグループメンバリストを生成し、保持している。個別通話制御部112Bは、エージェント装置300から送信される個別通話要求に基づいて、グループメンバリストから該当するユーザを指定する。
The management device 100 generates and stores a group member list that includes multiple users registered in a communication group. The individual
個別通話制御部112Bは、グループ通話で同報配信されるコミュニケーショングループ内のユーザを対象に、特定のユーザだけに向けて発話音声データを送信する個別通話機能を提供する。個別通話制御部112Bは、グループ通話モード中に、管理装置100を通じてエージェント装置300が特定のユーザと一対一で通話を行うために、指定されたユーザに対してコール(呼)を発信するコール処理を行う。コール処理は、維持されているグループ通話モードに対する割り込み処理であり、コール処理に対してユーザが応答すると、呼接続処理(個別通話通信チャネルの確立処理)を行う。これにより、確立された通話チャネルを通じ、エージェントから特定のユーザだけに向けた発話音声データの配信処理が開始される。これらの処理全体は、コミュニケーショングループ内のグループ通話状態を維持しつつ、特定のユーザをコミュニケーショングループ内の他のユーザとは区画した状態で通話を行うための個別通話割り込み処理として実行される。
The individual
なお、本実施形態の個別通話機能は、エージェント以外の2人のユーザ間にも適用可能である。つまり、管理装置100は、コミュニケーショングループに登録された複数のユーザを含むグループメンバリストを、事前に各ユーザ端末500に配信することができる。そして、ユーザ端末500は、グループメンバリストから個別通話相手のユーザが選択されると、選択されたユーザを含む個別通話要求を管理装置100に送信することができる。個別通話制御部112Bは、選択されたユーザに対してコール処理を行い、コールされたユーザの応答アクションに基づいて、個別通話通信チャネルの確立することができる。
The individual call function of this embodiment can also be applied between two users other than agents. That is, the management device 100 can distribute a group member list including multiple users registered in a communication group to each
なお、個別通話制御部112Bは、グループ通話モード中でなくても、個別通話要求を受け付け、指定又は選択されたユーザとの間で個別通話チャネルを開き、一対一で通話機能を提供することもできる。
In addition, even if the individual
個別通話終了後は、コミュニケーショングループ内で維持されているグループ通話モードへの自動復帰処理を行うことができる。自動復帰処理は、コミュニケーション制御部112によって遂行される。ユーザ端末500において個別通話モードに対する切断操作が行われると、コミュニケーション制御部112は、確立していた個別通話チャネルの切断処理を行って、実行中のグループ通話モードの通話チャネルに自動復帰させる。また、個別通話制御部112B側からの個別通話通信チャネルの切断処理に伴って、グループ通話モードへの自動復帰を行うように構成してもよい。
After the individual call ends, an automatic return process to the group call mode maintained within the communication group can be performed. The automatic return process is performed by the
個別通話モードの通話時間(コール開始時刻、呼応答後の通話時間、通話終了時刻)は、個別通話モード実行履歴として、個別通話相手の履歴と共に管理装置100に蓄積される。また、個別通話中の発話音声データは、グループ通話モードと同様に、音声認識処理されてテキスト化し、コミュニケーション履歴情報123内に、又はコミュニケーション履歴情報123の時間経過と紐付けて個別に格納することができる。個別通話モード中の発話音声データも同様に記憶装置120に格納することができる。
The call duration in the individual call mode (call start time, call duration after call answering, and call end time) is stored in the management device 100 as an individual call mode execution history, together with the history of the individual call partner. In addition, as in the group call mode, the voice data uttered during the individual call can be processed through voice recognition and converted into text, and stored individually in the
このように本実施形態の管理装置100(通信装置130)は、グループ通話機能に対応して、一のユーザによる発話音声データ及びその発話内容のテキスト情報(発話音声データを音声認識処理して得られたテキスト情報)を複数の各ユーザ端末500に一斉に送る同報配信通信制御を行う。また、個別通話機能に対応して、特定のユーザ(個別通話ユーザ)間での発話音声データの個別配信通信制御を行う。
In this way, the management device 100 (communication device 130) of this embodiment performs broadcast communication control to simultaneously send speech voice data by one user and text information of the speech content (text information obtained by processing the speech voice data into voice recognition) to
次に、エージェント装置300は、図14に示す特定通知設定情報を事前に保持することができる。図14に示すように、状況判定条件が設定され、各条件毎に個別通話で連絡をする特定ユーザが決められている。また、連絡する内容(エージェント発話テキスト)も予め設定されている。 Next, the agent device 300 can hold in advance the specific notification setting information shown in FIG. 14. As shown in FIG. 14, the situation determination conditions are set, and specific users to be contacted in individual calls are determined for each condition. In addition, the content of the contact (agent utterance text) is also set in advance.
図14に示す特定通知設定情報は、上記第1,第2実施形態における図5の設定管理情報に、連絡するユーザ(特定ユーザ、ユーザ特性)と、連絡手段としての回線種別(個別通話、グループ通話)が追加された情報である。図5の判定条件が、図14の状況判定条件に相当する。 The specific notification setting information shown in FIG. 14 is information in which the user to be contacted (specific user, user characteristics) and the line type (individual call, group call) as the contact method are added to the setting management information in FIG. 5 in the first and second embodiments. The judgment conditions in FIG. 5 correspond to the situation judgment conditions in FIG. 14.
図15は、本実施形態のコミュニケーションシステムの第3事例に基づく処理フローを示す図である Figure 15 shows the processing flow based on the third example of the communication system of this embodiment.
エージェント装置300の制御部(判定部)330は、監視対象のセンサ機器(状態検出機器)1から出力される検出情報を受け付け(S3001)、特定通知設定情報の「状況判定条件」とマッチングする(S3002)。受け付けた検出情報が、状況判定条件を満たすか否かを判定し(S3003)、状況判定条件を満たすと判定された場合(S3003のYES)、予め設定された発話テキストを抽出し(S3004)、連絡するユーザ、回線種別及び発話テキストの各情報を含む連絡要求を、管理装置100に送信する(S3005)。 The control unit (determination unit) 330 of the agent device 300 receives detection information output from the sensor device (status detection device) 1 to be monitored (S3001) and matches it with the "status determination condition" of the specific notification setting information (S3002). It determines whether the received detection information satisfies the status determination condition (S3003), and if it is determined that the status determination condition is satisfied (YES in S3003), it extracts a pre-set speech text (S3004) and sends a contact request including information on the user to be contacted, the line type, and the speech text to the management device 100 (S3005).
管理装置100は、エージェント装置300から連絡要求を受け付けると、音声合成部114が、受信したエージェント発話テキストの音声合成データを生成する(S1001)。
When the management device 100 receives a contact request from the agent device 300, the
次に、コミュニケーション制御部112は、受け付けた連絡要求に含まれる回線種別と連絡先である特定ユーザを参照し、特定ユーザへの個別通話設定があるか否かを確認する(S1001A)。回線種別が「グループ通話」であれば、ステップS1002に進み、個別通話モードではなく、グループ通話モードで連絡処理を行う(S1003,S1004)。このとき、コミュニケーション履歴123に、発話テキスト等が時系列に蓄積される(S1002)。
Next, the
ステップS1001Aにおいて、特定ユーザへの個別通話設定があると判定された場合(S1001AのYES)、個別通話制御部112Bは、現在のグループ通話モードに対し、連絡要求に含まれる特定ユーザへの個別通話モード(割り込み)処理を行う(S1001B)。具体的には、個別通話通信チャネルを用いて、特定ユーザへのコール処理を行う(1001C)。コールを受けた特定ユーザは、着信呼に対する応答操作を行う(S504a)。特定ユーザが着信呼に対する応答する旨の操作を行うと、管理装置100は、個別通話通信チャネルで、管理装置100と特定ユーザとの個別通話回線を確立する通話処理を行う(S1001D)。個別通話制御部112Bは、個別通話回線を通じて、エージェント発話テキストの音声合成データを、特定ユーザのユーザ端末500に配信する。したがって、エージェントと特定ユーザとの間の個別通話回線による連絡が実現される。
In step S1001A, if it is determined that an individual call setting for a specific user exists (YES in S1001A), the individual
なお、個別通話モードに移行した特定ユーザは、グループ通話の通話チャネルに対して「保留」と同じ取り扱いとなり、個別通話終了後はグループ通話の通信チャネルに自動復帰することができる。また、コミュニケーション制御部112は、個別通話モードを利用した特定ユーザへの連絡履歴も、コミュニケーション履歴123に格納する(S1002)。
Note that a specific user who has switched to individual call mode is treated the same as a "hold" on the group call channel, and can automatically return to the group call communication channel after the individual call ends. The
また、エージェントに対する個別通話相手は、2人以上であってよい。この場合、各特定ユーザに対して別々の個別通話チャネルを確立し、それぞれにエージェント発話テキストに基づく音声合成データを配信することができる。また、個別通話相手別に異なるエージェント発話テキストを設定することもできる。つまり、図14の例のように、フロアマネージャーには「温度が閾値を下回りました。設定ユーザへの要対応通知を行います。」のエージェント発話テキストを設定し、有資格者(例えば、ボイラー技士)には、「至急、温度調節作業をお願いします。」のエージェント発話テキストを設定することができる。フロアマネージャー及び有資格者は、同じ状況判定条件)に対して異なる発話テキストに基づく音声合成データが配信されることになる。 In addition, there may be two or more individual call partners for an agent. In this case, a separate individual call channel can be established for each specific user, and voice synthesis data based on the agent's speech text can be delivered to each of them. Also, different agent speech texts can be set for different individual call partners. That is, as in the example of Figure 14, the agent speech text can be set for the floor manager as "The temperature has fallen below the threshold. A notification will be sent to the set user requesting action," and the agent speech text can be set for a qualified person (e.g., a boiler engineer) as "Please adjust the temperature as soon as possible." Voice synthesis data based on different speech texts will be delivered to the floor manager and the qualified person for the same situation determination condition.
また、連絡先ユーザは、予め設定されたユーザでなくてもよい。図14の例のように、各ユーザ(ユーザ端末)の位置情報を予め把握し、状況判定条件を満たすことで発生した事象への対応者として、その事象が発生した場所に近い1人又は2人以上のユーザを特定ユーザとして決定することができる。図14の例では、進入禁止エリアで進入が検知された場合に、ユーザの位置情報に応じて特定ユーザを選定し、発話テキスト「進入禁止エリアでセンサ検知が発生しました。近距離ユーザとして対応願います。」の音声合成データを、選定した特定ユーザに配信することができる。 In addition, the contact user does not have to be a preset user. As in the example of FIG. 14, the location information of each user (user terminal) can be known in advance, and one or more users close to the location where the event occurred can be determined as specific users to respond to the event that occurs when the situation determination conditions are met. In the example of FIG. 14, when entry into a no-entry area is detected, a specific user can be selected according to the user's location information, and speech synthesis data for the spoken text "Sensor detection has occurred in a no-entry area. Please respond as a nearby user" can be delivered to the selected specific user.
なお、上述したように、管理装置100が、エージェント装置300の各機能を備えるように構成することもできるので、本実施形態の変形例として、管理装置100内に、エージェント装置300に相当するエージェント機能部を備えるように構成する。そして、管理装置100が、センサ機器1から検出情報を受け付けて、図15のステップS3002、S3003、及びS3004を遂行し、グループ通話中に個別通話モードでの連絡を行うように構成することができる。 As described above, the management device 100 can be configured to have the functions of the agent device 300. As a modification of this embodiment, the management device 100 is configured to have an agent function unit equivalent to the agent device 300. The management device 100 can then be configured to receive detection information from the sensor device 1, perform steps S3002, S3003, and S3004 in FIG. 15, and communicate in individual call mode during a group call.
以上、本実施形態について説明したが、コミュニケーション管理装置100及びエージェント装置300の各機能は、プログラムによって実現可能であり、各機能を実現するために予め用意されたコンピュータプログラムが補助記憶装置に格納され、CPU等の制御部が補助記憶装置に格納されたプログラムを主記憶装置に読み出し、主記憶装置に読み出された該プログラムを制御部が実行することで、各部の機能を動作させることができる。 The present embodiment has been described above, but each function of the communication management device 100 and the agent device 300 can be realized by a program, and computer programs prepared in advance to realize each function are stored in an auxiliary storage device, and a control unit such as a CPU reads the program stored in the auxiliary storage device into a main storage device, and the control unit executes the program read into the main storage device, thereby operating the functions of each unit.
また、上記プログラムは、コンピュータ読取可能な記録媒体に記録された状態で、コンピュータに提供することも可能である。コンピュータ読取可能な記録媒体としては、CD-ROM等の光ディスク、DVD-ROM等の相変化型光ディスク、MO(Magnet Optical)やMD(Mini Disk)などの光磁気ディスク、フロッピー(登録商標)ディスクやリムーバブルハードディスクなどの磁気ディスク、コンパクトフラッシュ(登録商標)、スマートメディア、SDメモリカード、メモリスティック等のメモリカードが挙げられる。また、本発明の目的のために特別に設計されて構成された集積回路(ICチップ等)等のハードウェア装置も記録媒体として含まれる。 The above program can also be provided to a computer in a state in which it is recorded on a computer-readable recording medium. Examples of computer-readable recording media include optical disks such as CD-ROMs, phase-change optical disks such as DVD-ROMs, magneto-optical disks such as MO (Magnet Optical) and MD (Mini Disk), magnetic disks such as floppy (registered trademark) disks and removable hard disks, and memory cards such as Compact Flash (registered trademark), Smart Media, SD memory cards, and memory sticks. Also included as recording media are hardware devices such as integrated circuits (IC chips, etc.) that are specially designed and configured for the purposes of the present invention.
なお、本発明の実施形態を説明したが、当該実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。 Although an embodiment of the present invention has been described, this embodiment is presented as an example and is not intended to limit the scope of the invention. This new embodiment can be embodied in various other forms, and various omissions, substitutions, and modifications can be made without departing from the gist of the invention. These embodiments and their modifications are included in the scope and gist of the invention, and are included in the scope of the invention and its equivalents described in the claims.
100 コミュニケーション管理装置
110 制御装置
111 ユーザ管理部
112 コミュニケーション制御部(第1制御部,第2制御部)
112A グループ通話制御部(第1制御部,第2制御部)
112B 個別通話制御部
113 音声認識部
114 音声合成部
120 記憶装置
121 ユーザ情報
122 グループ情報
123 コミュニケーション履歴情報
124 音声認識辞書
125 音声合成辞書
130 通信装置
300 エージェント装置
310 通信部
320 センサ情報取得部
330 制御部(判定部)
330A 制御部(情報提供部)
340 発話テキスト送信部
350 設定管理部
360 記憶部
370 テキスト受信部
380 テキスト解析部
500 ユーザ端末(移動通信端末)
510 通信・通話部
520 コミュニケーションApp制御部
530 マイク(集音部)
540 スピーカー(音声出力部)
550 表示・入力部
560 記憶部
D 表示欄
100 Communication management device 110
112A Group call control unit (first control unit, second control unit)
112B Individual
330A Control Unit (Information Providing Unit)
340 Speech
510 Communication/
540 Speaker (audio output unit)
550 Display/
Claims (9)
前記各移動通信端末が無線通信で接続するコミュニケーション管理装置と、監視対象の状態検出機器から出力される検出情報が入力され、前記コミュニケーション管理装置に接続するエージェント装置と、を含み、
前記コミュニケーション管理装置は、
移動通信端末から受信した発話音声データを他の複数の移動通信端末それぞれに同報配信する第1制御部と、受信した発話音声データを音声認識処理して得られる発話音声認識結果を、ユーザ同士のコミュニケーション履歴として時系列に蓄積するとともに、前記各移動通信端末において前記コミュニケーション履歴が同期して表示されるようにテキスト配信制御を行う第2制御部と、を有するコミュニケーション制御部を備え、
前記エージェント装置は、前記検出情報に基づくエージェント発話テキストを生成し、前記コミュニケーション管理装置に送信する発話テキスト送信部を備え、
前記コミュニケーション制御部は、合成音声処理によって生成された前記エージェント発話テキストの合成音声データを、複数の前記移動通信端末それぞれに同報配信するとともに、受信した前記エージェント発話テキストを、ユーザ同士の前記コミュニケーション履歴に含ませて時系列に蓄積し、前記各移動通信端末へのテキスト配信制御を行うことを特徴とするコミュニケーションシステム。 A communication system in which a user's speech is broadcast to other users' mobile communication terminals through a mobile communication terminal carried by each of a plurality of users,
a communication management device to which each of the mobile communication terminals is connected by wireless communication; and an agent device to which detection information output from a state detection device of a monitoring target is input and which is connected to the communication management device,
The communication management device includes:
a communication control unit including a first control unit that broadcasts speech data received from a mobile communication terminal to each of a plurality of other mobile communication terminals, and a second control unit that accumulates a speech recognition result obtained by performing speech recognition processing on the received speech data in chronological order as a communication history between users, and controls text distribution so that the communication history is displayed synchronously on each of the mobile communication terminals;
the agent device includes an utterance text sending unit that generates an agent utterance text based on the detection information and sends the agent utterance text to the communication management device;
The communication control unit broadcasts synthetic voice data of the agent utterance text generated by synthetic voice processing to each of the multiple mobile communication terminals, includes the received agent utterance text in the communication history between users, and accumulates it in chronological order, and controls text distribution to each of the mobile communication terminals.
前記ユーザ管理部は、前記エージェント装置を前記コミュニケーショングループに登録する機能を提供することを特徴とする請求項1に記載のコミュニケーションシステム。 the communication management device includes a user management unit in which a plurality of the mobile communication terminals are registered and which sets a communication group to be controlled by the first control unit and the second control unit;
2. The communication system according to claim 1, wherein said user management unit provides a function for registering said agent device in said communication group.
前記発話テキスト送信部は、前記検出情報が前記判定条件を満たすと判断された場合に、前記エージェント発話テキストを生成することを特徴とする請求項1又は2に記載のコミュニケーションシステム。 the agent device further includes a control unit that determines whether the detection information satisfies a preset judgment condition,
3. The communication system according to claim 1, wherein the speech text sending unit generates the agent speech text when it is determined that the detection information satisfies the determination condition.
前記エージェント装置は、
前記発話音声認識結果を受信するテキスト受信部と、
前記発話音声認識結果に基づいて、前記エージェント発話テキストを提供するか否かを判定する情報提供部と、を備え、
前記発話テキスト送信部は、前記情報提供部の判定結果に基づいて、前記エージェント発話テキストを生成し、前記コミュニケーション管理装置に送信することを特徴とする請求項1から3のいずれか1つに記載のコミュニケーションシステム。 the communication control unit transmits the speech recognition result to the agent device;
The agent device includes:
a text receiving unit for receiving the speech recognition result;
and an information providing unit that determines whether or not to provide the agent utterance text based on the speech recognition result,
4. The communication system according to claim 1, wherein the utterance text sending unit generates the agent utterance text based on a result of the determination by the information providing unit, and sends the generated utterance text to the communication management device.
同報配信されるコミュニケーショングループ内の特定のユーザだけに向けて発話音声データを送信する個別通話制御部と、を備え、
前記個別通話制御部は、合成音声処理によって生成された前記エージェント発話テキストの合成音声データを、特定のユーザに向けて送信する個別通話制御を行うことを特徴とする請求項1から5のいずれか1つに記載のコミュニケーションシステム。 The communication control unit is
an individual call control unit for transmitting speech voice data to only specific users in a communication group to which the speech voice data is distributed by broadcasting,
The communication system according to any one of claims 1 to 5, characterized in that the individual call control unit performs individual call control to transmit synthetic voice data of the agent utterance text generated by synthetic voice processing to a specific user.
コミュニケーション管理装置が、移動通信端末から受信した発話音声データを他の複数の移動通信端末それぞれに同報配信する第1ステップと、
コミュニケーション管理装置が、受信した発話音声データを音声認識処理して得られる発話音声認識結果を、ユーザ同士のコミュニケーション履歴として時系列に蓄積するとともに、前記各移動通信端末において前記コミュニケーション履歴が同期して表示されるようにテキスト配信制御を行う第2ステップと、
前記エージェント装置が、前記検出情報に基づくエージェント発話テキストを生成し、前記コミュニケーション管理装置に送信する第3ステップと、を含み、
前記第1ステップは、合成音声処理によって生成された前記エージェント発話テキストの合成音声データを、複数の前記移動通信端末それぞれに同報配信し、
前記第2ステップは、受信した前記エージェント発話テキストを、ユーザ同士の前記コミュニケーション履歴に含ませて時系列に蓄積し、前記各移動通信端末へのテキスト配信制御を行うことを特徴とするコミュニケーション方法。 A communication method in which a user's utterance voice is broadcast to the mobile communication terminals of other users through a mobile communication terminal carried by each of a plurality of users, the mobile communication terminals being connected to a communication management device by wireless communication, and an agent device to which detection information output from a state detection device of a monitored object is input is connected to the communication management device;
A first step in which a communication management device broadcasts speech voice data received from a mobile communication terminal to each of a plurality of other mobile communication terminals;
a second step of storing a speech recognition result obtained by speech recognition processing of the received speech data in a chronological order as a communication history between users by the communication management device, and controlling text distribution so that the communication history is displayed synchronously on each of the mobile communication terminals;
a third step of the agent device generating an agent utterance text based on the detection information and transmitting the agent utterance text to the communication management device;
The first step includes broadcasting synthetic voice data of the agent utterance text generated by synthetic voice processing to each of the plurality of mobile communication terminals;
The communication method is characterized in that the second step includes storing the received agent utterance text in chronological order by including it in the communication history between users, and controlling delivery of the text to each of the mobile communication terminals.
移動通信端末から受信した発話音声データを他の複数の移動通信端末それぞれに同報配信する第1機能と、
受信した発話音声データを音声認識処理して得られる発話音声認識結果を、ユーザ同士のコミュニケーション履歴として時系列に蓄積するとともに、前記各移動通信端末において前記コミュニケーション履歴が同期して表示されるようにテキスト配信制御を行う第2機能と、
監視対象の状態検出機器から出力される検出情報が入力され、前記管理装置に接続するエージェント装置によって生成された前記検出情報に基づくエージェント発話テキストを受信し、前記エージェント発話テキストの合成音声データを生成する第3機能と、を実現させ、
前記第1機能は、前記エージェント発話テキストの合成音声データを複数の前記移動通信端末それぞれに同報配信し、
前記第2機能は、受信した前記エージェント発話テキストを、ユーザ同士の前記コミュニケーション履歴に含ませて時系列に蓄積し、前記各移動通信端末へのテキスト配信制御を行うことを特徴とするプログラム。 A program executed by a management device that is connected to a mobile communication terminal carried by each of a plurality of users via wireless communication and broadcasts a user's speech to the mobile communication terminals of other users,
A first function of broadcasting speech voice data received from a mobile communication terminal to each of a plurality of other mobile communication terminals;
a second function of accumulating a speech recognition result obtained by performing speech recognition processing on the received speech data in chronological order as a communication history between users, and controlling text distribution so that the communication history is displayed synchronously on each of the mobile communication terminals;
a third function of receiving detection information output from a state detection device of a monitored object, receiving an agent utterance text based on the detection information generated by an agent device connected to the management device, and generating synthetic voice data of the agent utterance text,
The first function distributes synthetic voice data of the agent utterance text to each of the plurality of mobile communication terminals by broadcasting the synthetic voice data,
The second function is a program that includes the received agent utterance text in the communication history between users, accumulates the text in chronological order, and controls delivery of the text to each of the mobile communication terminals.
移動通信端末から受信した発話音声データを他の複数の移動通信端末それぞれに同報配信する第1制御部と、受信した発話音声データを音声認識処理して得られる発話音声認識結果を、ユーザ同士のコミュニケーション履歴として時系列に蓄積するとともに、前記各移動通信端末において前記コミュニケーション履歴が同期して表示されるようにテキスト配信制御を行う第2制御部と、を有するコミュニケーション制御部と、
監視対象の状態検出機器から出力される検出情報を受け付け、前記検出情報に基づくエージェント発話テキストを生成するエージェント部を備え、
前記コミュニケーション制御部は、合成音声処理によって生成された前記エージェント発話テキストの合成音声データを、複数の前記移動通信端末それぞれに同報配信するとともに、受信した前記エージェント発話テキストを、ユーザ同士の前記コミュニケーション履歴に含ませて時系列に蓄積し、前記各移動通信端末へのテキスト配信制御を行うことを特徴とするコミュニケーションシステム。
A communication system in which a user's speech is broadcast to other users' mobile communication terminals through a mobile communication terminal carried by each of a plurality of users,
a communication control unit including a first control unit that broadcasts speech data received from a mobile communication terminal to each of a plurality of other mobile communication terminals, and a second control unit that accumulates speech recognition results obtained by speech recognition processing of the received speech data in chronological order as a communication history between users, and controls text distribution so that the communication history is displayed synchronously on each of the mobile communication terminals;
an agent unit that receives detection information output from a state detection device of a monitored object and generates an agent utterance text based on the detection information;
The communication control unit broadcasts synthetic voice data of the agent utterance text generated by synthetic voice processing to each of the multiple mobile communication terminals, includes the received agent utterance text in the communication history between users, and accumulates it in chronological order, and controls text distribution to each of the mobile communication terminals.
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/002181 WO2021153438A1 (en) | 2020-01-27 | 2021-01-22 | Communication management device and method |
| US17/759,248 US20230054530A1 (en) | 2020-01-27 | 2021-01-22 | Communication management apparatus and method |
| CN202180007237.0A CN114846781A (en) | 2020-01-27 | 2021-01-22 | Communication management device and method |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020010639 | 2020-01-27 | ||
| JP2020010639 | 2020-01-27 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021117965A JP2021117965A (en) | 2021-08-10 |
| JP7500057B2 true JP7500057B2 (en) | 2024-06-17 |
Family
ID=77175077
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020112961A Active JP7500057B2 (en) | 2020-01-27 | 2020-06-30 | Communication management device and method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7500057B2 (en) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080181140A1 (en) | 2007-01-31 | 2008-07-31 | Aaron Bangor | Methods and apparatus to manage conference call activity with internet protocol (ip) networks |
| JP2011215836A (en) | 2010-03-31 | 2011-10-27 | Toshiba Corp | Remote information management system and method |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5634824B2 (en) * | 2010-10-21 | 2014-12-03 | 保全サービス株式会社 | Remote monitoring notification method and remote monitoring notification device |
-
2020
- 2020-06-30 JP JP2020112961A patent/JP7500057B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080181140A1 (en) | 2007-01-31 | 2008-07-31 | Aaron Bangor | Methods and apparatus to manage conference call activity with internet protocol (ip) networks |
| JP2011215836A (en) | 2010-03-31 | 2011-10-27 | Toshiba Corp | Remote information management system and method |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021117965A (en) | 2021-08-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111971647B (en) | Voice recognition device, voice recognition device cooperation system, and voice recognition device cooperation method | |
| CN104285428B (en) | Method and system for running communication service | |
| US9843678B2 (en) | Visual assistance systems and related methods | |
| US20160366528A1 (en) | Communication system, audio server, and method for operating a communication system | |
| JPWO2014171144A1 (en) | Home appliance control method, home appliance control system, and gateway | |
| WO2021153438A1 (en) | Communication management device and method | |
| US9843683B2 (en) | Configuration method for sound collection system for meeting using terminals and server apparatus | |
| WO2022024778A1 (en) | Communication system and evaluation method | |
| US20230239406A1 (en) | Communication system | |
| JP7500057B2 (en) | Communication management device and method | |
| US12099945B2 (en) | Communication management apparatus | |
| US20250247438A1 (en) | Identification of client device location during emergency | |
| WO2021172125A1 (en) | Communication system | |
| US11509986B1 (en) | Headphones restricted to use with a particular controlled-environment facility resident communication and/or media device | |
| JP6701887B2 (en) | Information processing system, information processing method, and program | |
| US12538126B2 (en) | Communication method and communication system | |
| JP6755220B2 (en) | Spoken voice collection method, system, utterance analysis server and program that receive utterance voice for each group | |
| JP6523974B2 (en) | COMMUNICATION SUPPORT DEVICE, COMMUNICATION SUPPORT METHOD, AND PROGRAM | |
| KR101608319B1 (en) | Apparatus and Method for Providing Question Answering Service and Terminal Therefor | |
| US11044545B1 (en) | Headphones restricted to use with a particular controlled-environment facility resident communication and/or media device | |
| JP6548280B1 (en) | Safety confirmation device, system, method and program | |
| JP7529267B2 (en) | Communication System | |
| KR20070112911A (en) | Hearing Impaired Dialogue System Using Voice Recognition | |
| JP2025179858A (en) | Communication device and control method for communication device | |
| JP6480987B2 (en) | Telephone automatic answering assistance system and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230619 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20231113 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20240105 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240507 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240529 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7500057 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |