JP7528638B2 - Communication System - Google Patents
Communication System Download PDFInfo
- Publication number
- JP7528638B2 JP7528638B2 JP2020143020A JP2020143020A JP7528638B2 JP 7528638 B2 JP7528638 B2 JP 7528638B2 JP 2020143020 A JP2020143020 A JP 2020143020A JP 2020143020 A JP2020143020 A JP 2020143020A JP 7528638 B2 JP7528638 B2 JP 7528638B2
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- determination unit
- interest
- speech
- speakers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
本発明はコミュニケーションシステムに関する。 The present invention relates to a communication system.
特許文献1には、ユーザの周囲とのコミュニケーション参加度合いを、画像情報等を用いて検出する技術が開示されている。 Patent document 1 discloses a technology that uses image information, etc. to detect the degree to which a user is participating in communication with those around them.
情報処理コストの高い画像情報を用いない場合であっても、検出精度の低下を抑制して、ユーザの周囲とのコミュニケーション参加度合いを検出できるコミュニケーションシステムを実現したいという課題があった。 There was a need to realize a communication system that could detect the user's level of participation in communication with those around them while suppressing a decrease in detection accuracy, even without using image information, which has a high information processing cost.
本開示では、そのような課題を解決するためになされたものであり、情報処理コストを低減させつつも、検出精度の低下を抑制して、ユーザの周囲とのコミュニケーション参加度合いを検出できるコミュニケーションシステムを提供することを目的とする。 The present disclosure has been made to solve such problems, and aims to provide a communication system that can detect the user's degree of participation in communication with those around them while reducing information processing costs and suppressing a decrease in detection accuracy.
少なくとも3台のウェアラブル端末と接続する判定装置を含むコミュニケーションシステムであって、前記判定装置は、
前記接続されるウェアラブル端末が検知した音声データに基づいて、前記ウェアラブル端末の各ユーザのうち、発話している発話者を判定する発話判定部と、
前記ウェアラブル端末が検知した加速度データに基づいて、前記ウェアラブル端末の各ユーザの頷きを判定する興味動作判定部と、
所定時間における前記頷きの回数である頷き密度の時間的推移を前記発話者の発話区間において算出し、非発話者の間で前記頷き密度の時間的推移の相関を算出する興味関心判定部と、を備える
コミュニケーションシステム。
A communication system including a determination device connected to at least three wearable devices, the determination device comprising:
an utterance determination unit that determines a speaker who is speaking among the users of the wearable device based on voice data detected by the connected wearable device;
an interest action determination unit that determines whether each user of the wearable device is nodding based on acceleration data detected by the wearable device;
and an interest determination unit that calculates a time transition of nodding density, which is the number of nods in a specified period of time, during a speech section of the speaker, and calculates a correlation of the time transition of the nodding density between non-speakers.
本開示によって、情報処理コストを低減させつつも、検出精度の低下を抑制して、ユーザの周囲とのコミュニケーション参加度合いを検出できるコミュニケーションシステムを提供できる。 This disclosure provides a communication system that can detect the degree of a user's participation in communication with those around them while reducing information processing costs and minimizing deterioration in detection accuracy.
以下では、本開示を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。各図面において、同一要素には同一の符号が付されており、説明の明確化のため、必要に応じて重複説明は省略する。 Specific embodiments to which the present disclosure is applied will be described in detail below with reference to the drawings. In each drawing, the same elements are given the same reference numerals, and duplicate descriptions will be omitted as necessary to clarify the description.
(第1の実施形態)
まず、第1の実施形態に係るコミュニケーションシステム1を説明する。図1は、第1の実施形態に係るコミュニケーションシステム1の構成を示すブロック図である。図1に示すように、コミュニケーションシステム1は、少なくとも3台以上のウェアラブル端末10と、判定装置20(コミュニケーション判定装置20)と、を備えている。まず、コミュニケーションシステム1において、ウェアラブル端末10及び判定装置20の各構成を説明する。その後、コミュニケーションシステム1の動作を説明する。
First Embodiment
First, a communication system 1 according to a first embodiment will be described. Fig. 1 is a block diagram showing the configuration of the communication system 1 according to the first embodiment. As shown in Fig. 1, the communication system 1 includes at least three or more
<ウェアラブル端末10の構成>
ウェアラブル端末10は、ユーザに装着される。例えば、1人のユーザは、1つのウェアラブル端末10を装着する。よって、複数のウェアラブル端末10は、複数のユーザに装着される。なお、図1では、3台のウェアラブル端末10が示されているが、これに限らず、ウェアラブル端末10は、4台以上でもよい。
<Configuration of
The
ウェアラブル端末10は、例えば、バッジである。なお、ウェアラブル端末10は、ユーザに装着されるものであれば、バッジに限らず、ヘッドセット、イヤホン、メガネ、ネックレス、ペンダント等でもよい。ウェアラブル端末10は、センサ11を備える。
The
センサ11は、ウェアラブル端末10のユーザの物理情報を検知する。例えば、センサ11は、ユーザの発声を検知するマイクを備え、ウェアラブル端末10のユーザの発話、すなわち音声を検知する。また、センサ11は、ユーザの動きを検知する加速度センサを備え、ウェアラブル端末10のユーザの加速度を検知する。
The
各ウェアラブル端末10は、図示しない送受信器を有している。各ウェアラブル端末10は、無線または有線の通信回線により、判定装置20に接続されている。例えば、各ウェアラブル端末10は、Bluetooth(登録商標)等の近距離無線通信により、判定装置20と通信可能に接続されてもよい。各ウェアラブル端末10は、インターネット等のネットワークを介して、判定装置20に接続されてもよい。各ウェアラブル端末10は、通信回線を介して、判定装置20に検知した情報を送信する。また、各ウェアラブル端末10は、通信回線を介して、判定装置20から、制御信号等の情報を受信する。
Each
また、各ウェアラブル端末10は、時刻を同期させてもよい。例えば、各ウェアラブル端末10は、インターネットに接続した判定装置20から、ネットワークタイムプロトコル(Network Time Protocol、NTP)の時刻を受信して、時刻を同期させてもよい。
Furthermore, each
各ウェアラブル端末10は、無線または有線の通信回線により、相互に接続されてもよい。各ウェアラブル端末10は、Bluetooth(登録商標)等の近距離無線通信により、相互に通信可能に接続されてもよいし、インターネット等のネットワークを介して、相互に接続されてもよい。各ウェアラブル端末10は、ウェアラブル端末10同士で相互に各種の情報を送受信してもよい。判定装置20は、各ウェアラブル端末10間の近距離無線通信により、各ウェアラブル端末10間の距離を取得してもよい。
The
<判定装置20の構成>
判定装置20は、無線または有線の通信回線により各ウェアラブル端末10に接続されている。判定装置20は、例えば、PC(Personal Computer)、サーバ(Server)、スマートフォン等の情報処理装置である。判定装置20は、インターネット経由で各ウェアラブル端末10が取得した情報を収集できるように、クラウド上に設けられてもよい。
<Configuration of
The
判定装置20は、複数のウェアラブル端末10を用いて取得した情報に基づき、ウェアラブル端末10のユーザ間の興味・関心の類似度を推定する。判定装置20は、記憶部21、発話判定部22、興味動作判定部23及び興味関心判定部24を備える。
The
記憶部21は、例えばウェアラブル端末10のセンサ11が検知した情報を記憶する。記憶部21は、センサ11が検知した発話の音声データ、及び、センサ11が検知した加速度データ等を記憶する。
The
発話判定部22は、発話の発話者及び発話区間を判定する。発話者を判定する方法は、以下に示すいくつかの例が挙げられる。例えば、発話判定部22は、センサ11により検知された音圧の大きさが閾値を超えているかどうかで発話者を判定してもよい。また、例えば、発話判定部22は、まず、近距離無線通信等を用いて取得したウェアラブル端末10間の距離をもとに、距離が近い複数のユーザで仮想的にグループを形成する。その上で、その仮想的なグループの中で音圧が一番大きく、さらに、他のユーザの音圧よりも一定以上の差をもっている一人を発話者と判定してもよい。
The
さらに、発話者の判定精度を向上させる方法として、発話判定部22は、発話者かどうか判定する対象の対象ウェアラブル端末10のセンサ11が取得した音声データに発話区間がある場合には、対象ウェアラブル端末10を装着したユーザを発話者と判定する。
Furthermore, as a method for improving the accuracy of determining who is speaking, if there is a speech section in the voice data acquired by the
具体的には、発話判定部22は、対象ウェアラブル端末10のセンサ11が取得した音声データにおいて、音圧が定常ノイズの閾値よりも小さい区間を、定常ノイズの影響を反映した第1非発話区間と判定する。定常ノイズは、周囲の環境から由来する音であって、エアコンの稼働音や周囲のざわつき等、一定の範囲内で音圧が継続的に発生しているものである。
Specifically, the
発話判定部22は、対象ウェアラブル端末10のセンサ11が取得した音声データにおいて、音圧が、定常ノイズの閾値以上であり、対象ウェアラブル端末10から所定距離内に位置する比較ウェアラブル端末10のセンサ11が取得した音声データの音圧と類似する場合には、突発的な非定常ノイズの影響を反映した第2非発話期間と判定する。突発的な非定常ノイズは、ウェアラブル端末10を装着したユーザの発声以外に由来する音であって、周囲の人の突発的な大声や、大きな物音等、突発的に発声するものである。
When the sound pressure in the voice data acquired by the
発話判定部22は、対象ウェアラブル端末10のセンサ11が取得した音声データにおいて、音圧が、定常ノイズの閾値以上であり、比較ウェアラブル端末10の音圧と類似せず、比較ウェアラブル端末10までの距離に応じて減少すべき閾値よりも小さい場合には、他者の発話が混入した第3非発話区間と判定する。
When the sound pressure in the voice data acquired by the
そして、発話判定部22は、対象ウェアラブル端末10のセンサ11が取得した音声データにおいて、第1~第3非発話区間以外の区間を、対象ウェアラブル端末10を装着したユーザが発話した発話区間と判定する。このようにして、発話判定部22は、対象ウェアラブル端末10のユーザが発話者かどうか判定する。なお、発話者を判定する方法は、上記の方法に限らない。また、上述した発話者を判定する方法をいくつか組み合わせてもよい。
Then, the
興味動作判定部23は、センサ11が取得したウェアラブル端末10のユーザの動きのデータから興味関心を表す特徴的動作を判定する。具体的には、興味動作判定部23は、センサ11が検知した加速度からウェアラブル端末10を装着したユーザの「頷き」を判定する。なお、興味動作は、頷きに限らず、拍手等でもよい。
The interest
興味動作判定部23は、以下のような方法で、「頷き」を判定する。例えば、興味動作判定部23は、センサ11が取得した加速度のXYZの3軸の時系列データのうち、鉛直方向の値を所定の時間区間ごとに抽出する。そして、その時間区間の平均値と標準偏差を算出する。算出した標準偏差が所定の値よりも小さい場合に、その時間区間で頷きが発生したと判定する。ただし、この場合には、歩行や姿勢変更といった大きな動作を伴わないことが必要条件である。また、興味動作判定部23は、算出した平均値から、所定の偏差よりも外れている点が存在する場合に、その時間区間で頷きが発生したと判定してもよい。ただし、単発的な鉛直方向の動作が出ることが必要条件である。
The interest
また、「頷き」を検出する別の方法として、興味動作判定部23は、センサ11が取得した加速度のXYZの3軸の時系列データを、所定の時間区間ごとに抽出する。その時間区間の値を深層学習の畳み込みニューラルネットワーク(Convolution Neural Network、CNN)にかけ、出力値が所定の値以上であれば、その区間で頷きが発生したと判定してもよい。
As another method for detecting "nodding," the interest
興味関心判定部24は、発話判定部22及び興味動作判定部23が判定した情報に基づいて、発話者に対する非発話者間における興味関心の類似度を推定する。具体的には、発話判定部22が判定した発話者の発話区間内で、非発話者の頷き密度の時間的推移を算出する。ここで、頷き密度は、例えば所定時間におけるウェアラブル端末10のユーザの頷き回数である。そして、興味関心判定部24は、非発話者間で頷き密度の時間的推移の相関を算出する。したがって、当該相関の大きさに基づいて、非発話者における発話者に対する興味関心の類似度が推定できる。
The
<ハードウェア構成>
ウェアラブル端末10又は判定装置20は、例えば、算出処理、判定処理、制御処理等を行うCPU(Central Processing Unit)、CPUによって実行される演算プログラム、制御プログラム等が記憶されたROM(Read Only Memory)、各種のデータなどを記憶するRAM(Random Access Memory)、外部と信号の入出力を行うインターフェイス部(I/F)、などからなるマイクロコンピュータを中心にして、ハードウェアで構成されてもよい。CPU、ROM、RAM及びインターフェイス部は、データバスなどを介して相互に接続されている。
<Hardware Configuration>
The
<判定装置20の動作>
続いて、第1の実施形態に係るコミュニケーションシステム1の動作を説明する。ここで、コミュニケーションシステム1の判定装置20の動作を中心に説明する。図2は、第1の実施形態に係る判定装置20の動作を示すフローチャートである。
<Operation of
Next, an operation of the communication system 1 according to the first embodiment will be described. Here, the operation of the
少なくとも3人以上のユーザが会話をする状況を想定する。1人のユーザは、1つのウェアラブル端末10を用いる。よって、複数のウェアラブル端末10は、複数のユーザに用いられる。ウェアラブル端末10のユーザは、例えばグループワークなどの参加者である。
Assume a situation in which at least three or more users are having a conversation. Each user uses one
判定装置20の記憶部21は、ウェアラブル端末10のセンサ11が検知した情報を記憶している。検知した情報とは、ウェアラブル端末10のユーザが発話を検知した音声データ、及び、ウェアラブル端末10のユーザの動きを検知した加速度データ等である。
The
まず、図2に示すように、ステップS101において、判定装置20の発話判定部22は、ウェアラブル端末10が取得した音声データに基づいて、ウェアラブル端末10のユーザの中から発話者を判定し、さらに発話者の発話区間を判定する。発話区間は、発話者が発話している時間に対応する。ここで、発話判定部22は、記憶部21からウェアラブル端末10を用いる各ユーザの音声データを取得する。
First, as shown in FIG. 2, in step S101, the
次に、ステップS102において、興味動作判定部23は、ウェアラブル端末10が取得した加速度データに基づいて、ウェアラブル端末10のユーザの頷きを判定する。ここで、発話判定部22は、記憶部21からウェアラブル端末10を用いる各ユーザの加速度データを取得する。
Next, in step S102, the interest
次に、興味関心判定部24は、発話判定部22及び興味動作判定部23が判定した情報に基づいて、非発話者における発話者に対する興味関心の類似度を推定する。まず、ステップS103において、興味関心判定部24は、発話判定部22が判定した発話者の発話区間内で、非発話者の頷き密度の時間的推移を算出する。ここで、頷き密度は、例えば所定時間におけるウェアラブル端末10のユーザの頷き回数である。次に、ステップS104において、興味関心判定部24は、非発話者間で頷き密度の時間的推移の相関を算出する。したがって、興味関心判定部24は、当該相関の大きさに基づいて、非発話者における発話者に対する興味関心の類似度が推定できる。
Next, the
続いて、図2及び図3を用いて、ステップS103~ステップS104に示した発話者に対する非発話者間における興味関心の類似度を推定する方法の具体例を説明する。図3は、第1の実施形態に係る判定装置20における、発話者に対する非発話者間における興味関心の類似度を推定する方法の具体例を示す図である。
2 and 3, a specific example of a method for estimating the similarity of interests between non-speakers and a speaker shown in steps S103 to S104 will be described. FIG. 3 is a diagram showing a specific example of a method for estimating the similarity of interests between non-speakers and a speaker in the
図3に示す一例において、ユーザA~ユーザDは、それぞれウェアラブル端末10を用いる。ユーザAは発話者である。一方、ユーザB、ユーザC又はユーザDは、非発話者である。ユーザAは、発話開始点I~発話終了点IIまで発話し、発話開始点I~発話終了点IIまでの時間は発話区間である。
In the example shown in FIG. 3, users A to D each use a
まず、ステップS103において、興味関心判定部24は、発話者(ユーザA)の発話区間内で、非発話者(ユーザB~ユーザD)ごとに頷き密度の時間的推移を算出する。ここで、頷き密度は、例えば所定時間におけるウェアラブル端末10のユーザの頷き回数である。
First, in step S103, the
次に、ステップS104において、興味関心判定部24は、非発話者間で頷き密度の時間的推移の相関を算出する。したがって、興味関心判定部24は、当該相関の大きさに基づいて、非発話者における発話者に対する興味関心の類似度を推定できる。例えば、興味関心判定部24は、ユーザBとユーザCでは、時間的推移の相関が高いと判定する。そうすると、興味関心判定部24は、ユーザAに対するユーザBとユーザCとの興味関心が似ていると推定する。一方、興味関心判定部24は、ユーザBとユーザDでは、時間的推移の相関が低いと判定する。そうすると、興味関心判定部24は、ユーザAに対するユーザBとユーザDとの興味関心が異なると推定する。
Next, in step S104, the
第1の実施形態に係るコミュニケーションシステム1は、情報量が多く情報処理コストの高い画像情報を用いず、情報処理コストの低い音声データや加速度データなどの情報を用いて非発話者における発話者に対する興味関心の類似度を推定する。興味関心の類似度から、興味関心の類似度から非発話者の発話者を中心としたコミュニケーションへの参加度合いを検出できる。例えば、発話者に対して同様の興味関心を持つ非発話者が多い程、非発話者が発話者を中心としたコミュニケーションに参加していることが推定できる。したがって、情報処理コストを低減させつつも、検出精度の低下を抑制して、ユーザの周囲とのコミュニケーション参加度合いを検出できるコミュニケーションシステムを提供できる。 The communication system 1 according to the first embodiment estimates the similarity of interests of a non-speaker with respect to a speaker using information such as voice data and acceleration data, which have low information processing costs, without using image information that has a large amount of information and high information processing costs. The degree of participation of a non-speaker in communication centered on the speaker can be detected from the similarity of interests. For example, the more non-speakers there are who have similar interests to a speaker, the more it can be estimated that the non-speakers are participating in communication centered on the speaker. Therefore, a communication system can be provided that can detect the degree of participation of a user in communication with those around them while reducing information processing costs and suppressing a decrease in detection accuracy.
また、特許文献1では、ユーザの周囲とのコミュニケーション参加度合いが画像情報を用いて検出される場合、ユーザの動作はカメラ等で撮像される。そうすると、さらに、以下の(1)~(3)の課題も生じる。(1)撮影可能な範囲外や顔の角度が後ろ向きなどになった場合にコミュニケーション参加度合いが判定できない。(2)ユーザは、撮影されることに対する心理的抵抗感を持つ。(3)カメラの敷設コストが必要となる。第1の実施形態に係るコミュニケーションシステム1は、画像情報を用いずに非発話者における発話者に対する興味関心の類似度を推定する。したがって、上記(1)~(3)の課題を解決するとともに、検出精度の低下を抑制して、ユーザの周囲とのコミュニケーション参加度合いを検出できるコミュニケーションシステムを提供できる。 In addition, in Patent Document 1, when the degree of participation in communication with the user's surroundings is detected using image information, the user's actions are captured by a camera or the like. This also results in the following problems (1) to (3). (1) The degree of participation in communication cannot be determined when the user is outside the range that can be captured or when the face is facing backwards. (2) Users have a psychological resistance to being photographed. (3) The cost of installing cameras is required. The communication system 1 according to the first embodiment estimates the similarity of interests of a non-speaker in a speaker without using image information. Therefore, it is possible to provide a communication system that can detect the degree of participation in communication with the user's surroundings while solving the above problems (1) to (3) and suppressing a decrease in detection accuracy.
また、特許文献1では、情報提供者が情報取得者に対面して説明対象物に関連する情報を提供しており、情報取得者が説明対象物に直接アクセス可能な状況において、情報取得者の興味傾向を示す情報である興味傾向情報を取得し、出力する興味傾向情報出力装置を提供する。具体的には、特許文献1の興味傾向情報出力装置は、情報取得者の動きを示すモーション情報を受け付けるモーション情報受付部と、情報取得者の発した音声に関する音声情報を受け付ける音声情報受付部と、モーション情報と音声情報とから、情報取得者の興味傾向に関する情報である興味傾向情報を生成する興味傾向情報生成部と、興味傾向情報を出力する興味傾向情報出力部とを備える。そして、特許文献1の興味傾向情報出力装置は、このような構成により、グループワークといったコミュニケーションの場において、関係性を深く知るために、興味・関心が似ている人を把握したいニーズに対応しようとしている。 In addition, in Patent Document 1, an information provider provides information related to an object of explanation to an information acquirer in face-to-face contact, and an interest tendency information output device is provided that acquires and outputs interest tendency information, which is information indicating the interest tendency of the information acquirer, in a situation in which the information acquirer can directly access the object of explanation. Specifically, the interest tendency information output device of Patent Document 1 includes a motion information receiving unit that receives motion information indicating the movement of the information acquirer, a voice information receiving unit that receives voice information related to the voice uttered by the information acquirer, an interest tendency information generating unit that generates interest tendency information, which is information related to the interest tendency of the information acquirer, from the motion information and the voice information, and an interest tendency information output unit that outputs the interest tendency information. With this configuration, the interest tendency information output device of Patent Document 1 attempts to meet the need to understand people with similar interests and concerns in order to deepen relationships in communication situations such as group work.
しかしながら、特許文献1の興味傾向情報出力装置は、発話者の発話内容を把握し、それに対する反応の紐づけから興味・関心を推定している。よって、発話内容や映像といった大きい情報量を扱う必要があり、手軽なシステムで簡便に興味・関心を知ることはできない。また、発話者が発話内容を取られることに対して心理的な抵抗感がある。 However, the interest tendency information output device in Patent Document 1 estimates the interests and concerns of a speaker by grasping the content of the speaker's speech and linking the response to that. Therefore, it is necessary to handle a large amount of information such as the speech content and video, and it is not possible to easily know interests and concerns with a simple system. In addition, speakers have a psychological resistance to having their speech content taken into account.
これに対して、第1の実施形態に係るコミュニケーションシステム1は、発話者の発話内容を把握し、それに対する反応の紐づけから興味・関心を推定する必要がないので、情報処理コストを低減することができる。また、発話者が発話内容を取られることに対しての心理的な抵抗感を抑制することができる。 In contrast, the communication system 1 according to the first embodiment can reduce information processing costs because it is not necessary to grasp the content of the speaker's utterance and infer the speaker's interests and concerns from linking the responses to the content. In addition, it can suppress the speaker's psychological resistance to having the content of his or her utterance taken into account.
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。 The present invention is not limited to the above embodiment, and can be modified as appropriate without departing from the spirit and scope of the invention.
上述の実施形態における各構成は、ハードウェア又はソフトウェア、もしくはその両方によって構成され、1つのハードウェア又はソフトウェアから構成してもよいし、複数のハードウェア又はソフトウェアから構成してもよい。各装置の機能(処理)を、CPUやメモリ等を有するコンピュータにより実現してもよい。例えば、記憶装置に実施形態における方法を行うためのプログラムを格納し、各機能を、記憶装置に格納されたプログラムをCPUで実行することにより実現してもよい。 Each component in the above-described embodiments may be configured with hardware or software, or both, and may be configured with one piece of hardware or software, or may be configured with multiple pieces of hardware or software. The functions (processing) of each device may be realized by a computer having a CPU, memory, etc. For example, a program for performing the method in the embodiment may be stored in a storage device, and each function may be realized by executing the program stored in the storage device with a CPU.
これらのプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random Access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。 These programs can be stored and supplied to a computer using various types of non-transitory computer readable media. Non-transitory computer readable media include various types of tangible storage media. Examples of non-transitory computer readable media include magnetic recording media (e.g., flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (e.g., magneto-optical disks), CD-ROMs (Read Only Memory), CD-Rs, CD-R/Ws, and semiconductor memories (e.g., mask ROMs, PROMs (Programmable ROMs), EPROMs (Erasable PROMs), flash ROMs, and RAMs (random access memories)). The programs may also be supplied to a computer by various types of transitory computer readable media. Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves. The transitory computer readable media can supply the programs to a computer via wired communication paths such as electric wires and optical fibers, or wireless communication paths.
1 コミュニケーションシステム
10 ウェアラブル端末
11 センサ
20 判定装置(コミュニケーション判定装置)
21 記憶部
22 発話判定部
23 興味動作判定部
24 興味関心判定部
1
21
Claims (1)
前記少なくとも3台のウェアラブル端末のそれぞれが備えるマイクが検知した音声データに基づいて、前記少なくとも3人のユーザのうち発話している1人の発話者と前記発話者の発話区間とを判定する発話判定部と、
前記少なくとも3台のウェアラブル端末のそれぞれが備える加速度センサが検知した加速度データに基づいて、前記少なくとも3人のユーザの頷きを判定する興味動作判定部と、
前記発話者の発話区間において前記少なくとも2人の非発話者のそれぞれの所定時間における前記頷きの回数である頷き密度の時間的推移を算出し、前記少なくとも2人の非発話者の間で前記頷き密度の時間的推移の相関を算出し、前記相関の大きさに基づいて前記少なくとも2人の非発話者の間の前記発話者に対する興味関心の類似度を前記少なくとも2人の非発話者の前記発話者を中心としたコミュニケーションへの参加度合いとして推定する興味関心判定部と、を備え、
前記発話判定部は、
前記音声データの音圧の大きさに基づいて、前記少なくとも3人のユーザのうち発話している1人の発話者を判定し、前記少なくとも3台のウェアラブル端末のうち、前記発話者か否かを判定する対象の対象ウェアラブル端末が備える加速度センサが検知した音声データに基づき判定される第1非発話区間、第2非発話区間及び第3非発話区間の区間以外の区間を、前記対象ウェアラブル端末を装着したユーザが発話した発話区間と判定し、
前記興味動作判定部は、
前記少なくとも2人の非発話者のそれぞれの加速度データに含まれる加速度の時系列データの鉛直方向の値を所定の時間区間ごとに抽出し、前記所定の時間区間の前記鉛直方向の値から計算した値が所定の値と所定の関係を満たす場合には、前記所定の時間区間で非発話者の頷きが発生したと判定する
コミュニケーションシステム。 A communication system including a determination device connected to at least three wearable devices used by at least three users, each of which has one device, the determination device comprising:
an utterance determination unit that determines a speaker of one of the at least three users and a speech period of the speaker based on voice data detected by a microphone included in each of the at least three wearable devices;
an interest gesture determination unit that determines whether the at least three users are nodding based on acceleration data detected by an acceleration sensor included in each of the at least three wearable devices;
an interest determination unit that calculates a time transition of a nod density, which is the number of nods of each of the at least two non-speakers in a predetermined time period during a speech section of the speaker, calculates a correlation of the time transition of the nod density between the at least two non-speakers, and estimates a similarity of interest between the at least two non-speakers in the speaker as a degree of participation of the at least two non-speakers in communication centered on the speaker based on the magnitude of the correlation ,
The utterance determination unit is
determine a speaker among the at least three users based on the sound pressure level of the voice data, and determine a section other than a first non-speech section, a second non-speech section, and a third non-speech section determined based on voice data detected by an acceleration sensor provided in a target wearable device among the at least three wearable devices that is to be determined as being the speaker, as a speech section spoken by the user wearing the target wearable device;
The interest action determination unit is
A vertical value of acceleration time series data included in the acceleration data of each of the at least two non-speakers is extracted for each predetermined time interval, and if a value calculated from the vertical value for the predetermined time interval satisfies a predetermined relationship with a predetermined value, it is determined that a nod of a non-speaker has occurred in the predetermined time interval.
Communication system.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020143020A JP7528638B2 (en) | 2020-08-26 | 2020-08-26 | Communication System |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020143020A JP7528638B2 (en) | 2020-08-26 | 2020-08-26 | Communication System |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022038487A JP2022038487A (en) | 2022-03-10 |
| JP7528638B2 true JP7528638B2 (en) | 2024-08-06 |
Family
ID=80498927
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020143020A Active JP7528638B2 (en) | 2020-08-26 | 2020-08-26 | Communication System |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7528638B2 (en) |
Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5055781B2 (en) | 2006-02-14 | 2012-10-24 | 株式会社日立製作所 | Conversation speech analysis method and conversation speech analysis apparatus |
| JP6400445B2 (en) | 2014-11-27 | 2018-10-03 | Kddi株式会社 | Conversation analyzer, conversation analysis system, conversation analysis method, and conversation analysis program |
| JP2019138937A (en) | 2018-02-06 | 2019-08-22 | Kddi株式会社 | Information processing unit, information processing method and program |
| JP6565500B2 (en) | 2015-08-31 | 2019-08-28 | 富士通株式会社 | Utterance state determination device, utterance state determination method, and determination program |
| JP6747592B2 (en) | 2018-03-29 | 2020-08-26 | 京セラドキュメントソリューションズ株式会社 | Information processing equipment |
| JP6756328B2 (en) | 2015-03-27 | 2020-09-16 | ソニー株式会社 | Information processing equipment, information processing methods, and programs |
| JP6817580B2 (en) | 2016-09-07 | 2021-01-20 | パナソニックIpマネジメント株式会社 | Information processing method, information processing system and information processing equipment |
| JP6859283B2 (en) | 2017-11-30 | 2021-04-14 | 日本電信電話株式会社 | Favorability estimation device, likability estimation method, program |
| JP7276158B2 (en) | 2018-01-12 | 2023-05-18 | ソニーグループ株式会社 | Information processing device, information processing method and program |
-
2020
- 2020-08-26 JP JP2020143020A patent/JP7528638B2/en active Active
Patent Citations (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5055781B2 (en) | 2006-02-14 | 2012-10-24 | 株式会社日立製作所 | Conversation speech analysis method and conversation speech analysis apparatus |
| JP6400445B2 (en) | 2014-11-27 | 2018-10-03 | Kddi株式会社 | Conversation analyzer, conversation analysis system, conversation analysis method, and conversation analysis program |
| JP6756328B2 (en) | 2015-03-27 | 2020-09-16 | ソニー株式会社 | Information processing equipment, information processing methods, and programs |
| JP6565500B2 (en) | 2015-08-31 | 2019-08-28 | 富士通株式会社 | Utterance state determination device, utterance state determination method, and determination program |
| JP6817580B2 (en) | 2016-09-07 | 2021-01-20 | パナソニックIpマネジメント株式会社 | Information processing method, information processing system and information processing equipment |
| JP6859283B2 (en) | 2017-11-30 | 2021-04-14 | 日本電信電話株式会社 | Favorability estimation device, likability estimation method, program |
| JP7276158B2 (en) | 2018-01-12 | 2023-05-18 | ソニーグループ株式会社 | Information processing device, information processing method and program |
| JP2019138937A (en) | 2018-02-06 | 2019-08-22 | Kddi株式会社 | Information processing unit, information processing method and program |
| JP6747592B2 (en) | 2018-03-29 | 2020-08-26 | 京セラドキュメントソリューションズ株式会社 | Information processing equipment |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022038487A (en) | 2022-03-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Li et al. | Eario: A low-power acoustic sensing earable for continuously tracking detailed facial movements | |
| US11785395B2 (en) | Hearing aid with voice recognition | |
| US11290826B2 (en) | Separating and recombining audio for intelligibility and comfort | |
| US11979716B2 (en) | Selectively conditioning audio signals based on an audioprint of an object | |
| US11467666B2 (en) | Hearing augmentation and wearable system with localized feedback | |
| US8581700B2 (en) | Wearable device | |
| JP5581329B2 (en) | Conversation detection device, hearing aid, and conversation detection method | |
| US12229472B2 (en) | Hearing augmentation and wearable system with localized feedback | |
| JP5989603B2 (en) | Estimation apparatus, estimation method, and program | |
| US20220101873A1 (en) | Techniques for providing feedback on the veracity of spoken statements | |
| JP7528638B2 (en) | Communication System | |
| JP7521328B2 (en) | Communication System | |
| JP2022037453A (en) | Communication system | |
| JP7354992B2 (en) | Comment evaluation system, comment evaluation method, and program | |
| JP7653087B1 (en) | Two-way communication method, program, and wearable terminal | |
| US20250037463A1 (en) | Information processing device, information processing method, and information processing program | |
| US20250191291A1 (en) | Head and ear tracking using image scaling with emotion detection | |
| JP7624660B2 (en) | Prediction device, subjective impression prediction method, and program | |
| JP5449230B2 (en) | Remote communication device, remote communication method, program | |
| JP2026060614A (en) | system | |
| Archer-Boyd et al. | Head movements in two-and four-person interactive conversational tasks in noisy and moderately reverberant conditions. | |
| JP2026019145A (en) | system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230718 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240514 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240613 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240625 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240708 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7528638 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |