Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6417652B2 - 情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム - Google Patents
[go: Go Back, main page]

JP6417652B2 - 情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム - Google Patents

情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム Download PDF

Info

Publication number
JP6417652B2
JP6417652B2 JP2013204509A JP2013204509A JP6417652B2 JP 6417652 B2 JP6417652 B2 JP 6417652B2 JP 2013204509 A JP2013204509 A JP 2013204509A JP 2013204509 A JP2013204509 A JP 2013204509A JP 6417652 B2 JP6417652 B2 JP 6417652B2
Authority
JP
Japan
Prior art keywords
data
client terminal
audio data
synthesized
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013204509A
Other languages
English (en)
Other versions
JP2015070515A5 (ja
JP2015070515A (ja
Inventor
久士 矢島
久士 矢島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2013204509A priority Critical patent/JP6417652B2/ja
Publication of JP2015070515A publication Critical patent/JP2015070515A/ja
Publication of JP2015070515A5 publication Critical patent/JP2015070515A5/ja
Application granted granted Critical
Publication of JP6417652B2 publication Critical patent/JP6417652B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Description

ネットワークを介して音声を送受信するアプリケーションにおいて、ネットワークの遅延などによる音声の遅延を回復する技術に関する。
ネットワークを介して音声を送受信するアプリケーションにおいて、ネットワークの揺らぎなどを考慮し、例えば、サーバ上に各クライアントからの上り音声を蓄積するためのキューを用意する場合がある。しかし、キューを持つことにより、キューにデータが蓄積していくことで遅延が増大する状況も発生する。
クライアントが受信したそれぞれのクライアントの音声から無音を破棄することで遅延を回復するこことが可能であるが、サーバでミキシングする場合、クライアントが受信する下り音声はサーバでミキシングされた1つの音声データとなる。その場合、いずれか1つのクライアントが発話中であれば、そのミキシングした音声は無音ではないため破棄されず、遅延を回復することはできない。
そのため、下り音声をサーバでミキシングしてクライアントに送信する場合には、当該クライアントとサーバ間の下りの通信が揺らぐなどした際に、他のクライアントにはすでに送信済みである音声が、当該クライアントにだけ遅れて送信されるといったことが発生し、その後に受信する音声がすべて遅延する状態を維持してしまうことになる。
以上のように遅延が増大すると具体的には以下のような問題が発生する。複数拠点で遠隔会議をしているとした場合、時間の経過とともに音声の遅延が蓄積し、会議の進行に支障が出る場合がある。例えば、相手が発話していないと思い、発話した場合に音声が重複し、聞き取れない可能性がある。また、質問に対する回答が来ていないと思い再度質問するなど、会話が成り立たない可能性がある。
特許文献1における通信システムは、音声データを送信装置から受信装置に送信するシステム構成であって、送信側装置は、音声データの音量レベルに基づいて無音状態情報を生成して、送信装置は音声データを蓄積して遅延時間を調整するジッタ吸収バッファと、ジッタ吸収バッファに蓄積されている音声データ量が設定した許容蓄積量を超過した場合に、当該許容蓄積量を増加させ、ジッタ吸収バッファに蓄積されている音声データ量が一定時間、設定した許容蓄積量内である場合に、無音状態を示す音声データを廃棄して、当該許容蓄積量をデフォルト値に戻すジッタバッファ調整部を備えたものである。
特開2012−124689
しかしながら、特許文献1に記載の技術においては、あくまで送信端末、受信端末が一対一の関係にある場合に限られており、例えば、会議システムのように、一対多の関係であって、また、1つのクライアントから他のクライアントに直接音声データを送るわけではなく、例えば会議サーバにおいて他のクライアント端末の音声データをミキシングしてから、クライアント端末に音声データを送信する場合には対応できない。
本発明の目的は、音声データを送信する仕組みにおいて、送信する対象の音声データを変えて遅延を回復することが可能な仕組みを提供することである。
本発明は、入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と通信可能な、前記クライアント端末から受信した所定の単位の音声データを、当該音声データの送信元のクライアント端末ごとに合成前音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置であって、前記蓄積記憶部に蓄積された、前記クライアント端末ごとの合成前音声データ群から取得された所定の単位の音声データを用いて合成データを生成する合成データ生成手段と、前記合成データ生成手段により生成された前記合成データを、複数のクライアント端末のうち、送信先であるクライアント端末に送信する送信手段と、前記クライアント端末から通知を受け付けた場合には合成に用いない音声データを、前記蓄積記憶部に蓄積された前記クライアント端末ごとの合成前音声データ群から特定する特定手段と、を備え、前記合成データ生成手段は、前記クライアント端末から通知を受け付けた場合には、前記合成前音声データ群において前記特定手段により特定された前記合成に用いない音声データをスキップし合成すべき次の音声データを取得して、前記通知を受け付けたクライアント端末用の合成データを生成することを特徴とする。
本発明によれば音声データを送信する仕組みにおいて、送信する対象の音声データを変えて遅延を回復することが可能な仕組みを提供することができる。
本発明の実施の形態に係るシステム構成を示す図の一例である。 本発明の実施の形態に係るハードウェアの構成を示す図の一例である。 本発明の実施の形態に係るソフトウェアの機能構成を示す図の一例である。 本発明の実施の形態に係るクライアント端末における再生遅延の発生と回復処理を示すイメージの一例を示す図である。 本発明の実施の形態に係る会議サーバにおける、音声情報がキューに格納される状況を示すイメージの一例を示す図である。 本発明の実施の形態に係る会議サーバにおける、クライアント端末からの受信状態に基づく遅延状態の発生と回復処理を示すイメージの一例を示す図である。 本発明の実施の形態に係る会議サーバにおける、クライアント端末への送信状態に基づく遅延状態の発生と回復処理を示すイメージの一例を示す図である。 本発明の実施の形態に係るクライアント端末における、再生遅延回復処理のフローチャートの一例である。 本発明の実施の形態に係る会議サーバにおける、クライアント端末からの受信状態に基づく遅延回復処理のフローチャートの一例である。 本発明の実施の形態に係るクライアント端末への送信状態に基づく遅延回復処理のフローチャートの一例である。 図7において遅延が発生した場合の遅延回復方法をキューのイメージを用いて説明する図の一例である。
以下、本発明の実施の形態を、図面を参照して詳細に説明する。
図1は、本発明の実施の形態に係るシステム構成を示す図の一例である。クライアント端末101(複数)と会議サーバ102は、ネットワークを介して接続可能である。
会議システム(図1)においては、会議に参加するユーザのうち、いずれか(便宜上、主催者とする)が、クライアント端末101から会議サーバ102にアクセスして、会議室を予約する。会議室とは、可能の会議スペースであって、後述するところの「招待された参加者」だけが入室可能にすることも可能である。また、フリースペースとして、不特定のユーザが参加できたり、発言はできないが、視聴のみ可能であったりしても良い。
主催者は、会議を特定する会議ID(あるいは会議室ID、部屋番号など)、その会議室を使用する時刻などを決定し、特定の参加者を招待する場合には、会議サーバに登録されている参加者の通知先(例えばメールアドレス)などを用いて、参加を呼びかけるようにしてもよい。特定のユーザのみを参加させるためには、前記通知の中に、当該会議室に入室するためのパスワードを記載可能とする。
ここで、各クライアント端末101a〜cのユーザ(実際の会議参加者)のマイクロフォン(不図示)、による音声データ、あるいはカメラ(不図示)による撮像データは、図4〜図7でそのイメージとして示すように、一旦、会議サーバ102に送信される。例えば音声については各々のクライアント端末101から会議サーバ102に対して、クライアント端末101の個数分の上り音声として送信される。
前述の上り音声は、会議サーバ102で、複数のクライアント端末101から受信した上り音声をミキシングし、他のクライアント端末101に配信する(下り音声データ)。ただ、ミキシングに際して、ある上り音声を送信したクライアント端末101に送り返される下り音声データには、その端末自身の音声をミキシングすることは不要である。
ここで、クライアント端末101と会議サーバ102を別筐体として記載しているが、ある1つのクライアント端末101が、会議サーバ102の機能を同じ筐体に構成されるようにしても良い。
なお、本発明の実施形態においては、会議システムを例として説明を進めるが、必ずしも会議システムに限らず、例えばネットワークを介して音声の交換をし、ネットワークの遅延などによりパケット(音声データを含むデータ)の遅延が発生する場合に利用可能な技術として提供する。
図2は、本発明の実施の形態に係るハードウェアの構成を示す図の一例である。図2に示すように、クライアント端末101、会議サーバ102は、システムバス204を介してCPU(Central Processing Unit)201、RAM(Random Access Memory)202、ROM(Read Only Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、通信I/Fコントローラ208等が接続された構成を採る。 CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。
また、ROM203あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、各サーバあるいは各PCが実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。また、本発明を実施するために必要な情報が記憶されている。なお外部メモリはデータベースであってもよい。
RAM202は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM203あるいは外部メモリ211からRAM202にロードし、ロードしたプログラムを実行することで各種動作を実現する。
また、入力コントローラ205は、キーボード(KB)209や不図示のマウス等のポインティングデバイス等からの入力を制御する。
ビデオコントローラ206は、ディスプレイ210等の表示器への表示を制御する。尚、表示器は液晶ディスプレイ等の表示器でもよい。これらは、必要に応じて管理者が使用する。
メモリコントローラ207は、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザファイル、編集ファイル、各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、あるいは、PCMCIA(Personal Computer Memory Card International Association)カードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
通信I/Fコントローラ208は、ネットワークを介して外部機器と接続・通信し、ネットワークでの通信制御処理を実行する。例えば、TCP/IP(Transmission Control Protocol/Internet Protocol)を用いた通信等が可能である。
尚、CPU201は、例えばRAM202内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上に表示することが可能である。また、CPU201は、ディスプレイ210上のマウスカーソル(図示しない)等によるユーザ指示を可能とする。
本発明を実現するための後述する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM202にロードされることによりCPU201によって実行されるものである。さらに、上記プログラムの実行時に用いられる定義ファイルおよび各種情報テーブル等も、外部メモリ211に格納されており、これらについての詳細な説明についても後述する。
図3は、本発明の実施の形態に係るソフトウェアの機能構成を示す図の一例である。クライアント端末101と会議サーバ102のソフトウェア構成要素と各記憶部、およびそれらの間のデータの受け渡し(端末3から音声データ328等に関連付けられた点線矢印を除く)を図で示したものである。
まず、音声データの流れについて概略を説明する。クライアント端末101が、ユーザから音声の入力を受け付けると、音声データに変換され会議サーバ102に送信される。複数のクライアント端末101から会議サーバが受信した音声データは、クライアント端末101ごとに用意されたキューに格納される。あるクライアント端末101に送信される音声データは、当該クライアント端末101自体の音声データ(に対応するキュー)を除き、他のクライアント端末101に対応するキューから音声データを1つずつ取得してミキシングし、クライアント端末101に送信する。ミキシングされた音声データを受信したクライアント端末101は、(当該クライアント端末101自体の音声データはミキシングされていない)他のクライアント端末101のミキシングされた音声データを再生することでユーザは、音声を聴くことが出来る。
クライアント端末101は、音声入力部311において、ユーザが使用するマイクなどの接続機器により音声データの入力を受け付ける。入力を受け付けた音声データは、音声送信部312から、会議サーバ102に送信される。ここで、音声データは、一定のサイズ(例えば、時間を基準として10ミリセカンド分の入力された音声など)に区切られる。以降の説明で「音声データ」と呼ぶ場合には、この一定のサイズに区切られた入力音声のデータを意味することにする。これはあくまで例であり、データのビット数など会議システムでの基準に従うものとする。
クライアント端末101から送信された音声データ(上り音声データ)は、会議サーバ102の音声受信部321において、受信される。受信した音声データは、ミキシング用音声記憶部326に格納される。ミキシング用音声記憶部326は、会議に参加している各々のクライアント端末101に対応してキューを用意し、ある程度の数の音声データを記憶する。図3においては、ミキシング用音声記憶部326のうち、各々のクライアント端末101に対応してキューの1つ1つの要素を端末1〜端末3に対応して縦方向(例では7つの矩形)に示している。
音声受信時に、上りチェック部322により上り音声データ受信(取得)が原因で、処理の遅延が発生していると判断された場合には、遅延回復処理が行われる。具体的には、この処理は、受信したクライアント端末101ごとに行われ、対応するキューに格納されている音声データの数が、サーバ閾値記憶部327の上り遅延閾値に基づき、所定数を上回っていると判断された場合に、無音データの削除処理をする。
ここで、各キューに格納される音声データの一単位は1つの矩形に対応するものであり、より詳細には、音声データ328と送信済端末情報329のペアを格納する。音声データ328は、前述のクライアント端末101から受信した音声データである。一方、受信された音声データは、他の端末から受信した音声データとミキシングして、会議サーバ102から、各々のクライアント端末101に送信(ミキシング音声送信部323)される。その際、何らかの状態(例えばネットワークの回線速度の違い)により、送信済のクライアント端末101と、未送信クライアント端末101とが発生する。そこで、後述の遅延回復処理をクライアント端末101ごとに処理できるよう、送信済のクライアント端末101か、未送信のクライアント端末101かの情報を「送信済端末情報329」に記載する。データ構成は如何様でもよく、送信済/未送信のクライアント端末101が識別できればよい。
なお、あるクライアント端末101へ送信する音声データのミキシングに際して、もともと当該クライアント端末101から受信した音声データはミキシングする対象から省く。即ち、自分自身以外のクライアント端末101から送られた音声データをミキシングする。
下りチェック部324は、ミキシング音声送信部323がクライアント端末101に音声データを送信する際に、ミキシングすべきクライアント端末101(即ち、送信するクライアント端末101以外のクライアント端末101)関する遅延回復処理をする。具体的には、この処理は、ミキシングする際に、サーバ閾値記憶部327の下り遅延フラグ(クライアント端末101ごとに存在する)が“オン”になっている場合に、各キュー内の無音データをスキップし、次の音声データをミキシングする。
下りチェック部324による遅延回復処理の完了後(遅延回復の必要がないと判定された場合を含む)、ミキシングされたデータは、所定のクライアント端末101に送信される。なお、会議サーバ102の処理において、音声受信部321とミキシング音声送信部323は、同期した処理である必要はない。
クライアント端末101のミキシング音声受信部313においては、会議サーバ102が、当該クライアント端末101以外の音声データをミキシングしたデータを受信し、受信音声記憶部316(キュー)に格納する。その際に、端末閾値記憶部317の再生遅延閾値に基づき、所定数を上回っていると判断された場合に、無音データの削除処理をする。
音声再生部315においては、受信音声記憶部316(キュー)からミキシングされた音声を取り出し、再生する。なお、クライアント端末101の処理において、ミキシング音声受信部313と音声再生部315は、同期した処理である必要はない。
音声の遅延回復処理は、クライアント端末101、会議サーバ102の双方で実行される。それぞれの遅延回復処理の概要を、音声データを格納するキューのイメージを用いて図4(クライアント端末101側)、図5〜図7(会議サーバ102側)について説明する。
図4は、本発明の実施の形態に係るクライアント端末における再生遅延の発生と回復処理を示すイメージの一例を示す図である。図4においては、1)遅延が発生していない状態、2)遅延が発生している状態、3)遅延回復方法、について説明する。なお、図4〜図7で説明する本発明の実施の形態に係わるキューはすべてFIFOとして説明する。まず「遅延が発生していない状態」について1)を用いて説明する。
(1)まずクライアント端末101は、会議サーバ102から音声データ(ミキシングされた音声データ)を受信する。
(2)その音声データを受信音声記憶部316に再生する待ち状態のデータとして格納する。
(3)図4の例では、受信した「A1」のみが格納されているが、再生遅延閾値に基づき、所望の範囲の個数であれば遅延とはみなさいとしてよい。キューは、FIFOであり、先に格納された音声データが先に取り出され再生される。
(4)キューの先頭にきた音声データは、音声再生部315により取り出され再生されることにより、当該クライアント端末101のユーザが聞くことが出来る。
以降の図4における説明で、遅延が発生する/しないの違いはあるものの、この(1)〜(4)の流れは同じである。
次に「遅延が発生している状態」について2)を用いて説明する。例えば、ネットワークの遅延などにより複数のパケット(便宜上音声データと同じ記号で表す。例ではA1〜A7の7個)を、ほぼ同時にクライアント端末101にて受信したとする。クライアント端末101のキュー(受信音声記憶部316)には7個の音声データが蓄積され、音声データの再生が遅延することになる。
これ以降の処理において、再生のためキューから削除されていく音声データと、受信してキューに格納する音声データは原則として同一のタイミングであるため、遅延の速度は一定になる(自然に遅延が回復することはない、ということ)。
従って、何らかの理由により、再度の遅延が発生すると、その遅延した音声データの総数は、次第に蓄積されていき、最終的には、会議の通話にユーザが違和感を感ずるレベルに達する。すなわち、カメラで撮影した画像が別に送受信されている場合には、発言の画像と音声が著しくずれる、また他のクライアント端末101との発言内容の前後関係がおかしくなってくる、などが考えられる。
従って、前述の通り、再生遅延閾値に基づき、所望の範囲の個数であれば遅延とはみなさいが、所定の範囲を超えた場合には、再生時の遅延回復処理を行う必要がある。
図4の最後に「遅延回復方法」について3)を用いて説明する。すなわち、再生遅延閾値に基づき、所望の範囲の個数を超えたとして、遅延回復処理を行う。キューにある音声データには、A1〜A7の音声データが格納されているが、このうち「()」が付与された音声データ(A2、A4、A5、A6を例えば(A2)と記載したもの)については、「無音データ」であるとする。ここで無音データとは、システム上「音声が含まれていないとみなす音声データ」である。音声データが無音データであるか否かの判定については「特開2000−312223」などにより周知の技術であるため、説明を省略する。
音声データの再生には、キューの先頭から音声データを1つずつ取得して再生するが、取得する際にキューに格納されている音声データの数をカウントし、その数が、再生遅延閾値に基づき、所望の範囲の個数を超えた場合には、遅延回復処理を開始する。その場合、キューに格納されているすべての音声データを確認し、無音データを削除していく。なお、遅延回復処理は、他の処理に割り込まれることなく一気に処理を行う。
図5は、本発明の実施の形態に係る会議サーバにおける、音声情報がキューに格納される状況を示すイメージの一例を示す図である。図5は、遅延が発生していない場合の状態を示す。
(1)まず、会議サーバ102は、クライアント端末101ごとに音声データを受信する。
(2)次に、受信した音声データを、ミキシング用音声記憶部326においてクライアント端末101ごとに用意したキューに格納する。格納する情報は、図3で説明したように音声データ328だけではなく、他のクライアント端末101が当該音声データをミキシングして送信済であるかどうかを、他のクライアント端末101ごとに記憶する送信済端末情報329をも格納する。両者(328、329)を合わせて、便宜上音声情報と呼ぶことにする。キューに積んだ直後の初期状態では、他のいずれのクライアント端末101にも送信していない。なお、この送信済であるか否かの情報は、他のすべてのクライアント端末101の配列を用意したフラグであってもよいし、あるいは送信済端末の一覧、あるいは送信済でない端末の一覧など、いずれのデータ構成であってもよい。
(3)次に、各キューの音声データ(キューの先頭の音声情報に含まれる音声データ)を取り出しミキシングする。前述の通り、音声データを送信しようとするクライアント端末101に対応するキューを除き、その他のキューの音声データをミキシングする。
(4)ミキシングした音声データをクライアント端末101に送信する。
図6は、本発明の実施の形態に係る会議サーバにおける、クライアント端末からの受信状態に基づく遅延状態の発生と回復処理を示すイメージの一例を示す図である。図6では、まず「1)上り音声データ取得(クライアント端末101から会議サーバ102に送信された音声データ取得)が原因で、遅延が発生する状況」を説明する。
(1)まず、クライアント端末101Aからは、遅延することなく音声データを受信しているとする。一方、クライアント端末101Bからは、ネットワークの問題などで、7つの音声データ(B1〜B7)を受信する。
(2)従って、クライアント端末101Aに対応するキューは、1つの音声情報が格納されるが、クライアント端末101Bでは、7つの音声情報が対応するキューに格納する。
(3)クライアント端末101Cに送信するためのミキシングは、クライアント端末101A用、B用のキューから取り出した音声データを用いる。クライアント端末101A用のキューからは、音声データ「A7」(「B7」と同じ時間の音声)が取得され用いられるが、クライアント端末101B用のキューからは、音声データ「B1」(「B7」より6単位時間前の音声)が遅延データとして残っている。従って、それぞれ時間のずれた「A7+B1」というミキシング音声データが生成される。
前述のクライアント端末101における再生の場合と同様に、ミキシングのためキューから削除されていく音声情報と、受信してキューに格納する音声情報は原則として同一の個数であるため、遅延の速度は一定になる(自然に遅延が回復することはない、ということ)。従って、何らかの理由により、クライアント端末101Bから受信する音声データのみに対して遅延が発生すると、その遅延した音声データの総数は、次第に蓄積されていく。
(4)最終的にクライアント端末101に送信された(ミキシングされた)音声データは、ユーザからみて問題と判断されるレベルに達する。即ち、ミキシングされた音声データを受信したクライアント端末101以外のクライアント端末101の音声データがミキシングされているわけだが、時間的なずれがあり、会話が成り立たない可能性もある。
次に、前述の遅延に対する「2)遅延回復方法」を説明する。例として1)のようにクライアント端末101Bから受信したキューにおいて、所定の数の範囲を超える音声情報が蓄積されたとする(上り遅延閾値に基づいて判定)。所定の数の範囲を超える音声情報が蓄積されたと判定されると遅延回復処理が開始される。「2)」の図の左側にあるキューには、B1〜B7のうち、無音データに対応する音声情報(「()」が付与されたもの)が4つあるため、これを削除する。無音データかどうかの判定は、クライアント端末101で行い、送信する音声データに付加される。会議サーバ102においては、実際の音声データ内部を解析するのではなく、クライアント端末101から送信された音声データの付加情報により、無音データであるか否かを判定する。ただし、無音データかどうかの判定は会議サーバ102で行ってもよい。なお、会議サーバにおいては、音声データの下り処理(クライアント端末101への音声データ送信)においても、音声データが無音であるか否かを判定する場合があるが、同様とする。残りは右側のキューの通り、3つ(B1、B3、B7)の音声情報が格納されることになる。これらが、すべてのキュー(クライアント端末101ごとに用意されている)ごとに、実行される。なお、遅延回復処理は、他の処理に割り込まれることなく一気に処理を行う。
図7は、本発明の実施の形態に係る会議サーバにおける、クライアント端末への送信状態に基づく遅延状態の発生と回復処理を示すイメージの一例を示す図である。図7では、まず「3)下り音声データ取得(会議サーバ102からクライアント端末101へのミキシング音声データ送信)が原因で、遅延が発生する状況」を説明する。
(1)会議サーバ102は、クライアント端末101A、Bの双方から音声データを受信する。
(2)各々の対応するキューに、音声情報(音声データと送信済端末情報を関連付けた情報)を格納する。図7の3)では、それぞれ7つの音声情報が格納されている。
(3)クライアント端末101ごとの各キューから、音声データを取り出す。各クライアント端末101に送るための音声データをミキシングするため、クライアント端末101ごとに、自分自身を除く他のクライアント端末101のすべての音声データを取り出す。
(4)次にミキシングした音声データを、クライアント端末101Cに送信する。その際に、ネットワークの状態などにより、遅延が発生することがある。一方、クライアント端末101Bへ送信する音声(クライアント端末101Aとクライアント端末101Cの音声データをミキシングした音声データ)は遅延なく送信できたとする。その場合、クライアント端末101Bには送信済みだが、クライアント端末101Cには未送信のクライアント端末101Aの音声がキューに存在することになる。音声情報の送信済端末情報329に、未送信クライアント端末101が1つでもあれば、キューに格納された音声情報を削除することは出来ない。削除されなくとも、クライアント端末101Bでは、ミキシング/送信で無視されるデータとなるが、クライアント端末101Cでは無視できないため、クライアント端末101Aで再生される音声と、クライアント端末101Cで再生される音声との時間間隔が累積されてきて、徐々に会話の時間的な前後関係が不自然になることも想定される。
次に、図11をもちいて前述の遅延に対する「4)遅延回復方法」を説明する。
図11は、図7において遅延が発生した場合の遅延回復方法をキューのイメージを用いて説明する図の一例である。
例としてクライアント端末101Cに送信する音声で遅延が発生している場合(下り遅延フラグにて判断)、クライアント端末101Aおよびクライアント端末101Bの音声をキューから取出しミキシングする際に、無音データをスキップし、無音ではない音声データをミキシングすることで、遅延を回復する。なお、スキップした無音データに未送信端末が存在しない場合はキューから削除される。「4)」の図のキューには、B1〜B7のうち、無音データに対応する音声情報(「()」が付与されたもの)が4つあるため、これをスキップする。これらが、すべてのキュー(クライアント端末101ごとに用意されている)ごとに、実行される。なお、遅延回復処理は、他の処理に割り込まれることなく一気に処理を行う。
図8〜図10のフローチャートは、クライアント端末101、または会議サーバ102における遅延に対して、遅延回復の処理を説明するものである。
図8は、本発明の実施の形態に係るクライアント端末における、再生遅延回復処理のフローチャートの一例である。図8のフローチャートの各ステップ(S801〜S813)はクライアント端末101のCPU201により、また、S814〜S815は会議サーバ102のCPU201により実行される。図8のフローチャートは、図4のキューのイメージに対応する。
S801においては、会議サーバから送信されたミキシング済音声データを受け付ける。
S802においては、クライアント端末101の受信音声記憶部316のキューに、前記受信したミキシング済音声データを格納する(エンキュー)。
S803においては、前記キューに格納された音声データの数をカウントする。
S804においては、キューに所定の数の範囲を超える音声データが蓄積されているか判定する(再生遅延閾値に基づいて判定)。
S805においては、所定の数の範囲外音声データが蓄積されたか否かの判定に基づき分岐する。所定の数が範囲内である場合は、NOに進み、S810に進む。所定の数が範囲外である場合には、YESに進み<無音破棄>のルーチンを実行するためS806に進む。
このS806〜S809の処理は、他の処理に割り込まれることなく一気に処理を行う。ここで、クライアント端末101のキューの全ての音声データについてすべてのチェックを行う。
S806においては、キューの先頭の1つの音声データをデキューする(取り出す)。
S807においては、取り出した音声データが、無音データであるか否かをチェックする。
S808においては、チェックした音声データが無音であると判定された場合には、そのまま(音声データをキューに戻すことなく)次の音声データをチェックすべくS806に戻る。即ち、無音であると判定された音声データは破棄される。また、チェックした音声データが無音ではないと判定された場合には、S809において、(S806でキューから取り出した)音声データを、再度キューにエンキューする(格納する)。
前述の通り、キューはFIFOであり、また、S806〜S809の処理は、他の処理に割り込まれることなく、全ての音声データに対して一度ずつ処理を行うため、無音データは全て削除され、図4の3)に記載された左のキューから右のキューのように変わった後でも、残った音声データの時間的順序性は確保される。
以上で、受信音声記憶部316におけるミキシング音声データを受信したクライアント端末101のキューにおいて遅延が発生した場合には、その遅延回復処理を行った。
次にS810において、再度、キューに所定の数の範囲を超える音声データが蓄積されているかカウントする。
S811においては、所定の数の範囲を超える音声データが蓄積されているか判定する(再生遅延閾値と同じ値でもよいし、異なる値でもよい)。すなわち、遅延回復処理を完了した結果として十分な効果が得られたか否かを判断する。
S812においては、所定の数の範囲を超える音声データが蓄積されている場合(YESの場合)には、S813に進む。そうでない場合(NOの場合)には、S801(音声の受信)に戻る。なお、音声の再生は、非同期処理にて実行されおり、遅延回復処理とは無関係であるため、フローチャートとしては図示していない。
S813においては、会議サーバ102に、遅延回復処理の通知を行う。即ち、無音データを削除すると言う方式では、クライアント端末101においては、これ以上の対応は出来ない。従って、その場合は、会議サーバ側にも、遅延回復のための支援を要請することになる。また、会議サーバ102に、遅延回復処理の通知を行った後、S801に戻る。一方、会議サーバ102のS814においては、クライアント端末101のS813からの通知を受け取る。
S815においては、「下り遅延フラグ」をオンにして、クライアント端末101から回復支援処理の支援要請があることを示す。これにより、会議サーバ102で動作している「下り音声遅延回復」の処理が起動されるようにしても良い。ただし、「下り音声遅延回復」は、クライアント端末101からの要請の有無にかかわらず、独自のルーチンにおける判断で起動されても良い。
以上で、クライアント端末101における遅延回復処理に関するフローチャートの説明を完了する。
図9は、本発明の実施の形態に係る会議サーバにおける、クライアント端末からの受信状態に基づく遅延回復処理のフローチャートの一例である。図9のフローチャートの各ステップは会議サーバ102のCPU201により実行される。下記の処理は、会議サーバ102において、クライアント端末101ごとに用意された個々のキューごとに処理される。また、図9のフローチャートで説明する処理は、クライアント端末101から会議サーバ102が受信する音声データなので、上り音声データに関する音声遅延回復処理の説明である。図9のフローチャートは、図5および図6のイメージに対応する。
S901においては、クライアント端末101から音声データ(正確には音声データを含む通信用のパケット)を受信する。ここで、フローチャートを1つだけ記載しているが、具体的には、1つの受信部で受け付けて、そのデータから複数あるクライアント端末101のいずれから送信されたデータであるかを判別しても良いし、そもそも、会議サーバ102とクライアント端末101の接続が確立されると“クライアント端末101ごと”に受信部がマルチスレッドで生成されて、特定のクライアント端末101の受信部としてもよい。ただし、S902以降では、受信部でクライアント端末101が識別されているものとして、識別された1つのクライアント端末101に対応する処理とする。
S902においては、S901で受信した音声データをミキシング用音声記憶部326の識別された1つのクライアント端末101に対応するキューに、既に音声情報(前述のパケット内の音声データと、前述の送信済端末情報329)が幾つ格納されているかをチェックする。
S903においては、前記音声情報の数が、サーバ閾値記憶部327の上り遅延閾値に従って所定数を上回っているか否かを判断する。
S904においては、キューにおける音声情報の数が、上り遅延閾値に従って所定数を上回っている、と判定された場合(YESの場合)には、S905に進む。上回っていない、と判定された場合(NOの場合)には、S909に進む。
S909においては、キューに格納された音声情報の数が、上り遅延閾値に従って所定数を上回っていない、即ち、まだ(遅延回復処理をすることなく)音声情報を格納できると判断されるため、キューに格納(エンキュー)して、次の音声受信のためS901に戻る。
S905に進んだ場合には、S905からS908の処理を、キューに格納されている全ての音声情報に対して繰り返す。その間、S905からS908のループは抜けない。
上り遅延閾値に従って所定数を上回っている、と判定された場合には、S905において、キューから1つの音声情報を抽出(デキュー。キューから取り出すこと)する。
S906においては、S905において抽出した音声情報に含まれる音声データが、“無音データ”であるか否かを判定する。 S907においては、S905において抽出した音声情報に含まれる音声データが“無音データ”である場合(YESの場合)、S905に戻る。すなわち、デキューした音声情報は無音データであるので、キューに戻さない(削除する)。
S908においては、デキューした音声情報は無音データではないので、エンキューする(キューの最後に戻す)。
これらのS905からS908の処理により、キューの中の無音データの数分だけ音声情報が削減されることにより、音声遅延を削減するという効果を得ることができる。以上で、図9のフローチャートの説明を完了する。
図10は、本発明の実施の形態に係るクライアント端末への送信状態に基づく遅延回復処理のフローチャートの一例である。図10のフローチャートの各ステップは会議サーバ102のCPU201により実行される。図10のフローチャートは、会議サーバ102のミキシング用音声記憶部326における複数のクライアント端末101のキューにおける音声情報(に含まれる音声データ)をミキシングして、クライアント端末101に送信する処理である。会議サーバ102からクライアント端末101に送信するため、上り音声データである。図7のキューのイメージに対応する。
あるクライアント端末101に送信するミキシング音声データに、その端末自身の音声データはミキシングされていない。従って図10のフローチャートで処理するミキシング用音声記憶部326のキューは、送信しようとするクライアント端末101以外のキューに対応するキュー1つずつに対して処理される。
S1001においては、キューから1つの音声情報を抽出する(デキュー)。
S1002においては、図8のS815で“オン”にされる下り遅延フラグをチェックする。
S1003においては、下り遅延フラグが“オン”である場合(YESの場合)には、S1004に進む。すなわち、クライアント端末101側から、会議サーバ102側での遅延回復処理が要求されているためである。また、“オフ”である場合(NO)の場合には、S1007に進む。
なお、S1002において、下り遅延フラグをチェックするのではなく、上り時のチェック(サーバ閾値記憶部327における上り遅延閾値)と同様に、閾値を用いても良い。この閾値を、下り遅延閾値とし、キューにおける音声情報の数が、下り音声閾値に基づいて所定の数に達したらS1003においてS1004(YESの方向)、達していない場合にはS1007に進むようにしても良い。
S1004においては、S1001においてデキューした音声情報に含まれる音声データが、無音データであるか否かをチェックする。
S1005においては、S1004においてチェックした音声データが“無音データ”である場合(YESの場合)には、S1006に進み、次の音声情報をキューから取り出して、S1004に戻り処理を繰り返す。この繰り返しにより、“無音データ”を無視した処理が進んでいく。
一方、S1004においてチェックした音声データが“無音データ”ではない場合(NOの場合)には、S1007に進み、前述の通りミキシング音声として、S1008によりクライアント端末101に送信する。S1007においては、ミキシングに使用した音声データは、不要なデータとしてキューに戻していない。しかし、実際には、他のクライアント端末101で使用する必要があるかも知れないため、“全てのクライアント端末(この音声データを送信してきたクライアント端末を除く)で、この音声データを送信済みではない”場合には、改めてエンキューする必要がある。 以上で、図10のフローチャートの説明を完了する。
なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な構成や内容で構成されることは言うまでもない。
以上、一実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明におけるプログラムは、図8〜図10のフローチャートの処理方法をコンピュータが実行可能なプログラムであり、本発明の記憶媒体は図8〜図10のフローチャートの処理方法をコンピュータが実行可能なプログラムが記憶されている。なお、本発明におけるプログラムは図8〜図10のフローチャートの各装置の処理方法ごとのプログラムであってもよい。
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記憶した記録媒体は本発明を構成することになる。
コンピュータプログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク、ソリッドステートドライブ等を用いることができる。
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
101 クライアント端末
102 会議サーバ
103 ネットワーク
311 音声入力部
312 音声送信部
313 ミキシング音声受信部
314 受信音声チェック部
315 音声再生部
316 受信音声記憶部
317 端末閾値記憶部
321 音声受信部
322 上りチェック部
323 ミキシング音声送信部
324 下りチェック部
325 ミキシング部
326 ミキシング用音声記憶部
327 サーバ閾値記憶部
328 音声データ
329 送信済端末情報

Claims (15)

  1. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と通信可能な、前記クライアント端末から受信した所定の単位の音声データを、当該音声データの送信元のクライアント端末ごとに合成前音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置であって、
    前記蓄積記憶部に蓄積された、前記クライアント端末ごとの合成前音声データ群から取得された所定の単位の音声データを用いて合成データを生成する合成データ生成手段と、
    前記合成データ生成手段により生成された前記合成データを、複数のクライアント端末のうち、送信先であるクライアント端末に送信する送信手段と、
    前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には合成に用いない音声データを、前記蓄積記憶部に蓄積された前記クライアント端末ごとの合成前音声データ群から特定する特定手段と、
    を備え、
    前記合成データ生成手段は、前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には、前記合成前音声データ群において前記特定手段により特定された前記合成に用いない音声データをスキップし、合成すべき次の音声データを取得して、前記通知を受け付けたクライアント端末用の合成データを生成することを特徴とする情報処理装置。
  2. 前記合成データ生成手段は、前記合成データを送信する送信先のクライアント端末ごとに、前記合成前音声データ群から音声データを取得して、送信先のクライアント端末用の前記合成データを生成し、
    前記送信手段は、送信先のクライアント端末用に生成された合成データを対象のクライアント端末に送信し、
    前記特定手段は、前記合成前音声データ群から、前記送信手段による前記合成データの送信による遅延がある場合には合成に用いない音声データを特定し、
    前記合成データ生成手段は、前記特定手段により特定された前記合成に用いない音声データをスキップし、合成すべき次の音声データを取得して前記クライアント端末用の合成データを生成することを特徴とする請求項に記載の情報処理装置。
  3. 前記合成に用いない音声データとは、音声が含まれていないとみなされる無音データであることを特徴とする請求項1又は2のいずれか1項に記載の情報処理装置。
  4. 前記音声が含まれていないとみなされる無音データとは、無音であることを示す付加情報が付加された音声データであることを特徴とする請求項に記載の情報処理装置。
  5. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と通信可能な、前記クライアント端末から受信した所定の単位の音声データを、当該音声データの送信元のクライアント端末ごとに合成前音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置の制御方法であって、
    前記蓄積記憶部に蓄積された、前記クライアント端末ごとの合成前音声データ群から取得された所定の単位の音声データを用いて合成データを生成する合成データ生成ステップと、
    前記合成データ生成ステップにより生成された前記合成データを、複数のクライアント端末のうち、送信先であるクライアント端末に送信する送信ステップと、
    前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には合成に用いない音声データを、前記蓄積記憶部に蓄積された前記クライアント端末ごとの合成前音声データ群から特定する特定ステップと、
    を含み、
    前記合成データ生成ステップは、前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には、前記合成前音声データ群において前記特定ステップにより特定された前記合成に用いない音声データをスキップし、合成すべき次の音声データを取得して、前記通知を受け付けたクライアント端末用の合成データを生成することを特徴とする制御方法。
  6. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と通信可能な、前記クライアント端末から受信した所定の単位の音声データを、当該音声データの送信元のクライアント端末ごとに合成前音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置で実行可能なプログラムであって、
    前記情報処理装置を、
    前記蓄積記憶部に蓄積された、前記クライアント端末ごとの合成前音声データ群から取得された所定の単位の音声データを用いて合成データを生成する合成データ生成手段と、
    前記合成データ生成手段により生成された前記合成データを、複数のクライアント端末のうち、送信先であるクライアント端末に送信する送信手段と、
    前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には合成に用いない音声データを、前記蓄積記憶部に蓄積された前記クライアント端末ごとの合成前音声データ群から特定する特定手段として機能させ、
    前記合成データ生成手段を、前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には、前記合成前音声データ群において前記特定手段により特定された前記合成に用いない音声データをスキップし、合成すべき次の音声データを取得して、前記通知を受け付けたクライアント端末用の合成データを生成する手段として機能させるためのプログラム。
  7. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と、前記クライアント端末から受信した所定の単位の音声データを、当該音声データの送信元のクライアント端末ごとに合成前音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置とを含む情報処理システムであって、
    前記蓄積記憶部に蓄積された、前記クライアント端末ごとの合成前音声データ群から取得された所定の単位の音声データを用いて合成データを生成する合成データ生成手段と、
    前記合成データ生成手段により生成された前記合成データを、複数のクライアント端末のうち、送信先であるクライアント端末に送信する送信手段と、
    前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には合成に用いない音声データを、前記蓄積記憶部に蓄積された前記クライアント端末ごとの合成前音声データ群から特定する特定手段と、
    を備え、
    前記合成データ生成手段は、前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には、前記合成前音声データ群において前記特定手段により特定された前記合成に用いない音声データをスキップし、合成すべき次の音声データを取得して、前記通知を受け付けたクライアント端末用の合成データを生成することを特徴とする情報処理システム。
  8. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と、前記クライアント端末から受信した所定の単位の音声データを、当該音声データの送信元のクライアント端末ごとに合成前音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置とを含む情報処理システムの制御方法であって、
    前記蓄積記憶部に蓄積された、前記クライアント端末ごとの合成前音声データ群から取得された所定の単位の音声データを用いて合成データを生成する合成データ生成ステップと、
    前記合成データ生成ステップにより生成された前記合成データを、複数のクライアント端末のうち、送信先であるクライアント端末に送信する送信ステップと、
    前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には合成に用いない音声データを、前記蓄積記憶部に蓄積された前記クライアント端末ごとの合成前音声データ群から特定する特定ステップと、
    を含み、
    前記合成データ生成ステップは、前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には、前記合成前音声データ群において前記特定ステップにより特定された前記合成に用いない音声データをスキップし、合成すべき次の音声データを取得して、前記通知を受け付けたクライアント端末用の合成データを生成することを特徴とする制御方法。
  9. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と、前記クライアント端末から受信した所定の単位の音声データを、当該音声データの送信元のクライアント端末ごとに合成前音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置とを含む情報処理システムを制御するプログラムであって、
    前記情報処理システムを、
    前記蓄積記憶部に蓄積された、前記クライアント端末ごとの合成前音声データ群から取得された所定の単位の音声データを用いて合成データを生成する合成データ生成手段と、
    前記合成データ生成手段により生成された前記合成データを、複数のクライアント端末のうち、送信先であるクライアント端末に送信する送信手段と、
    前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には合成に用いない音声データを、前記蓄積記憶部に蓄積された前記クライアント端末ごとの合成前音声データ群から特定する特定手段として機能させ、
    前記合成データ生成手段を、前記クライアント端末から前記合成データの送信による遅延がある旨の通知を受け付けた場合には、前記合成前音声データ群において前記特定手段により特定された前記合成に用いない音声データをスキップし、合成すべき次の音声データを取得して、前記通知を受け付けたクライアント端末用の合成データを生成する手段として機能させるためのプログラム。
  10. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と通信可能な、前記クライアント端末から受信した所定の単位の音声データを音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置であって、
    前記音声データ群から取得された所定の単位の音声データを、送信先であるクライアント端末に送信する送信手段と、
    前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には送信しない音声データを、前記音声データ群から特定する特定手段と、
    を備え、
    前記送信手段は、前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には、前記音声データ群から、前記特定手段により特定された音声データをスキップして次の音声データを取得し、前記通知を受け付けたクライアント端末に送信することを特徴とする情報処理装置。
  11. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と通信可能な、前記クライアント端末から受信した所定の単位の音声データを音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置の制御方法であって、
    前記音声データ群から取得された所定の単位の音声データを、送信先であるクライアント端末に送信する送信ステップと、
    前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には送信しない音声データを、前記音声データ群から特定する特定ステップと、
    含み、
    前記送信ステップは、前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には、前記音声データ群から、前記特定ステップにより特定された音声データをスキップして次の音声データを取得し、前記通知を受け付けたクライアント端末に送信することを特徴とする制御方法。
  12. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と通信可能な、前記クライアント端末から受信した所定の単位の音声データを音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置を制御するプログラムであって、
    前記情報処理装置を、
    前記音声データ群から取得された所定の単位の音声データを、送信先であるクライアント端末に送信する送信手段と、
    前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には送信しない音声データを、前記音声データ群から特定する特定手段として機能させ、
    前記送信手段を、前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には、前記音声データ群から、前記特定手段により特定された音声データをスキップして次の音声データを取得し、前記通知を受け付けたクライアント端末に送信する手段として機能させるためのプログラム。
  13. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と、前記クライアント端末から受信した所定の単位の音声データを音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置とを含む情報処理システムであって、
    前記音声データ群から取得された所定の単位の音声データを、送信先であるクライアント端末に送信する送信手段と、
    前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には送信しない音声データを、前記音声データ群から特定する特定手段と、
    を備え、
    前記送信手段は、前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には、前記音声データ群から、前記特定手段により特定された音声データをスキップして次の音声データを取得し、前記通知を受け付けたクライアント端末に送信することを特徴とする情報処理システム。
  14. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と、前記クライアント端末から受信した所定の単位の音声データを音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置とを含む情報処理システムの制御方法であって、
    前記音声データ群から取得された所定の単位の音声データを、送信先であるクライアント端末に送信する送信ステップと、
    前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には送信しない音声データを、前記音声データ群から特定する特定ステップと、
    を含み、
    前記送信ステップは、前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には、前記音声データ群から、前記特定ステップにより特定された音声データをスキップして次の音声データを取得し、前記通知を受け付けたクライアント端末に送信することを特徴とする制御方法。
  15. 入力された音声データを所定の単位で情報処理装置に送信するクライアント端末と、前記クライアント端末から受信した所定の単位の音声データを音声データ群として蓄積して記憶する蓄積記憶部を備える情報処理装置とを含む情報処理システムを制御するプログラムであって、
    前記情報処理システムを、
    前記音声データ群から取得された所定の単位の音声データを、送信先であるクライアント端末に送信する送信手段と、
    前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には送信しない音声データを、前記音声データ群から特定する特定手段として機能させ、
    前記送信手段を、前記クライアント端末から前記音声データの送信による遅延がある旨の通知を受け付けた場合には、前記音声データ群から、前記特定手段により特定された音声データをスキップして次の音声データを取得し、前記通知を受け付けたクライアント端末に送信する手段として機能させるためのプログラム。
JP2013204509A 2013-09-30 2013-09-30 情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム Active JP6417652B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013204509A JP6417652B2 (ja) 2013-09-30 2013-09-30 情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013204509A JP6417652B2 (ja) 2013-09-30 2013-09-30 情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018189747A Division JP6652726B2 (ja) 2018-10-05 2018-10-05 情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2015070515A JP2015070515A (ja) 2015-04-13
JP2015070515A5 JP2015070515A5 (ja) 2017-03-16
JP6417652B2 true JP6417652B2 (ja) 2018-11-07

Family

ID=52836787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013204509A Active JP6417652B2 (ja) 2013-09-30 2013-09-30 情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP6417652B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10122767B2 (en) * 2015-05-29 2018-11-06 Nagravision S.A. Systems and methods for conducting secure VOIP multi-party calls

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2970645B2 (ja) * 1998-03-11 1999-11-02 日本電信電話株式会社 多地点接続会議システム構成方法及び多地点接続会議システム及びサーバ装置及びクライアント装置及び多地点接続会議システム構成プログラムを格納した記憶媒体
US6940826B1 (en) * 1999-12-30 2005-09-06 Nortel Networks Limited Apparatus and method for packet-based media communications
JP2002077233A (ja) * 2000-08-25 2002-03-15 Matsushita Electric Ind Co Ltd リアルタイム情報受信装置
JP2003023499A (ja) * 2001-07-10 2003-01-24 Matsushita Electric Ind Co Ltd 会議サーバ装置および会議システム
JP2008306541A (ja) * 2007-06-08 2008-12-18 Yamaha Corp 会議通信制御装置
JP2008099314A (ja) * 2007-11-07 2008-04-24 Fujitsu Ltd サーバおよび音声信号収集配信方法
JP2012124689A (ja) * 2010-12-08 2012-06-28 Mitsubishi Electric Corp 通信システム、送信側装置および受信側装置

Also Published As

Publication number Publication date
JP2015070515A (ja) 2015-04-13

Similar Documents

Publication Publication Date Title
CN103258379B (zh) 用于调节重叠媒体消息的系统和方法
US10423382B2 (en) Teleconference recording management system
US8441515B2 (en) Method and apparatus for minimizing acoustic echo in video conferencing
US12458875B2 (en) Peer to peer communication system and method
KR101528367B1 (ko) 사운드 제어 시스템 및 사운드 제어 방법
US11089164B2 (en) Teleconference recording management system
JP6417652B2 (ja) 情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム
US12243550B2 (en) Speech image providing method and computing device for performing the same
US20240430365A1 (en) Systems and methods for improved audio/video conferences
JP6652726B2 (ja) 情報処理装置、情報処理システム、情報処理装置の制御方法、情報処理システムの制御方法、およびプログラム
CN108401126A (zh) 声音共享装置、终端及声音共享方法
US9350943B2 (en) Video picker
JP2005269498A (ja) ビデオ会議システム、ビデオ会議端末装置、およびその制御方法ならびにそのためのビデオ会議端末装置制御用プログラム
US20230005202A1 (en) Speech image providing method and computing device for performing the same
JP2019176375A (ja) 動画出力装置、動画出力方法および動画出力プログラム
WO2023032461A1 (ja) 会議支援システム、会議支援方法、および会議支援プログラム
US12536727B2 (en) Speech image providing method and computing device for performing the same
US20240282017A1 (en) Information processing device and information processing method
JP2020098961A (ja) 情報処理装置、その制御方法、およびプログラム
US11470362B1 (en) Providing audio data for a video frame
JP4531013B2 (ja) 映像音声会議システムおよび端末装置
CN119211478A (zh) 一种视频会议中录制音频的方法、装置和设备
CN103870234B (zh) 一种混音方法及其装置
JP2005311916A (ja) ストリームデータ配信装置、ストリームデータ配信方法およびそのプログラム
JP2014067074A (ja) 録音システム、録音プログラム及び録音方法

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20150410

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160928

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20161101

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20161101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170814

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180911

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180924

R151 Written notification of patent or utility model registration

Ref document number: 6417652

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181031

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250