Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4359968B2 - Communication apparatus and method, and recording medium - Google Patents
[go: Go Back, main page]

JP4359968B2 - Communication apparatus and method, and recording medium - Google Patents

Communication apparatus and method, and recording medium Download PDF

Info

Publication number
JP4359968B2
JP4359968B2 JP23224899A JP23224899A JP4359968B2 JP 4359968 B2 JP4359968 B2 JP 4359968B2 JP 23224899 A JP23224899 A JP 23224899A JP 23224899 A JP23224899 A JP 23224899A JP 4359968 B2 JP4359968 B2 JP 4359968B2
Authority
JP
Japan
Prior art keywords
image data
biological information
size
display
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23224899A
Other languages
Japanese (ja)
Other versions
JP2001057672A5 (en
JP2001057672A (en
Inventor
哲二郎 近藤
淳一 石橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP23224899A priority Critical patent/JP4359968B2/en
Publication of JP2001057672A publication Critical patent/JP2001057672A/en
Publication of JP2001057672A5 publication Critical patent/JP2001057672A5/ja
Application granted granted Critical
Publication of JP4359968B2 publication Critical patent/JP4359968B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、通信装置および方法、並びに記録媒体に関し、特に、ユーザの生体情報に対応して画像の表示や音声の出力を制御する通信装置および方法、並びに記録媒体に関する。
【0002】
【従来の技術】
現在、遠隔にいる者の画像および音声を、ネットワークを介して相互に通信し、その映像および音声を再生することより、あたかも1つのテーブルを囲んでるかのように会議を行うことができる遠隔会議システムや、あたかも会話の相手が目の前にいるかのように会話することができるテレビジョン電話システムが存在する。
【0003】
【発明が解決しようとする課題】
ところで、現実の会議や会話においては、自分自身が持つ、会議の相手や会話の相手(以下、会話相手と称する)に対して持つ感情によって、会話相手との距離を調整し、快適に会議や会話を行うようにする。例えば、会話相手と親しい場合、その会話相手に近寄って(近くの席に座って)会話をするが、あまり親しくない場合、少し離れて(離れた席に座って)会話をする。つまり、会話相手が近くにいることを快く感じる場合、その者に近寄り、一方、会話相手がそばにすることに不快を感じる場合(例えば、緊張する場合)、その者から離れるようにする。
【0004】
しかしながら、上述した従来の遠隔会議システムやテレビジョン電話システムにおいては、会話相手が予め決められた倍率で撮像され、その映像が一定の大きさで表示されるようになされている。すなわち、これらのシステムでは、会話相手と近寄って会話しているかのように、その映像が大きく表示されたり、また離れて会話しているかのように、その映像が小さく表示されない。結局、このことより、利用者が、快適に会議や会話を行うことがきない課題があった。
【0005】
また音量についても、例えば、ボリュームダイヤルを操作して調整することが可能であるが、自分自身で操作する必要があり、利用者が快適に会議や会話を行うことができない課題があった。
【0006】
本発明はこのような状況に鑑みてなされたものであり、相手の画像や音声を、最適に調整することができるようにするものである。
【0007】
【課題を解決するための手段】
本発明の通信装置は、他の通信装置と相互に画像データおよび音声データを通信する通信装置において、前記他の通信装置から送信されてきた前記音声データを受信する第1の受信手段と、前記第1の受信手段により受信された前記音声データの出力を制御する出力制御手段と、前記他の通信装置から送信されてきた前記画像データを受信する第2の受信手段と、視線ゆらぎの大きさ、瞳孔の径の大きさ、発汗量、心拍数、または血圧の少なくとも1つの生体情報を検出する検出手段と、前記検出手段により検出された前記生体情報に基づく判断を行い、その判断結果に基づいて前記第2の受信手段により受信された前記画像データの表示の大きさを制御する表示制御手段とを備える。
【0009】
前記出力制御手段は、前記検出手段により検出された前記生体情報に基づく判断を行い、その判断結果に基づいて前記第1の受信手段により受信された前記音声データの出力の増幅率を制御するようにすることができる。
【0012】
前記生体情報と対応して画像データを記憶する記憶手段をさらに備え、前記表示制御手段は、前記記憶手段に前記画像データに対応して記憶されている前記生体情報に基づく判断を行い、その判断結果に基づいて前記画像データの表示の大きさを制御するようにすることができる。
【0013】
前記生体情報と対応して画像データを記憶する記憶手段をさらに備え、前記出力制御手段は、前記記憶手段に前記画像データに対応して記憶されている前記生体情報に基づく判断を行い、その判断結果に基づいて前記音声データの出力の増幅率を制御するようにすることができる。
【0014】
本発明の通信方法は、他の通信装置と相互に画像データおよび音声データを通信する通信装置の通信方法において、前記他の通信装置から送信されてきた前記音声データを受信する第1の受信ステップと、前記第1の受信ステップの処理で受信された前記音声データの出力を制御する出力制御ステップと、前記他の通信装置から送信されてきた前記画像データを受信する第2の受信ステップと、視線ゆらぎの大きさ、瞳孔の径の大きさ、発汗量、心拍数、または血圧の少なくとも1つの生体情報を検出する検出ステップと、前記検出ステップの処理で検出された前記生体情報に基づく判断を行い、その判断結果に基づいて前記第2の受信ステップの処理で受信された前記画像データの表示の大きさを制御する表示制御ステップとを含む。
【0015】
本発明の記録媒体は、他の通信装置と相互に画像データおよび音声データを通信する場合の通信用プログラムであって、前記他の通信装置から送信されてきた前記音声データを入力する第1の入力ステップと、前記第1の入力ステップの処理で入力された前記音声データの出力を制御する出力制御ステップと、前記他の通信装置から送信されてきた前記画像データを入力する第2の入力ステップと、視線ゆらぎの大きさ、瞳孔の径の大きさ、発汗量、心拍数、または血圧の少なくとも1つの生体情報を検出する検出ステップと、前記検出ステップの処理で検出された前記生体情報に基づく判断を行い、その判断結果に基づいて前記第2の入力ステップの処理で入力された前記画像データの表示の大きさを制御する表示制御ステップとを含む処理をコンピュータに実行させるためのプログラムを記録しているコンピュータが読み取り可能な記録媒体。
【0016】
本発明の通信装置および方法、並びに記録媒体においては、他の通信装置から送信されてきた音声データが受信され、受信された音声データの出力が制御され、他の通信装置から送信されてきた画像データが受信され、視線ゆらぎの大きさ、瞳孔の径の大きさ、発汗量、心拍数、または血圧の少なくとも1つの生体情報が検出され、検出された生体情報に基づく判断が行われ、その判断結果に基づいて受信された画像データの表示の大きさが制御される。
【0025】
【発明の実施の形態】
図1は、本発明を適用した遠隔会議システムの構成例を示している。この遠隔会議システムにおいては、2個の遠隔会議装置1−1,1−2(以下、遠隔会議装置1−1,1−2を個々に区別する必要がない場合、単に遠隔会議装置1と記述する。他の装置についても同様である)がネットワーク2を介して接続されている。遠隔会議装置1−1は、会議に参加する参加者Aの画像データおよび音声データを、ネットワーク2を介して遠隔会議装置1−2に送信したり、遠隔会議装置1−2から送信されてきた画像データおよび音声データを再生する。
【0026】
遠隔会議装置1−2は、会議に参加する参加者Bの画像データおよび音声データを、ネットワーク2を介して遠隔会議装置1−1に送信したり、遠隔会議装置1−1から送信されてきた画像データおよび音声データを再生する。
【0027】
図2は、遠隔会議装置1−1の外観の構成例を示している。遠隔会議装置1−1は、再生装置11、ビデオカメラ12、マイクロフォン13、および生体情報検出装置14から構成されている。
【0028】
再生装置11は、ディスプレイ21およびスピーカ22から構成されている。ディスプレイ21は、遠隔会議装置1−2から送信された画像データに対応する映像(例えば、参加者Bの映像)を、生体情報検出装置14からの生体情報に基づいて所定の大きさ(図2の例では、表示スケールBの大きさ)で表示する。スピーカ22は、遠隔会議装置1−2から送信された音声データに対応する音声(例えば、参加者Bの発言)を出力する。
【0029】
ビデオカメラ12は、参加者Aの顔の部分を撮像する。マイクロフォン13は、参加者Aの発言を集音する。ビデオカメラ12により撮像された映像およびマイクロフォン13により集音された音声は、遠隔会議装置1−2に送信される。
【0030】
生体情報検出装置14は、参加者Aの生体情報を検出する装置で、この例の場合、図3に示すように、光学部31を有する、眼鏡に類似した装置である。生体情報とは、参加者Aが快い感情を有しているか、または不快感を有しているかを示す情報であり、この例の場合、参加者Aの視線のゆらぎの大きさでる。人間(参加者A)は、不快感を有しているとき、視線が大きく動き(視線ゆらぎが大きく)、また快い感情を有しているとき、視線があまり動かない(視線ゆらぎが小さい)。
【0031】
参加者Aは、生体情報検出装置14を、その光学部31が両目を覆うようにして装着する。光学部31は、参加者Aの視線ゆらぎの大きさを検出し、再生装置11に供給する。
【0032】
次に、再生装置11の第1の実施の形態の構成を説明する。図4は、再生装置11の第1の実施の形態の表示スケール調整処理を行う部分の構成例を示している。通信部41は、遠隔会議装置1−2から供給される画像データ(参加者Bの映像の画像データ)を受信し、制御部42に供給する。通信部43は、生体情報検出装置14からの生体情報(視線ゆらぎの大きさ)を受信し、制御部42に供給する。なお、生体情報がアナログ信号で再生装置11に供給される場合、通信部43は、A/D変換器(図示せぬ)などを有し、それを利用してアナログ信号(生体情報)をデジタル信号に変換して制御部42に供給する。
【0033】
制御部42は、通信部41から供給された画像データを表示制御部44に供給するとともに、その画像データに対応する映像の表示スケールを、通信部43からの生体情報に基づいて決定し、表示制御部44に通知する。
【0034】
表示制御部44は、制御部42から供給される画像データを、制御部42から通知された表示スケールでディスプレイ21に表示させる。
【0035】
遠隔会議装置1−2は、遠隔会議装置1−1と同様の構成を有するので、その図示と説明は省略する。
【0036】
次に、遠隔会議装置1−1における表示スケール調整処理の処理手順を、図5のフローチャートを参照して説明する。図2に示すように、参加者Aが生体情報検出装置14を装着している状態で、ディスプレイ21に参加者Bの映像が表示スケールB(初期状態の表示スケール)で表示されると、ステップS1において、生体情報検出装置14は、参加者Aの視線ゆらぎの大きさを検出し、検出結果を再生装置11に供給する。
【0037】
ステップS2において、再生装置11の制御部42は、通信部43を介して、生体情報検出装置14から供給された視線ゆらぎの大きさを受信し、参加者Bの映像の表示スケールを決定する。この表示スケール決定処理の詳細は、図6のフローチャートに示されている。
【0038】
すなわち、ステップS11において、制御部42は、視線ゆらぎの大きさが大きさAより大きいか否かを判定し、大きいと判定した場合、ステップS12に進み、表示スケールを表示スケールAに決定する。この例の場合、表示スケールAは、表示スケールBの約80%のスケールとする。
【0039】
ステップS11において、視線ゆらぎの大きさが大きさAより大きくない(それ以下である)と判定された場合、ステップS13に進み、制御部42は、視線ゆらぎの大きさが大きさB(大きさAよりも小さい大きさ)より大きいか否かを判定し、それより大きいと判定した場合(大きさA以下で大きさBより大きい場合)、ステップS14に進み、表示スケールを表示スケールB(初期状態の表示スケール)に決定する。
【0040】
ステップS13において、視線ゆらぎの大きさが大きさBより大きくない(それ以下である)と判定された場合、ステップS15に進み、制御部42は、表示スケールを表示スケールCに決定する。この例の場合、表示スケールCは、表示スケールBの約120%のスケールとする。
【0041】
ステップS12、ステップS14、またはステップS15において表示スケールが決定されると、表示スケール決定処理は完了し、図5のステップS3に進む。
【0042】
ステップS3において、再生装置11の制御部42は、表示制御部44に、ステップS2で決定された表示スケールを通知する。ステップS4において、表示制御部44は、制御部42から通知された表示スケールに基づいて、通信部41により受信された参加者Bの映像をディスプレイ21に表示させる。
【0043】
例えば、ステップS2において、検出された視線ゆらぎの大きさが大きさAより大きく、表示スケールが表示スケールAに決定された場合、参加者Bの映像は、図7に示すように、表示スケールBで表示された場合に比べ(図2)小さく表示される。一方、検出された視線ゆらぎの大きさが大きさB以下で、表示スケールが表示スケールCに決定された場合、参加者Bの映像は、図8に示すように、表示スケールBで表示された場合に比べ、大きく表示される。
【0044】
すなわち、生体情報が、参加者Aが不快を感じていることを示している場合(この例では、視線ゆらぎの大きさが大きい場合)、参加者Aが参加者Bと少し離れて座っているかのように、参加者Bの映像が小さく表示される(図7)。逆に、生体情報が、参加者Aが快いと感じていることを示している場合(この例では、視線ゆらぎの大きさが小さい場合)、参加者Aが参加者Bのそばに座っているかのように、参加者Bの映像が大きく表示される(図8)。
【0045】
なお、表示された映像とそのとき検出された生体情報(視線ゆらぎの大きさ)を対応させて記憶しておき、次回その映像が表示される場合、それに対応して記憶されている生体情報に基づいて表示スケールを決定し、決定した表示スケールでその映像を表示するようにすることもできる。
【0046】
なお、以上の例においては、表示スケールAが、表示スケールBの80%で、表示スケールCが、その120%である場合を例として説明したが、各表示スケールの値は、映像の大きさと視線ゆらぎ(快/不快)の関係を予め計測し、その計測結果に基づいて設定することができる。
【0047】
次に、再生装置11の第2の実施の形態の構成を説明する。図9は、再生装置11の第2の実施の形態の表示スケール調整処理および音声調整処理を行う部分の構成例を示している。この再生装置11には、図4の再生装置11の通信部41に代えて通信部51が、制御部42に代えて制御部51が設けられ、そして音声制御部53がさらに設けられている。
【0048】
通信部51は、遠隔会議装置1−2から供給される画像データの他、音声データも受信し、制御部52に供給する。制御部52は、通信部51から供給された画像データを表示制御部44に、そして音声データを音声制御部53に供給する。制御部52は、生体情報検出装置14からの生体情報を通信部43を介して受信し、図4の制御部42の場合と同様に表示スケールを決定し、表示制御部44に通知する。制御部52はまた、音声データの増幅率を、その生体情報に基づいて決定し、音声制御部53に通知する。
【0049】
音声制御部53は、制御部52から供給された音声データを、制御部52から通知された増幅率で増幅し、スピーカ22から出力させる。
【0050】
次に、遠隔会議装置1−1における音声調整処理の処理手順を、図10のフローチャートを参照して説明する。参加者Aが、図2に示すように生体情報検出装置14を装着している状態において、ディスプレイ21に参加者Bの映像が表示スケールBで表示されると(または、スピーカ22から、増幅率B(初期値)で増幅された参加者Bの音声が出力されると)、ステップS21において、生体情報検出装置14は、参加者Aの視線ゆらぎの大きさ検出し、検出結果を再生装置11に供給する。
【0051】
ステップS22において、再生装置11の制御部52は、通信部43を介して生体情報検出装置14からの視線ゆらぎの大きさを受信し、受信した視線ゆらぎの大きさに基づいて、増幅率を決定する。この増幅率決定処理の詳細は、図11のフローチャートに示されている。
【0052】
すなわち、ステップS31において、制御部52は、視線ゆらぎの大きさが大きさAより大きいか否かを判定し、大きいと判定した場合、ステップS32に進み、増幅率を増幅率Aに決定する。この例の場合、増幅率Aは、増幅率Bの約80%の値とする。
【0053】
ステップS31において、視線ゆらぎの大きさが大きさAより大きくない(それ以下である)と判定された場合、ステップS33に進み、制御部52は、視線ゆらぎの大きさが大きさBより大きいか否かを判定し、それより大きいと判定した場合(大きさA以下で大きさBより大きい場合)、ステップS34に進み、増幅率を増幅率B(初期値)に決定する。
【0054】
ステップS33において、視線ゆらぎの大きさが大きさBより大きくない(それ以下である)と判定された場合、ステップS35に進み、制御部52は、増幅率を増幅率Cに決定する。この例の場合、増幅率Cは、増幅率Bの約120%の値とする。
【0055】
ステップS32、ステップS34、またはステップS35において増幅率が決定されると、増幅率決定処理は完了し、図10のステップS23に進む。
【0056】
ステップS23において、制御部52は、音声制御部53に、ステップS22で決定された増幅率を通知する。ステップS24において、音声制御部53は、制御部52から通知された増幅率に基づいて、通信部51により受信された音声データを増幅し、スピーカ22から出力する。
【0057】
例えば、ステップS22において、検出された視線ゆらぎの大きさが大きさAより大きく、増幅率が増幅率Aに決定されてそれで音声データが増幅された場合、参加者Bの音声は、増幅率Bで増幅された場合に比べ小さい音量でスピーカ22から出力される。一方、検出された視線ゆらぎの大きさが大きさBより小さく、増幅率が増幅率Cに決定されてそれで音声データが増幅された場合、参加者Bの音声は、増幅率Bで増幅された場合に比べ、大きい音量でスピーカ22から出力される。
【0058】
すなわち、生体情報が、参加者Aが不快を感じていることを示している場合(この例では、視線ゆらぎの大きさが大きい場合)、参加者Aが参加者Bと離れて会話しているかのように、参加者Bの音声が小さい音量で出力される。逆に、生体情報が、参加者Aが快いと感じていることを示している場合(この例では、視線ゆらぎの大きさが小さい場合)、参加者Aが参加者Bに近寄って会話しているかのように、参加者Bの音声が大きな音量で出力される。
【0059】
なお、以上においては、増幅率が調整される場合を例として説明したが、音声データのイコライズを調整するようにすることもできる。
【0060】
また、表示された映像(又は音声)とそのとき検出された生体情報(視線ゆらぎ)を対応させて記憶しておき、次回その映像(又は音声)が表示される場合、それに対応して記憶されている生体情報に基づく増幅率でその音声を増幅するようにすることもできる。
【0061】
また、以上においては、簡単のために、音声調整処理についてのみ説明したが、表示スケール処理と音声調整処理を平行して実行することも可能である。
【0062】
図12は、本発明を適用した他の遠隔会議装置1−1の構成例を示している。この遠隔会議装置1−1には、図2の遠隔会議装置1−1の再生装置11に代えて再生装置61が設けられ、そして位置制御装置62がさらに設けられてる。
【0063】
再生装置61においては、遠隔会議装置1−2から送信されたきた画像データが、一定の表示スケールでディスプレイ11に表示され、また送信されてきた音声データが一定の増幅率で増幅され、スピーカ22から出力される。すなわち、再生装置11における場合のように、生体情報検出装置14からの生体情報に基づいて表示スケールや増幅率は変更されない。生体情報検出装置14により検出された視線ゆらぎの大きさは(生体情報)は、この例の場合、遠隔会議装置1−2に送信される。
【0064】
位置制御装置62は、遠隔会議装置1−2から送信されてくる生体情報(参加者Bの生体情報)に基づいて、ビデオカメラ12をラインAに沿って、そしてマイクロフォン13をラインBに沿って移動させる。
【0065】
図13は、位置制御装置62の構成例を示している。通信部71は、遠隔会議装置1−2の生体情報検出装置84(図14)により検出された参加者Bの生体情報を受信し、制御部72に供給する。制御部72は、通信部71から供給された視線ゆらぎの大きさに基づいて、ビデオカメラ12のラインA上の位置を決定し、ビデオカメラ移動部73に通知する。制御部72は、通信部71から供給された視線ゆらぎの大きさに基づいて、マイクロフォン13のラインB上の位置を決定し、マイクロフォン移動部74に通知する。
【0066】
ビデオカメラ移動部73は、制御部72から通知されたラインA上の位置にビデオカメラ12を移動させる。マイクロフォン移動部74は、制御部72から通知されたラインB上の位置にマイクロフォン13を移動させる。
【0067】
図14は、この例の場合の遠隔会議装置1−2の構成例を示している。遠隔会議装置1−2の再生装置81乃至生体情報検出装置84は、遠隔会議装置1−1の再生装置61,ビデオカメラ12乃至生体情報検出装置14と、遠隔会議装置1−2の位置制御装置101は、遠隔会議装置1−1の位置制御装置62と同様の機能を有しているので、その説明は省略する。
【0068】
次に、遠隔会議装置1−1の位置制御装置62の動作について説明する。
【0069】
位置制御部62の制御部72は、通信部71から遠隔会議装置1−2から送信されてきた、生体情報検出装置84により検出された参加者Bの視線ゆらぎの大きさを受信すると、受信した視線ゆらぎの大きさに対応した、ビデオカメラ12のラインA上の位置およびマイクロフォン13のラインB上の位置をそれぞれ決定する。例えば、参加者Bの視線ゆらぎの大きさが所定の大きさXより大きい場合、現在の位置から、その視線ゆらぎの大きさと大きさXとの差に対応する距離分だけ、端A2(ラインA)または端B2(ラインB)方向(参加者Aから遠ざかる方向)に離れた位置が検出される。また、参加者Bの視線ゆらぎの大きさが大きさXより小さい場合、現在の位置から、その視線ゆらぎの大きさと大きさXとの差に対応する距離分だけ、端A1(ラインA)または端B2(ラインB)方向(参加者Aに近づく方向)に離れた位置が検出される。
【0070】
制御部72は、このようにして検出した、ビデオカメラ12のラインA上の位置をビデオカメラ移動部73に通知し、またマイクロフォン13のラインB上の位置をマイクロフォン移動部74に通知する。
【0071】
ビデオカメラ移動部73は、制御部72から通知されたラインA上の位置にビデオカメラ12を移動させる。マイクロフォン移動部74は、制御部72から通知されたラインB上の位置にマイクロフォン13を移動させる。例えば、ビデオカメラ12がラインA上で端A2方向に移動されると、ビデオカメラ12と参加者Aとの距離が大きくなるため、参加者Aは小さく撮像され、その結果、参加者Aの映像が、遠隔会議装置1−2の再生装置81のディスプレイ91により小さく表示される。逆に、ビデオカメラ12がラインA上で端A1方向に移動されると、ビデオカメラ12と参加者Aとの距離が小さくなるため、参加者Aはより大きく撮像され、その結果、参加者Aの映像が、遠隔会議装置1−2の再生装置81のディスプレイ91に、大きく表示される。
【0072】
また、マイクロフォン13がラインB上で端B2方向に移動されると、マイクロフォン13と参加者Aとの距離が大きくなるため、参加者Aの音声が小さく集音され、その結果、参加者Aの音声が、遠隔会議装置1−2のスピーカ92から小さい音量で出力される。逆に、マイクロフォン13がラインB上で端B1方向に移動されると、マイクロフォン13と参加者Aとの距離が短くなり、参加者Aの音声がより大きく集音され、その結果、参加者Aの音声が、遠隔会議装置1−2の再生装置81のスピーカ92から大きく出力される。
【0073】
すなわち、図2の遠隔会議装置1−1の場合では、送信されてきた画像データおよび音声データの再生が、参加者Aの生体情報に基づいて調整されたのに対し、この例では、参加者B(相手)の生体情報に基づいて、遠隔会議装置1−2に送信される画像データおよび音声データが調整されるものである。
【0074】
なお、以上においては、ビデオカメラ12と参加者Aとの距離が調整される場合を例として説明したが、ビデオカメラ12のズーム倍率を調整するなど、光学的に撮像状態を調整することもできる。また、以上においては、マイクロフォン13と参加者Aとの距離が調整される場合を例として説明したが、マイクロフォン13の指向性を調整することもできる。
【0075】
以上においては、生体情報として、視線ゆらぎの大きさを生体情報とした場合を例として説明したが、その他、瞳孔の径の大きさ(不快である場合、その大きさは小さくなる)、発汗量(不快であるときその量が増える)、心拍数(不快であるときその数が増える)、または血圧(不快であるときその大きさが大きくなる)などを生体情報として、本発明を利用することもできる。なお、生体情報検出装置14の構成は、生体情報の種類に対応して異なる。例えば、生体情報を瞳孔の径の大きさとした場合、生体情報検出装置14は、瞳孔の径の大きさを検出することができる構成を有する。同様に、生体情報検出装置14は、構成生体情報を発汗量とした場合は発汗量を、生体情報を心拍数とした場合は心拍数を、また生体情報を血圧とした場合は血圧を検出することができる構成を有する。
【0076】
上述した一連の処理は、ハードウエアにより実行させることもできるが、ソフトウエアにより実行させることもできる。一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、専用のハードウエアとしての遠隔会議装置1に組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどにインストールされる。
【0077】
次に、図15を参照して、上述した一連の処理を実行するプログラムをコンピュータにインストールし、コンピュータによって実行可能な状態とするために用いられる媒体について、そのコンピュータが汎用のパーソナルコンピュータである場合を例として説明する。
【0078】
プログラムは、図15(A)に示すように、パーソナルコンピュータ101に内蔵されている記録媒体としてのハードディスク102や半導体メモリ103に予めインストールした状態でユーザに提供することができる。
【0079】
あるいはまた、プログラムは、図15(B)に示すように、フロッピーディスク111、CD-ROM(Compact Disk-Read Only Memory)112、MO(Magneto-Optical)ディスク113、DVD(Digital Versatile Disk)114、磁気ディスク115、半導体メモリ116などの記録媒体に、一時的あるいは永続的に格納し、パッケージソフトウエアとして提供することができる。
【0080】
さらに、プログラムは、図15(C)に示すように、ダウンロードサイト121から、デジタル衛星放送用の人工衛星122を介して、パーソナルコンピュータ101に無線で転送したり、ローカルエリアネットワーク、インターネットといったネットワーク131を介して、パーソナルコンピュータ101に有線で転送し、パーソナルコンピュータ101において、内蔵するハードディスク102などに格納させることができる。
【0081】
本明細書における媒体とは、これら全ての媒体を含む広義の概念を意味するものである。
【0082】
パーソナルコンピュータ101は、例えば、図16に示すように、CPU(Central Processing Unit)142を内蔵している。CPU142にはバス141を介して入出力インタフェース145が接続されており、CPU142は、入出力インタフェース145を介して、ユーザから、キーボード、マウスなどよりなる入力部147から指令が入力されると、それに対応して、図15(A)の半導体メモリ103に対応するROM(Read Only Memory)143に格納されているプログラムを実行する。あるいはまた、CPU142は、ハードディスク102に予め格納されているプログラム、衛星122もしくはネットワーク131から転送され、通信部148により受信され、さらにハードディスク102にインストールされたプログラム、またはドライブ149に装着されたフロッピーディスク111、CD-ROM112、MOディスク113、DVD114、もしくは磁気ディスク115から読み出され、ハードディスク102にインストールされたプログラムを、RAM(Random Access Memory)144にロードして実行する。さらに、CPU142は、その処理結果を、例えば、入出力インタフェース145を介して、LCD(Liquid Crystal Display)などよりなる表示部146に必要に応じて出力する。
【0083】
なお、本明細書において、媒体により提供されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0084】
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【0085】
【発明の効果】
本発明によれば、画像データに対応する映像を最適の大きさで表示させることができる。
【0086】
本発明によれば、撮像された画像データおよび集音された音声データが、例えば、他の通信装置において最適に再生される。
【図面の簡単な説明】
【図1】本発明を適用した遠隔会議システムの構成例を示すブロック図である。
【図2】図1の遠隔会議装置1−1の構成例を示すブロック図である。
【図3】生体情報検出装置14の構成例を示す図である。
【図4】再生装置11の第1の実施の形態の表示スケール調整処理を行う部分の構成例を示すブロック図である。
【図5】表示スケール調整処理を説明するフローチャートである。
【図6】ステップS2の処理の詳細を説明するフローチャートである。
【図7】ディスプレイ21の表示例を示す図である。
【図8】ディスプレイ21の他の表示例を示す図である。
【図9】再生装置11の第2の実施の形態の表示スケール調整処理および音声調整処理を行う部分の構成例を示すブロック図である。
【図10】音声調整処理を説明するフローチャートである。
【図11】ステップS22の処理の詳細を説明するフローチャートである。
【図12】遠隔会議装置1−1の他の構成例を示す図である。
【図13】図12の位置制御装置62の構成例を示すブロック図である。
【図14】遠隔会議装置1−2の構成例を示す図である。
【図15】媒体を説明する図である。
【図16】図15のパーソナルコンピュータ101の構成例を示すブロック図である。
【符号の説明】
1 遠隔会議装置, 2 ネットワーク, 11 再生装置, 12 ビデオカメラ,13 マイクロフォン, 14 生体情報検出装置, 21 ディスプレイ, 22 スピーカ, 31 光学部, 41 通信部, 42 制御部,43 通信部, 44 表示制御部, 51 通信部, 52 制御部, 53 音声制御部, 61 再生装置, 62 位置制御装置, 71 通信部,72 制御部, 73 ビデオカメラ移動部, 74 マイクロフォン移動部, 81 再生装置, 82 ビデオカメラ, 83 マイクロフォン, 84生体情報検出装置, 91 ディスプレイ, 92 スピーカ,
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a communication apparatus and method, and Record In particular, a communication apparatus and method for controlling image display and audio output in response to user biometric information, and Record It relates to the medium.
[0002]
[Prior art]
A remote conference that can hold a conference as if it were surrounding a single table by communicating the images and sounds of persons who are currently remote from each other via a network and reproducing the video and audio. There are systems and videophone systems that can talk as if the other party is in front of you.
[0003]
[Problems to be solved by the invention]
By the way, in actual meetings and conversations, you can adjust the distance from the conversation partner according to the feelings you have about the meeting partner and the conversation partner (hereinafter referred to as the conversation partner). Try to have a conversation. For example, if you are close to a conversation partner, you will be close to the conversation partner (sitting in a nearby seat), but if you are not very close, you will be a little away (sitting in a separate seat). In other words, when the conversation partner feels comfortable in the vicinity, the person approaches the person. On the other hand, when the conversation partner feels uncomfortable (for example, when nervous), the person is separated from the person.
[0004]
However, in the above-described conventional remote conference system and television telephone system, the conversation partner is imaged at a predetermined magnification, and the video is displayed at a certain size. In other words, in these systems, the video is not displayed as small as if the video is displayed close to the conversation partner, or as if the user is talking away. In the end, there was a problem that users could not comfortably hold meetings and conversations.
[0005]
The volume can also be adjusted by operating the volume dial, for example, but it has to be operated by oneself, and there is a problem that the user cannot comfortably hold a conference or conversation.
[0006]
The present invention has been made in view of such a situation, and makes it possible to optimally adjust a partner's image and sound.
[0007]
[Means for Solving the Problems]
The communication apparatus of the present invention is a communication apparatus that communicates image data and audio data with each other, and a first receiving unit that receives the audio data transmitted from the other communication apparatus; Output control means for controlling the output of the audio data received by the first receiving means, second receiving means for receiving the image data transmitted from the other communication device, and magnitude of line-of-sight fluctuations Detecting means for detecting at least one biological information of the diameter of the pupil, the amount of sweating, the heart rate, or the blood pressure, and a determination based on the biological information detected by the detecting means, and based on the determination result Z And Display of the image data received by the second receiving means Size of Display control means for controlling the display.
[0009]
The output control means makes a determination based on the biological information detected by the detection means, and based on the determination result. And Output of the audio data received by the first receiving means Amplification factor Can be controlled.
[0012]
Storage means for storing image data corresponding to the biological information is further provided, and the display control means makes a determination based on the biological information stored in the storage means corresponding to the image data, and the determination Based on results And Display of the image data Size of Can be controlled.
[0013]
The apparatus further comprises storage means for storing image data corresponding to the biological information, and the output control means includes: Stored in the storage unit corresponding to the image data Make a determination based on the biometric information, and And Output of the audio data Amplification factor Can be controlled.
[0014]
The communication method of the present invention is a communication method of a communication device that communicates image data and audio data with another communication device, and a first reception step of receiving the audio data transmitted from the other communication device. An output control step for controlling the output of the audio data received in the processing of the first reception step; a second reception step for receiving the image data transmitted from the other communication device; A detection step of detecting at least one biological information of gaze fluctuation size, pupil diameter size, perspiration amount, heart rate, or blood pressure, and determination based on the biological information detected in the processing of the detection step And based on the judgment results And Display of the image data received in the processing of the second receiving step Size of Display control step for controlling the display.
[0015]
The recording medium of the present invention is a communication program for communicating image data and audio data with another communication device, and inputs the audio data transmitted from the other communication device. An input step; an output control step for controlling the output of the audio data input in the processing of the first input step; and a second input step for inputting the image data transmitted from the other communication device. And a detection step of detecting at least one biological information of the size of gaze fluctuation, the size of the diameter of the pupil, the amount of sweat, the heart rate, or the blood pressure, and based on the biological information detected in the processing of the detection step Make a decision and based on the decision And Display of the image data input in the processing of the second input step Size of Display control step for controlling On the computer Execute for Recording a program Computer readable recoding media.
[0016]
In the communication apparatus and method and the recording medium of the present invention, the audio data transmitted from the other communication apparatus is received, the output of the received audio data is controlled, and the image transmitted from the other communication apparatus The data is received, and at least one biological information such as the size of the line-of-sight fluctuation, the size of the pupil diameter, the amount of sweat, the heart rate, or the blood pressure is detected, and the determination based on the detected biological information is performed. Based on results And Display of received image data Size of Is controlled.
[0025]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1 shows a configuration example of a remote conference system to which the present invention is applied. In this remote conference system, two remote conference devices 1-1 and 1-2 (hereinafter referred to as remote conference device 1 when there is no need to individually distinguish the remote conference devices 1-1 and 1-2). The same applies to the other devices). The remote conference device 1-1 transmits the image data and audio data of the participant A participating in the conference to the remote conference device 1-2 via the network 2, or has been transmitted from the remote conference device 1-2. Play back image data and audio data.
[0026]
The remote conference apparatus 1-2 transmits the image data and audio data of the participant B participating in the conference to the remote conference apparatus 1-1 via the network 2, or has been transmitted from the remote conference apparatus 1-1. Play back image data and audio data.
[0027]
FIG. 2 shows an example of the external configuration of the remote conference apparatus 1-1. The teleconference device 1-1 includes a playback device 11, a video camera 12, a microphone 13, and a biological information detection device 14.
[0028]
The playback device 11 includes a display 21 and a speaker 22. The display 21 displays a video (for example, video of the participant B) corresponding to the image data transmitted from the remote conference device 1-2 based on the biological information from the biological information detection device 14 (see FIG. 2). In the example, the display scale B is displayed). The speaker 22 outputs a sound (for example, a speech of the participant B) corresponding to the sound data transmitted from the remote conference device 1-2.
[0029]
The video camera 12 images the face portion of the participant A. The microphone 13 collects the speech of the participant A. The video imaged by the video camera 12 and the voice collected by the microphone 13 are transmitted to the remote conference device 1-2.
[0030]
The biological information detection device 14 is a device that detects the biological information of the participant A. In this example, as shown in FIG. 3, the biological information detection device 14 has an optical unit 31 and is similar to glasses. The biometric information is information indicating whether the participant A has a pleasant emotion or an unpleasant feeling, and in this example, the size of the fluctuation in the line of sight of the participant A. When the human (participant A) has discomfort, the line of sight moves greatly (gaze fluctuation is large), and when he / she has a pleasant emotion, the line of sight does not move much (gaze fluctuation is small).
[0031]
Participant A wears biological information detection device 14 so that optical unit 31 covers both eyes. The optical unit 31 detects the magnitude of the line-of-sight fluctuation of the participant A and supplies it to the playback device 11.
[0032]
Next, the configuration of the playback apparatus 11 according to the first embodiment will be described. FIG. 4 shows a configuration example of a portion that performs the display scale adjustment processing of the playback apparatus 11 according to the first embodiment. The communication unit 41 receives the image data (image data of the video of the participant B) supplied from the remote conference device 1-2 and supplies it to the control unit 42. The communication unit 43 receives the biological information (the magnitude of the line-of-sight fluctuation) from the biological information detection device 14 and supplies it to the control unit 42. In addition, when biometric information is supplied to the reproducing | regenerating apparatus 11 with an analog signal, the communication part 43 has an A / D converter (not shown) etc., and converts an analog signal (biological information) into digital using it. It converts into a signal and supplies it to the control part 42.
[0033]
The control unit 42 supplies the image data supplied from the communication unit 41 to the display control unit 44, determines a display scale of a video corresponding to the image data based on the biological information from the communication unit 43, and displays the display scale. The control unit 44 is notified.
[0034]
The display control unit 44 causes the display 21 to display the image data supplied from the control unit 42 on the display scale notified from the control unit 42.
[0035]
Since the remote conference device 1-2 has the same configuration as the remote conference device 1-1, its illustration and description are omitted.
[0036]
Next, the processing procedure of the display scale adjustment process in the remote conference apparatus 1-1 will be described with reference to the flowchart of FIG. As shown in FIG. 2, when the participant A wears the biological information detecting device 14 and the video of the participant B is displayed on the display 21 on the display scale B (display scale in the initial state), the step is performed. In S <b> 1, the biological information detection device 14 detects the magnitude of the line-of-sight fluctuation of the participant A, and supplies the detection result to the playback device 11.
[0037]
In step S <b> 2, the control unit 42 of the playback device 11 receives the magnitude of the line-of-sight fluctuation supplied from the biological information detection device 14 via the communication unit 43 and determines the display scale of the video of the participant B. The details of the display scale determination process are shown in the flowchart of FIG.
[0038]
That is, in step S11, the control unit 42 determines whether or not the size of the line-of-sight fluctuation is larger than the size A. If it is determined that the size is larger, the control unit 42 proceeds to step S12 and determines the display scale as the display scale A. In this example, the display scale A is about 80% of the display scale B.
[0039]
If it is determined in step S11 that the magnitude of the line-of-sight fluctuation is not greater than (or less than) the magnitude A, the process proceeds to step S13, and the control unit 42 determines that the magnitude of the line-of-sight fluctuation is the magnitude B (size). It is determined whether or not it is larger than (A size smaller than A), and when it is determined that it is larger (when it is smaller than A and larger than B), the process proceeds to step S14, and the display scale is set to display scale B (initial Status display scale).
[0040]
When it is determined in step S13 that the magnitude of the line-of-sight fluctuation is not greater than (or less than) the magnitude B, the process proceeds to step S15, and the control unit 42 determines the display scale as the display scale C. In this example, the display scale C is about 120% of the display scale B.
[0041]
When the display scale is determined in step S12, step S14, or step S15, the display scale determination process is completed, and the process proceeds to step S3 in FIG.
[0042]
In step S3, the control unit 42 of the playback apparatus 11 notifies the display control unit 44 of the display scale determined in step S2. In step S <b> 4, the display control unit 44 causes the display 21 to display the video of the participant B received by the communication unit 41 based on the display scale notified from the control unit 42.
[0043]
For example, when the size of the detected line-of-sight fluctuation is larger than the size A and the display scale is determined to be the display scale A in step S2, the video of the participant B is displayed on the display scale B as shown in FIG. (FIG. 2) is displayed smaller than the case of being displayed. On the other hand, when the size of the detected line-of-sight fluctuation is B or less and the display scale is determined to be the display scale C, the video of the participant B is displayed on the display scale B as shown in FIG. It is displayed larger than the case.
[0044]
That is, if the biometric information indicates that the participant A feels uncomfortable (in this example, the magnitude of the line-of-sight fluctuation is large), is the participant A sitting slightly away from the participant B? As shown in FIG. 7, the video of participant B is displayed small (FIG. 7). Conversely, if the biometric information indicates that the participant A feels comfortable (in this example, the magnitude of the line-of-sight fluctuation is small), is the participant A sitting near the participant B? As shown in FIG. 8, the video of participant B is displayed in a large size (FIG. 8).
[0045]
The displayed video and the biometric information detected at that time (the magnitude of the line-of-sight fluctuation) are stored in association with each other. When the video is displayed next time, the stored biometric information is stored in correspondence with the stored video. It is also possible to determine the display scale based on this and display the video at the determined display scale.
[0046]
In the above example, the case where the display scale A is 80% of the display scale B and the display scale C is 120% has been described as an example. The relationship of gaze fluctuation (pleasant / uncomfortable) can be measured in advance and set based on the measurement result.
[0047]
Next, the configuration of the playback apparatus 11 according to the second embodiment will be described. FIG. 9 shows a configuration example of a portion for performing the display scale adjustment processing and the audio adjustment processing of the second embodiment of the playback device 11. The playback device 11 includes a communication unit 51 instead of the communication unit 41 of the playback device 11 of FIG. 4, a control unit 51 instead of the control unit 42, and an audio control unit 53.
[0048]
The communication unit 51 receives audio data in addition to the image data supplied from the remote conference device 1-2 and supplies the audio data to the control unit 52. The control unit 52 supplies the image data supplied from the communication unit 51 to the display control unit 44 and the audio data to the audio control unit 53. The control unit 52 receives the biological information from the biological information detection device 14 via the communication unit 43, determines the display scale as in the case of the control unit 42 of FIG. 4, and notifies the display control unit 44. The control unit 52 also determines the amplification factor of the audio data based on the biological information, and notifies the audio control unit 53 of the determination.
[0049]
The audio control unit 53 amplifies the audio data supplied from the control unit 52 with the amplification factor notified from the control unit 52 and outputs the amplified data from the speaker 22.
[0050]
Next, the processing procedure of the audio adjustment processing in the remote conference apparatus 1-1 will be described with reference to the flowchart of FIG. When the participant A wears the biological information detecting device 14 as shown in FIG. 2 and the video of the participant B is displayed on the display scale B on the display 21 (or the amplification factor from the speaker 22). When the voice of the participant B amplified by B (initial value) is output), in step S21, the biological information detecting device 14 detects the magnitude of the line-of-sight fluctuation of the participant A and the detection result is reproduced by the reproducing device 11. To supply.
[0051]
In step S <b> 22, the control unit 52 of the playback device 11 receives the magnitude of the line-of-sight fluctuation from the biological information detection device 14 via the communication unit 43, and determines the amplification factor based on the magnitude of the received line-of-sight fluctuation. To do. The details of the amplification factor determination process are shown in the flowchart of FIG.
[0052]
That is, in step S31, the control unit 52 determines whether or not the magnitude of the line-of-sight fluctuation is larger than the magnitude A. If it is determined that the magnitude is larger, the control section 52 proceeds to step S32 and determines the amplification factor as the amplification factor A. In this example, the amplification factor A is about 80% of the amplification factor B.
[0053]
If it is determined in step S31 that the magnitude of the line-of-sight fluctuation is not larger than (or less than) the magnitude A, the process proceeds to step S33, and the control unit 52 determines whether the magnitude of the line-of-sight fluctuation is larger than the magnitude B. If it is determined that it is greater than that (if it is smaller than size A and greater than size B), the process proceeds to step S34, and the gain is determined as gain B (initial value).
[0054]
If it is determined in step S33 that the magnitude of the line-of-sight fluctuation is not greater than (or less than) the magnitude B, the process proceeds to step S35, and the control unit 52 determines the amplification factor as the amplification factor C. In this example, the amplification factor C is about 120% of the amplification factor B.
[0055]
When the amplification factor is determined in step S32, step S34, or step S35, the amplification factor determination process is completed, and the process proceeds to step S23 in FIG.
[0056]
In step S23, the control unit 52 notifies the audio control unit 53 of the amplification factor determined in step S22. In step S <b> 24, the voice control unit 53 amplifies the voice data received by the communication unit 51 based on the amplification factor notified from the control unit 52, and outputs it from the speaker 22.
[0057]
For example, when the magnitude of the detected line-of-sight fluctuation is larger than the magnitude A and the amplification factor is determined as the amplification factor A in step S22, and the voice data is amplified by the amplification factor A, the voice of the participant B is Is output from the speaker 22 at a lower volume than when amplified by. On the other hand, when the magnitude of the detected line-of-sight fluctuation is smaller than the size B and the amplification factor is determined to be the amplification factor C, and the voice data is amplified by the amplification factor C, the voice of the participant B is amplified by the amplification factor B. Compared to the case, the sound is output from the speaker 22 at a large volume.
[0058]
That is, if the biometric information indicates that the participant A feels uncomfortable (in this example, the magnitude of the line-of-sight fluctuation is large), is the participant A talking with the participant B away? As described above, the voice of the participant B is output at a low volume. Conversely, when the biometric information indicates that the participant A feels comfortable (in this example, when the magnitude of the line-of-sight fluctuation is small), the participant A approaches the participant B and talks. As if, the voice of participant B is output at a high volume.
[0059]
In the above description, the case where the amplification factor is adjusted has been described as an example. However, the equalization of audio data may be adjusted.
[0060]
In addition, the displayed video (or audio) and the biometric information (line-of-sight fluctuation) detected at that time are stored in association with each other, and when the video (or audio) is displayed next time, it is stored correspondingly. It is also possible to amplify the sound at an amplification factor based on living body information.
[0061]
In the above description, for the sake of simplicity, only the audio adjustment process has been described. However, the display scale process and the audio adjustment process can be executed in parallel.
[0062]
FIG. 12 shows a configuration example of another remote conference apparatus 1-1 to which the present invention is applied. The remote conference device 1-1 is provided with a playback device 61 in place of the playback device 11 of the remote conference device 1-1 of FIG. 2, and further provided with a position control device 62.
[0063]
In the playback device 61, the image data transmitted from the remote conference device 1-2 is displayed on the display 11 with a constant display scale, and the transmitted audio data is amplified with a constant amplification factor, and the speaker 22 is displayed. Is output from. In other words, the display scale and amplification factor are not changed based on the biological information from the biological information detection device 14 as in the playback device 11. The magnitude of the line-of-sight fluctuation detected by the biological information detection device 14 (biological information) is transmitted to the remote conference device 1-2 in this example.
[0064]
The position control device 62 moves the video camera 12 along the line A and the microphone 13 along the line B based on the biological information (participant B's biological information) transmitted from the remote conference device 1-2. Move.
[0065]
FIG. 13 shows a configuration example of the position control device 62. The communication unit 71 receives the biological information of the participant B detected by the biological information detection device 84 (FIG. 14) of the remote conference device 1-2 and supplies it to the control unit 72. The control unit 72 determines the position on the line A of the video camera 12 based on the magnitude of the line-of-sight fluctuation supplied from the communication unit 71 and notifies the video camera moving unit 73 of the position. The control unit 72 determines the position of the microphone 13 on the line B based on the magnitude of the line-of-sight fluctuation supplied from the communication unit 71 and notifies the microphone moving unit 74 of the position.
[0066]
The video camera moving unit 73 moves the video camera 12 to a position on the line A notified from the control unit 72. The microphone moving unit 74 moves the microphone 13 to a position on the line B notified from the control unit 72.
[0067]
FIG. 14 shows a configuration example of the remote conference apparatus 1-2 in this example. The playback device 81 to the biological information detection device 84 of the remote conference device 1-2 are the playback device 61 of the remote conference device 1-1, the video camera 12 to the biological information detection device 14, and the position control device of the remote conference device 1-2. Since 101 has the same function as the position control device 62 of the remote conference device 1-1, its description is omitted.
[0068]
Next, operation | movement of the position control apparatus 62 of the remote conference apparatus 1-1 is demonstrated.
[0069]
When the control unit 72 of the position control unit 62 receives the magnitude of the line-of-sight fluctuation of the participant B detected by the biological information detection device 84 transmitted from the remote conference device 1-2 from the communication unit 71, the control unit 72 receives The position on the line A of the video camera 12 and the position on the line B of the microphone 13 corresponding to the magnitude of the line-of-sight fluctuation are determined. For example, if the size of the line-of-sight fluctuation of the participant B is larger than a predetermined size X, the end A2 (line A2) from the current position by a distance corresponding to the difference between the size of the line-of-sight fluctuation and the size X. ) Or an edge B2 (line B) direction (a direction away from the participant A) is detected. Further, when the size of the line-of-sight fluctuation of the participant B is smaller than the size X, the end A1 (line A) or the distance corresponding to the difference between the magnitude of the line-of-sight fluctuation and the size X from the current position. A position separated in the end B2 (line B) direction (direction approaching the participant A) is detected.
[0070]
The control unit 72 notifies the video camera moving unit 73 of the position on the line A of the video camera 12 detected as described above, and notifies the microphone moving unit 74 of the position of the microphone 13 on the line B.
[0071]
The video camera moving unit 73 moves the video camera 12 to a position on the line A notified from the control unit 72. The microphone moving unit 74 moves the microphone 13 to a position on the line B notified from the control unit 72. For example, when the video camera 12 is moved in the direction of the end A2 on the line A, the distance between the video camera 12 and the participant A increases, so that the participant A is captured small, and as a result, the video of the participant A Is displayed small on the display 91 of the playback device 81 of the remote conference device 1-2. Conversely, when the video camera 12 is moved in the direction of the end A1 on the line A, the distance between the video camera 12 and the participant A becomes smaller, so that the participant A is imaged more greatly. As a result, the participant A Is displayed largely on the display 91 of the playback device 81 of the remote conference device 1-2.
[0072]
Further, when the microphone 13 is moved in the direction of the end B2 on the line B, the distance between the microphone 13 and the participant A is increased, so that the voice of the participant A is collected, and as a result, the participant A's voice is collected. Audio is output at a low volume from the speaker 92 of the remote conference device 1-2. On the contrary, when the microphone 13 is moved in the direction of the end B1 on the line B, the distance between the microphone 13 and the participant A is shortened, and the voice of the participant A is collected more. As a result, the participant A Is output from the speaker 92 of the playback device 81 of the remote conference device 1-2.
[0073]
That is, in the case of the teleconference device 1-1 in FIG. 2, the reproduction of the transmitted image data and audio data is adjusted based on the biometric information of the participant A. In this example, the participant Based on the biological information of B (the other party), the image data and audio data transmitted to the remote conference device 1-2 are adjusted.
[0074]
In the above description, the case where the distance between the video camera 12 and the participant A is adjusted has been described as an example. However, the imaging state can be optically adjusted, for example, by adjusting the zoom magnification of the video camera 12. . In the above description, the case where the distance between the microphone 13 and the participant A is adjusted has been described as an example. However, the directivity of the microphone 13 can be adjusted.
[0075]
In the above description, the case where the magnitude of the line-of-sight fluctuation is taken as the biometric information has been described as an example of the biometric information. (The amount increases when uncomfortable), Heart rate (The number increases when uncomfortable), Blood pressure (The size increases when uncomfortable), etc. You can also. Note that the configuration of the biological information detection device 14 differs depending on the type of biological information. For example, when the biological information is the pupil diameter, the biological information detection device 14 has a configuration capable of detecting the pupil diameter. Similarly, the biological information detection device 14 detects the amount of sweat when the constituent biological information is the amount of sweat, the heart rate when the biological information is the heart rate, and the blood pressure when the biological information is the blood pressure. It has a configuration that can.
[0076]
The series of processes described above can be executed by hardware, but can also be executed by software. When a series of processing is executed by software, a computer constituting the software is installed in the remote conference device 1 as dedicated hardware or by installing various programs. It is installed in, for example, a general-purpose personal computer that can execute various functions.
[0077]
Next, referring to FIG. 15, when the computer is a general-purpose personal computer for the medium used for installing the program for executing the above-described series of processes in the computer and making it executable by the computer. Will be described as an example.
[0078]
As shown in FIG. 15A, the program can be provided to the user in a state where it is preinstalled in a hard disk 102 or a semiconductor memory 103 as a recording medium built in the personal computer 101.
[0079]
Alternatively, as shown in FIG. 15B, the program includes a floppy disk 111, a CD-ROM (Compact Disk-Read Only Memory) 112, an MO (Magneto-Optical) disk 113, a DVD (Digital Versatile Disk) 114, It can be temporarily or permanently stored in a recording medium such as the magnetic disk 115 and the semiconductor memory 116 and provided as package software.
[0080]
Further, as shown in FIG. 15C, the program is wirelessly transferred from the download site 121 to the personal computer 101 via the digital satellite broadcasting artificial satellite 122, or a network 131 such as a local area network or the Internet. The data can be transferred to the personal computer 101 via a wire and stored in the built-in hard disk 102 or the like in the personal computer 101.
[0081]
The medium in this specification means a broad concept including all these media.
[0082]
The personal computer 101 includes a CPU (Central Processing Unit) 142, for example, as shown in FIG. An input / output interface 145 is connected to the CPU 142 via the bus 141, and the CPU 142 receives an instruction from the input unit 147 such as a keyboard and a mouse via the input / output interface 145. Correspondingly, a program stored in a ROM (Read Only Memory) 143 corresponding to the semiconductor memory 103 in FIG. Alternatively, the CPU 142 is a program stored in advance in the hard disk 102, a program transferred from the satellite 122 or the network 131, received by the communication unit 148, and further installed in the hard disk 102, or a floppy disk attached to the drive 149. 111, the CD-ROM 112, the MO disk 113, the DVD 114, or the magnetic disk 115, and the program installed in the hard disk 102 is loaded into a RAM (Random Access Memory) 144 and executed. Further, the CPU 142 outputs the processing result to the display unit 146 formed of an LCD (Liquid Crystal Display) or the like as necessary via the input / output interface 145, for example.
[0083]
In the present specification, the steps for describing the program provided by the medium are not limited to the processes performed in time series according to the described order, but are not necessarily performed in time series, either in parallel or individually. This includes the processing to be executed.
[0084]
Further, in this specification, the system represents the entire apparatus constituted by a plurality of apparatuses.
[0085]
【The invention's effect】
The present invention According to this, it is possible to display the video corresponding to the image data with the optimum size.
[0086]
The present invention According to the above, the captured image data and the collected sound data are optimally reproduced in, for example, another communication device.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration example of a remote conference system to which the present invention is applied.
FIG. 2 is a block diagram illustrating a configuration example of the remote conference apparatus 1-1 in FIG.
FIG. 3 is a diagram illustrating a configuration example of a biological information detection device 14;
FIG. 4 is a block diagram illustrating a configuration example of a portion that performs display scale adjustment processing of the first embodiment of the playback apparatus 11;
FIG. 5 is a flowchart for explaining display scale adjustment processing;
FIG. 6 is a flowchart illustrating details of processing in step S2.
7 is a diagram showing a display example of the display 21. FIG.
8 is a diagram showing another display example of the display 21. FIG.
FIG. 9 is a block diagram illustrating a configuration example of a part that performs display scale adjustment processing and audio adjustment processing according to the second embodiment of the playback apparatus;
FIG. 10 is a flowchart illustrating audio adjustment processing.
FIG. 11 is a flowchart illustrating details of a process in step S22.
FIG. 12 is a diagram illustrating another configuration example of the remote conference apparatus 1-1.
13 is a block diagram illustrating a configuration example of the position control device 62 in FIG. 12. FIG.
FIG. 14 is a diagram illustrating a configuration example of a remote conference device 1-2.
FIG. 15 is a diagram illustrating a medium.
16 is a block diagram illustrating a configuration example of the personal computer 101 in FIG.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 Remote conference apparatus, 2 Network, 11 Playback apparatus, 12 Video camera, 13 Microphone, 14 Living body information detection apparatus, 21 Display, 22 Speaker, 31 Optical part, 41 Communication part, 42 Control part, 43 Communication part, 44 Display control Unit, 51 communication unit, 52 control unit, 53 audio control unit, 61 playback device, 62 position control device, 71 communication unit, 72 control unit, 73 video camera moving unit, 74 microphone moving unit, 81 playback device, 82 video camera , 83 microphone, 84 biological information detecting device, 91 display, 92 speaker,

Claims (6)

他の通信装置と相互に画像データおよび音声データを通信する通信装置において、
前記他の通信装置から送信されてきた前記音声データを受信する第1の受信手段と、
前記第1の受信手段により受信された前記音声データの出力を制御する出力制御手段と、
前記他の通信装置から送信されてきた前記画像データを受信する第2の受信手段と、
視線ゆらぎの大きさ、瞳孔の径の大きさ、発汗量、心拍数、または血圧の少なくとも1つの生体情報を検出する検出手段と、
前記検出手段により検出された前記生体情報に基づく判断を行い、その判断結果に基づいて前記第2の受信手段により受信された前記画像データの表示の大きさを制御する表示制御手段と
を備える通信装置。
In a communication device that communicates image data and audio data with other communication devices,
First receiving means for receiving the audio data transmitted from the other communication device;
Output control means for controlling the output of the audio data received by the first receiving means;
Second receiving means for receiving the image data transmitted from the other communication device;
Detection means for detecting at least one biological information of the size of the line of sight fluctuation, the size of the pupil diameter, the amount of sweat, the heart rate, or the blood pressure;
Make decisions based on the biological information detected by the detecting means, and display control means for controlling the display size of said received image data by said second reception means based on the result of the determination Communication device.
前記出力制御手段は、前記検出手段により検出された前記生体情報に基づく判断を行い、その判断結果に基づいて前記第1の受信手段により受信された前記音声データの出力の増幅率を制御する
請求項1に記載の通信装置。
The output control means performs determination based on the biological information detected by the detecting means, for controlling the amplification factor of the output of the audio data received by said first receiving means based on the result of the determination The communication apparatus according to claim 1.
前記生体情報と対応して画像データを記憶する記憶手段
をさらに備え、
前記表示制御手段は、前記記憶手段に前記画像データに対応して記憶されている前記生体情報に基づく判断を行い、その判断結果に基づいて前記画像データの表示の大きさを制御する
請求項1に記載の通信装置。
Storage means for storing image data corresponding to the biological information,
Claims wherein the display control unit performs a determination based on the biological information stored in correspondence with the image data in the storage means, and based on the determination result to control the size of the display of said image data The communication apparatus according to 1.
前記生体情報と対応して画像データを記憶する記憶手段
をさらに備え、
前記出力制御手段は、前記記憶手段に前記画像データに対応して記憶されている前記生体情報に基づく判断を行い、その判断結果に基づいて前記音声データの出力の増幅率を制御する
請求項に記載の通信装置。
Storage means for storing image data corresponding to the biological information,
Claims wherein the output control means performs determination based on the biological information stored in correspondence with the image data in the storage means, and based on the determination result to control the amplification factor of the output of said audio data The communication apparatus according to 1 .
他の通信装置と相互に画像データおよび音声データを通信する通信装置の通信方法において、
前記他の通信装置から送信されてきた前記音声データを受信する第1の受信ステップと、
前記第1の受信ステップの処理で受信された前記音声データの出力を制御する出力制御ステップと、
前記他の通信装置から送信されてきた前記画像データを受信する第2の受信ステップと、
視線ゆらぎの大きさ、瞳孔の径の大きさ、発汗量、心拍数、または血圧の少なくとも1つの生体情報を検出する検出ステップと、
前記検出ステップの処理で検出された前記生体情報に基づく判断を行い、その判断結果に基づいて前記第2の受信ステップの処理で受信された前記画像データの表示の大きさを制御する表示制御ステップと
を含む通信方法。
In a communication method of a communication device that communicates image data and audio data with each other,
A first reception step of receiving the audio data transmitted from the other communication device;
An output control step of controlling output of the audio data received in the processing of the first reception step;
A second receiving step of receiving the image data transmitted from the other communication device;
A detection step of detecting at least one biological information of the size of gaze fluctuation, the size of the diameter of the pupil, the amount of sweat, the heart rate, or the blood pressure;
The detected by the processing of the detection step was performed determination based on the biological information, the display control for controlling the size of the display of the image data received by the processing of said based on the result of the judgment second receiving step A communication method including steps.
他の通信装置と相互に画像データおよび音声データを通信する場合の通信用プログラムであって、
前記他の通信装置から送信されてきた前記音声データを入力する第1の入力ステップと、
前記第1の入力ステップの処理で入力された前記音声データの出力を制御する出力制御ステップと、
前記他の通信装置から送信されてきた前記画像データを入力する第2の入力ステップと、
視線ゆらぎの大きさ、瞳孔の径の大きさ、発汗量、心拍数、または血圧の少なくとも1つの生体情報を検出する検出ステップと、
前記検出ステップの処理で検出された前記生体情報に基づく判断を行い、その判断結果に基づいて前記第2の入力ステップの処理で入力された前記画像データの表示の大きさを制御する表示制御ステップと
を含む処理をコンピュータに実行させるためのプログラムを記録しているコンピュータ読み取り可能な記録媒体。
A communication program for communicating image data and audio data with other communication devices,
A first input step of inputting the audio data transmitted from the other communication device;
An output control step of controlling the output of the audio data input in the processing of the first input step;
A second input step of inputting the image data transmitted from the other communication device;
A detection step of detecting at least one biological information of the size of gaze fluctuation, the size of the diameter of the pupil, the amount of sweat, the heart rate, or the blood pressure;
The detected by the processing of the detection step was performed determination based on the biological information, the display control for controlling the size of the display of the image data input by the processing of the second input steps based on the result of the determination A computer-readable recording medium in which a program for causing a computer to execute processing including steps is recorded.
JP23224899A 1999-08-19 1999-08-19 Communication apparatus and method, and recording medium Expired - Fee Related JP4359968B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23224899A JP4359968B2 (en) 1999-08-19 1999-08-19 Communication apparatus and method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23224899A JP4359968B2 (en) 1999-08-19 1999-08-19 Communication apparatus and method, and recording medium

Publications (3)

Publication Number Publication Date
JP2001057672A JP2001057672A (en) 2001-02-27
JP2001057672A5 JP2001057672A5 (en) 2006-04-27
JP4359968B2 true JP4359968B2 (en) 2009-11-11

Family

ID=16936306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23224899A Expired - Fee Related JP4359968B2 (en) 1999-08-19 1999-08-19 Communication apparatus and method, and recording medium

Country Status (1)

Country Link
JP (1) JP4359968B2 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4391091B2 (en) * 2003-01-17 2009-12-24 ソニー株式会社 Information transmission method, information transmission device, information recording method, information recording device, information reproducing method, information reproducing device, and recording medium
JP4158533B2 (en) * 2003-01-21 2008-10-01 ソニー株式会社 Method and apparatus for recording, transmitting or reproducing data
JP4407198B2 (en) * 2003-08-11 2010-02-03 ソニー株式会社 Recording / reproducing apparatus, reproducing apparatus, recording / reproducing method, and reproducing method
US8022989B2 (en) * 2005-08-17 2011-09-20 Palo Alto Research Center Incorporated Method and apparatus for controlling data delivery with user-maintained modes
JP4767817B2 (en) 2006-05-02 2011-09-07 株式会社ソニー・コンピュータエンタテインメント COMMUNICATION SYSTEM, COMMUNICATION DEVICE, COMMUNICATION PROGRAM, COMPUTER-READABLE STORAGE MEDIUM CONTAINING COMMUNICATION PROGRAM
JP4753204B2 (en) 2006-11-17 2011-08-24 株式会社ソニー・コンピュータエンタテインメント Encoding processing apparatus and encoding processing method
WO2009069187A1 (en) * 2007-11-26 2009-06-04 Fujitsu Limited Television program display system
US12075188B2 (en) 2019-04-17 2024-08-27 Sony Group Corporation Information processing apparatus and information processing method
WO2022254497A1 (en) * 2021-05-31 2022-12-08 株式会社I’mbesideyou Video analysis system
JP7626085B2 (en) * 2022-03-14 2025-02-04 トヨタ自動車株式会社 Information processing device, method, and program

Also Published As

Publication number Publication date
JP2001057672A (en) 2001-02-27

Similar Documents

Publication Publication Date Title
US20230071638A1 (en) System and method for differentially locating and modifying audio sources
JP6651989B2 (en) Video processing apparatus, video processing method, and video processing system
US11184723B2 (en) Methods and apparatus for auditory attention tracking through source modification
JP4359968B2 (en) Communication apparatus and method, and recording medium
WO2000022823A1 (en) Communication apparatus and method
JPWO2000022823A1 (en) Communication device and method
CN106062746A (en) System and method for user controllable auditory environment customization
CN109587533A (en) Equipment with enhancing audio
JP2022168843A (en) Compensation in face coverage for captured audio
Mehra et al. Potential of augmented reality platforms to improve individual hearing aids and to support more ecologically valid research
JP2009178783A (en) Communication robot and control method thereof
US20250037709A1 (en) Bone conduction transducers for privacy
US20110267421A1 (en) Method and Apparatus for Two-Way Multimedia Communications
Hohmann The future of hearing aid technology: Can technology turn us into superheroes?
JP2011254400A (en) Image and voice recording device
JP7292343B2 (en) Information processing device, information processing method and information processing program
JP2004248125A (en) Video switching device, video switching method, program of this method, and recording medium recording this program
JP4772315B2 (en) Information conversion apparatus, information conversion method, communication apparatus, and communication method
KR101322081B1 (en) apparatus and method for outputting audio which interworks video zooming
JP2019071515A (en) Communication device, communication system, and program
JP2981179B2 (en) Portable information transmission device
JP2019211529A (en) Voice memory device
JP3783504B2 (en) Dialog recording system
JP5432805B2 (en) Speaking opportunity equalizing method, speaking opportunity equalizing apparatus, and speaking opportunity equalizing program
JP2022145036A (en) Information processing device, information processing method, and information processing program

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060310

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080731

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090129

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090325

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090721

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090803

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120821

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130821

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees