Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7694530B2 - 端末装置 - Google Patents
[go: Go Back, main page]

JP7694530B2 - 端末装置 - Google Patents

端末装置 Download PDF

Info

Publication number
JP7694530B2
JP7694530B2 JP2022167110A JP2022167110A JP7694530B2 JP 7694530 B2 JP7694530 B2 JP 7694530B2 JP 2022167110 A JP2022167110 A JP 2022167110A JP 2022167110 A JP2022167110 A JP 2022167110A JP 7694530 B2 JP7694530 B2 JP 7694530B2
Authority
JP
Japan
Prior art keywords
image
user
display
terminal device
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022167110A
Other languages
English (en)
Other versions
JP2024059435A (ja
Inventor
航 加来
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2022167110A priority Critical patent/JP7694530B2/ja
Priority to CN202311342645.9A priority patent/CN117915062A/zh
Priority to US18/489,508 priority patent/US20240127769A1/en
Publication of JP2024059435A publication Critical patent/JP2024059435A/ja
Application granted granted Critical
Publication of JP7694530B2 publication Critical patent/JP7694530B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/37Details of the operation on graphic patterns
    • G09G5/377Details of the operation on graphic patterns for mixing or overlaying two or more graphic patterns
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1454Digital output to display device ; Cooperation and interconnection of the display device with other functional units involving copying of the display data of a local workstation or window to a remote workstation or window so that an actual copy of the data is displayed simultaneously on two or more displays, e.g. teledisplay
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/366Image reproducers using viewer tracking
    • H04N13/383Image reproducers using viewer tracking for tracking with gaze detection, i.e. detecting the lines of sight of the viewer's eyes
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • G06F3/1423Digital output to display device ; Cooperation and interconnection of the display device with other functional units controlling a plurality of local displays, e.g. CRT and flat panel display
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/00Three-dimensional [3D] image rendering
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/37Details of the operation on graphic patterns
    • G09G5/373Details of the operation on graphic patterns for modifying the size of the graphic pattern
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/275Image signal generators from three-dimensional [3D] object models, e.g. computer-generated stereoscopic image signals
    • H04N13/279Image signal generators from three-dimensional [3D] object models, e.g. computer-generated stereoscopic image signals the virtual viewpoint locations being selected by the viewers or determined by tracking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/398Synchronisation thereof; Control thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • G09G2340/0492Change of orientation of the displayed image, e.g. upside-down, mirrored
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/14Solving problems related to the presentation of information to be displayed
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2354/00Aspects of interface with display user
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/02Networking aspects
    • G09G2370/022Centralised management of display operation, e.g. in a server instead of locally

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)
  • Digital Computer Display Output (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本開示は、端末装置に関する。
ネットワークを介して接続されるコンピュータを用いて、各コンピュータのユーザが他のユーザと互いの画像、音声を送受して通話を行う技術が知られている。例えば、特許文献1には、カメラにより撮像されたユーザの映像からユーザの三次元映像を生成し、遠隔地に居る対話相手の三次元映像を対話者側のディスプレイに表示させる映像表示システムが開示されている。
特開2016-192688号公報
ユーザが互いの画像、音声を送受し仮想の対面コミュニケーションを行う技術において、コミュニケーションのリアリティを向上させるとともにユーザの利便性を向上させる余地がある。
本開示は、仮想の対面コミュニケーションにおけるリアリティと利便性の向上を可能にする、端末装置等を提供する。
本開示における端末装置は、通信部と、表示部と、前記表示部に重畳するタッチパネルを有する入力部と、ユーザを撮像する撮像部と、前記通信部により通信を行う制御部とを有する端末装置であって、前記制御部は、他の端末装置を用いる他のユーザの撮像画像に基づき当該他のユーザを表すモデル画像を生成するための情報と、当該他のユーザが当該他の端末装置のタッチパネルに描画する描画画像の情報とを当該他の端末装置から受け、左右を反転させた前記モデル画像と左右を反転させた前記描画画像とを互いに重畳させた表示用画像を前記表示部に表示させる。
本開示における端末装置等によれば、仮想の対面コミュニケーションにおけるリアリティと利便性の向上が可能となる。
通話システムの構成例を示す図である。 端末装置を使用するユーザの態様を示す図である。 端末装置を使用するユーザの態様を示す図である。 通話システムの動作例を示すシーケンス図である。 端末装置の動作例を示すフローチャート図である。 端末装置の動作例を示すフローチャート図である。 表示用画像の例を示す図である。 表示用画像の例を示す図である。 表示倍率の変更について説明する図である。 表示倍率の変更について説明する図である。 表示倍率の変更について説明する図である。 表示倍率の変更について説明する図である。
以下、実施の形態について説明する。
図1は、一実施形態における通話システム1の構成例を示す図である。通話システム1は、ネットワーク11を介して互いに情報通信可能に接続される、サーバ装置10と複数の端末装置12を有する。通話システム1は、ユーザが端末装置12を用いて画像、音声等を送受して互いに仮想の対面コミュニケーション(以下、仮想対面コミュニケーションという)を行うことを可能にするためのシステムである。
サーバ装置10は、例えば、クラウドコンピューティングシステム又はその他のコンピューティングシステムに属し、各種機能を実装するサーバとして機能するサーバコンピュータである。サーバ装置10は、情報通信可能に接続されて連携動作する二以上のサーバコンピュータにより構成されてもよい。サーバ装置10は、仮想対面コミュニケーションの提供に必要な情報の送受及び情報処理を実行する。
端末装置12は、通信機能と、画像、音声等の入出力機能を備えた情報処理装置であって、ユーザにより使用される。端末装置12は、例えば、スマートフォン、タブレット端末、パーソナルコンピュータ、デジタルサイネージ等である。
ネットワーク11は、例えばインターネットであるが、アドホックネットワーク、LAN(Local Area Network)、MAN(Metropolitan Area Network)、もしくは他のネットワーク又はこれらいずれかの組合せが含まれる。
本実施形態において、端末装置12は、他の端末装置12を用いる他のユーザの撮像画像に基づき他のユーザを表すモデル画像を生成するための情報と、他のユーザが他の端末装置12のタッチパネルに描画する画像(以下、描画画像という)の情報とを他の端末装置12から受け、左右を反転させたモデル画像と描画画像とを互いに重畳させた表示用画像を表示させる。端末装置12の自ユーザ(以下、自ユーザという)は、他の端末装置12の他のユーザ(以下、他ユーザという)との仮想対面コミュニケーションにおいて、他ユーザがタッチパネルに文字、図形等の描画画像を描画するときのモデル画像と描画画像とが自らの端末装置12にて表示されるので、あたかも透明パネルに描画をしながら透明パネル越しに他ユーザと対面コミュニケーションをするかのようなリアリティを体験する。また、自ユーザにおいて、他ユーザのモデル画像と描画画像とが左右反転した状態で表示されることで、描画画像の認識に際し違和感が低減されるので、利便性が向上する。このように、本実施形態によれば、仮想対面コミュニケーションにおけるリアリティと利便性の向上が可能となる。
サーバ装置10と端末装置12のそれぞれの構成について詳述する。
サーバ装置10は、通信部101、記憶部102、制御部103、入力部105、及び出力部106を有する。これらの構成は、サーバ装置10が二以上のサーバコンピュータで構成される場合には、二以上のコンピュータに適宜に配置される。
通信部101は、一以上の通信用インタフェースを含む。通信用インタフェースは、例えば、LANインタフェースである。通信部101は、サーバ装置10の動作に用いられる情報を受信し、またサーバ装置10の動作によって得られる情報を送信する。サーバ装置10は、通信部101によりネットワーク11に接続され、ネットワーク11経由で端末装置12と情報通信を行う。
記憶部102は、例えば、主記憶装置、補助記憶装置、又はキャッシュメモリとして機能する一以上の半導体メモリ、一以上の磁気メモリ、一以上の光メモリ、又はこれらのうち少なくとも2種類の組み合わせを含む。半導体メモリは、例えば、RAM(Random Access Memory)又はROM(Read Only Memory)である。RAMは、例えば、SRAM(Static RAM)又はDRAM(Dynamic RAM)である。ROMは、例えば、EEPROM(Electrically Erasable Programmable ROM)である。記憶部102は、サーバ装置10の動作に用いられる情報と、サーバ装置10の動作によって得られた情報とを格納する。
制御部103は、一以上のプロセッサ、一以上の専用回路、又はこれらの組み合わせを含む。プロセッサは、例えば、CPU(Central Processing Unit)などの汎用プロセッサ、又は特定の処理に特化したGPU(Graphics Processing Unit)等の専用プロセッサである。専用回路は、例えば、FPGA(Field-Programmable Gate Array)、ASIC(Application Specific Integrated Circuit)等である。制御部103は、サーバ装置10の各部を制御しながら、サーバ装置10の動作に係る情報処理を実行する。
入力部105は、一以上の入力用インタフェースを含む。入力用インタフェースは、例えば、物理キー、静電容量キー、ポインティングデバイス、ディスプレイと一体的に設けられたタッチパネル、又は音声入力を受け付けるマイクロフォンである。入力部105は、サーバ装置10の動作に用いられる情報を入力する操作を受け付け、入力される情報を制御部103に送る。
出力部106は、一以上の出力用インタフェースを含む。出力用インタフェースは、例えば、ディスプレイ又はスピーカである。ディスプレイは、例えば、LCD(Liquid Crystal Display)又は有機EL(Electro-Luminescence)ディスプレイである。出力部106は、サーバ装置10の動作によって得られる情報を出力する。
サーバ装置10の機能は、制御プログラムを、制御部103に含まれるプロセッサが実行することにより実現される。制御プログラムは、コンピュータをサーバ装置10として機能させるためのプログラムである。また、サーバ装置10の一部又は全ての機能が、制御部103に含まれる専用回路により実現されてもよい。また、制御プログラムは、サーバ装置10に読取り可能な非一過性の記録・記憶媒体に格納され、サーバ装置10が媒体から読み取ってもよい。
端末装置12は、通信部111、記憶部112、制御部113、入力部115、表示・出力部116、及び撮像部117を有する。
通信部111は、有線又は無線LAN規格に対応する通信モジュール、LTE、4G、5G等の移動体通信規格に対応するモジュール等を有する。端末装置12は、通信部111により、近傍のルータ装置又は移動体通信の基地局を介してネットワーク11に接続され、ネットワーク11経由でサーバ装置10等と情報通信を行う。
記憶部112は一以上の半導体メモリ、一以上の磁気メモリ、一以上の光メモリ、又はこれらのうち少なくとも2種類の組み合わせを含む。半導体メモリは、例えば、RAM又はROMである。RAMは、例えば、SRAM又はDRAMである。ROMは、例えば、EEPROMである。記憶部112は、例えば、主記憶装置、補助記憶装置、又はキャッシュメモリとして機能する。記憶部112は、制御部113の動作に用いられる情報と、制御部113の動作によって得られた情報とを格納する。
制御部113は、例えば、CPU、MPU(Micro Processing Unit)等の一以上の汎用プロセッサ、又は特定の処理に特化したGPU等の一以上の専用プロセッサを有する。あるいは、制御部113は、一以上の、FPGA、ASIC等の専用回路を有してもよい。制御部113は、制御・処理プログラムに従って動作したり、あるいは、回路として実装された動作手順に従って動作したりすることで、端末装置12の動作を統括的に制御する。そして、制御部113は、通信部111を介してサーバ装置10等と各種情報を送受し、本実施形態にかかる動作を実行する。
入力部115は、ディスプレイと一体的に設けられたタッチパネル及び一以上の入力用インタフェースを含む。入力部15は、タッチパネルに対する指、ポインティングデバイス等の接触位置の変位に基づき、描画画像の入力を検出し、検出した情報を制御部113へ送る。入力用インタフェースは、例えば、物理キー、静電容量キー、ポインティングデバイスを含む。また、入力用インタフェースは、音声入力を受け付けるマイクロフォンを含む。さらに、入力用インタフェースは、画像コードをスキャンするスキャナ又はカメラ、ICカードリーダを含んでもよい。入力部115は、制御部113の動作に用いられる情報を入力する操作を受け付け、入力される情報を制御部113に送る。
表示・出力部116は、画像を表示するディスプレイと、一以上の出力用インタフェースを含む。ディスプレイは、例えば、LCD又は有機ELディスプレイである。出力用インタフェースは、例えば、スピーカを含む。表示・出力部116は、制御部113の動作によって得られる情報を出力する。
撮像部117は、可視光による被写体の撮像画像を撮像するカメラと、被写体までの距離を測定して距離画像を取得する測距センサとを含む。カメラは、例えば毎秒15~30フレームで被写体を撮像して連続した撮像画像からなる動画像を生成する。測距センサは、ToF(Time Of Flight)カメラ、LiDAR(Light Detection And Ranging)、ステレオカメラを含み、距離情報を含んだ被写体の距離画像を生成する。撮像部117は、撮像画像と距離画像とを制御部113へ送る。
制御部113の機能は、制御部113に含まれるプロセッサが制御プログラムを実行することにより実現される。制御プログラムは、プロセッサを制御部113として機能させるためのプログラムである。また、制御部113の一部又は全ての機能が、制御部113に含まれる専用回路により実現されてもよい。また、制御プログラムは、端末装置12に読取り可能な非一過性の記録・記憶媒体に格納され、端末装置12が媒体から読み取ってもよい。
図2A、2Bは、ユーザが端末装置12を用いて対面コミュニケーションを行う態様を示す。
図2Aは、端末装置12を使用する自ユーザの態様を示す。自ユーザ20は、表示・出力部116のディスプレイに重畳して設けられる、入力部115のタッチパネルに文字、図柄等を描画しながら通話を行う。表示・出力部116は、ポインティングデバイス等の接触に対応する画像等の情報を表示する。撮像部117は、ディスプレイ上部、又はディスプレイを透過ディスプレイで構成した場合にはディスプレイの背後など、自ユーザ20の少なくとも上半身を撮像可能な位置に設けられる。
制御部113は、自ユーザ20の撮像画像と距離画像を撮像部117により取得する。また、制御部113は、自ユーザ20の発話音声を入力部115のマイクロフォンで集音する。さらに、制御部113は、入力部115のタッチパネルに自ユーザ20が描画する描画画像の情報を入力部115から取得する。制御部113は、自ユーザ20のモデル画像を生成するための自ユーザ20の撮像画像と距離画像、自ユーザ20が描画した描画画像、及び自ユーザ20の音声を再生するための音声情報を符号化して符号化情報を生成する。モデル画像は、例えば、3Dモデル、2Dモデル等であるが、以下、3Dモデルを例として説明する。制御部113は、符号化に際して、撮像画像等に対して任意の加工処理(例えば解像度変更、トリミング、写っていない部分の補完等)を行ってもよい。また、制御部113は、自ユーザ20の撮像画像に基づき、自ユーザ20に対する描画画像の位置を導出する。例えば、撮像部117とタッチパネルとの位置関係、及び撮像部117に対する自ユーザ20の位置と描画画像の位置とに基づいて、自ユーザ20に対する描画画像の位置が導出される。そして、制御部113は、導出した位置に対応するように、自ユーザ20の3Dモデルに対し描画画像を重畳させる位置を決定する。制御部113は、符号化情報を通信部111によりサーバ装置10を介して他の端末装置12へ送る。
図2Bは、端末装置12に表示される他ユーザの態様を示す。他ユーザ21の3Dモデルを含むレンダリング画像22は、表示・出力部116のディスプレイに、他ユーザ21が描画する描画画像23とともに表示される。
制御部113は、他の端末装置12からサーバ装置10を介して送られる符号化情報を、通信部111により受ける。制御部113は、他の端末装置12から受けた符号化情報を復号すると、復号された情報を用いて、他の端末装置12を用いる他ユーザ21を表す3Dモデルを生成する。3Dモデル生成に際し、制御部113は、他ユーザ21の距離画像を用いてポリゴンモデルを生成し、他ユーザ21の撮像画像を用いたテクスチャマッピングをポリゴンモデルに施すことにより、他ユーザ21の3Dモデルを生成する。ただし、3Dモデルの生成には、ここに示す例に限られず任意の手法が採用可能である。制御部113は、3Dモデルを含んだ仮想空間を仮想の視点から見たレンダリング画像22を生成する。仮想の視点は、例えば、自ユーザ20の目の位置である。制御部113は、自ユーザ20の撮像画像から、任意の基準に対する目の空間座標を導出し、仮想空間内の空間座標に対応付ける。任意の基準は、例えば撮像部117の位置である。他ユーザ21の3Dモデルは、仮想の視点に対しアイコンタクトを取りうる位置、角度に配置される。さらに制御部113は、レンダリング画像22に描画画像23を重畳して、表示用画像を生成する。描画画像23は、3Dモデルのペン等を保持した手の位置に対応するように配置される。制御部113は、表示・出力部116により、表示用画像を表示するとともに他ユーザ21の音声情報に基づく他ユーザ21の発話音声を出力する。
図3は、通話システム1の動作手順を説明するためのシーケンス図である。このシーケンス図は、サーバ装置10及び複数の端末装置12(それぞれを区別する際は、便宜上、端末装置12A及び12Bという)の連係動作にかかる手順を示す。この手順は、端末装置12Aが端末装置12Bを呼び出すときの手順である。複数の端末装置12Bが呼び出される場合には、ここに示す端末装置12Bに係る動作手順は複数の端末装置12Bのそれぞれにより、又は複数の端末装置12Bのそれぞれとサーバ装置10とにより、実行される。
図3におけるサーバ装置10及び端末装置12の各種情報処理に係るステップは、それぞれの制御部103及び113により実行される。また、サーバ装置10及び端末装置12の各種情報の送受に係るステップは、それぞれの制御部103及び113が、それぞれ通信部101、及び111を介して互いに情報を送受することにより実行される。サーバ装置10及び端末装置12では、それぞれ制御部103及び113が、それぞれ送受する情報を記憶部102及び112及びに適宜格納する。さらに、端末装置12の制御部113は、入力部115により各種情報の入力を受け付け、表示・出力部116により各種情報を出力する。
ステップS300において、端末装置12Aはそのユーザからの設定情報の入力を受け付ける。設定情報は、通話のスケジュール、通話相手のリスト等を含む。リストは、通話相手のユーザ名と各ユーザのメールアドレスとを含む。そして、ステップS301において、端末装置12Aは、設定情報をサーバ装置10へ送る。サーバ装置10は、端末装置12Aから送られる情報を受ける。例えば、端末装置12Aは、サーバ装置10から設定情報の入力画面を取得し、入力画面をユーザに表示する。そして、ユーザが入力画面に設定情報を入力することで、設定情報がサーバ装置10へ送られる。
ステップS302において、サーバ装置10は、設定情報に基づいて、通話相手を特定する。制御部103は、設定情報と通話相手の情報とを対応付けて記憶部102に格納する。
ステップS303において、サーバ装置10は、端末装置12Bへ認証情報を送る。認証情報は、端末装置12Bを用いる通話相手を特定して認証するためのID、パスコード等の情報である。これらの情報は、例えば、電子メールに添付されて送られる。端末装置12Bは、サーバ装置10から送られる情報を受ける。
ステップS305において、端末装置12Bは、サーバ装置10から受けた認証情報と認証申請の情報を、サーバ装置10へ送る。通話相手は、端末装置12Bを操作して、サーバ装置10から送られた認証情報を用いて、認証を申請する。例えば、端末装置12Bは、サーバ装置10が提供する通話のためのサイトにアクセスして、認証情報と認証申請のための情報の入力画面を取得し、入力画面を通話相手に表示する。そして、端末装置12Bは、通話相手が入力する情報を受け付けてサーバ装置10へ送る。
ステップS306において、サーバ装置10は、通話相手の認証を行う。記憶部102には、端末装置12Bの識別情報と通話相手の識別情報が対応付けて格納される。
ステップS308及びS309において、サーバ装置10は、それぞれ端末装置12A及び12Bへ、通話の開始通知を送る。端末装置12A及び12Bはそれぞれサーバ装置10から送られる情報を受けると、それぞれユーザの撮像と発話音声の集音を開始する。
ステップS310において、サーバ装置10を介して端末装置12A及び12Bによりユーザ間の通話を含む仮想対面コミュニケーションが実行される。端末装置12A及び12Bは、それぞれのユーザを表す3Dモデルを生成するための情報、描画画像、及び発話音声の情報を、サーバ装置10を介して互いに送受する。また、端末装置12A及び12Bは、それぞれのユーザに、他のユーザを表す3Dモデルを含む画像と他ユーザの発話音声とを出力する。
図4A、4Bは、仮想対面コミュニケーションの実行に係る端末装置12の動作手順を説明するフローチャート図である。ここに示す手順は、端末装置12A及び12Bに共通の手順であり、端末装置12A及び12Bを区別せずに説明する。
図4Aは、各端末装置12が、その端末装置12を用いる自ユーザの3Dモデルを生成するための情報を送出するときの、制御部113の動作手順に関する。
ステップS402において、制御部113は、可視光画像、距離画像の取得、描画画像の取得、及び音声の集音を行う。制御部113は、撮像部117により、任意に設定されるフレームレートでの自ユーザの可視光画像の撮像及び距離画像の取得を行う。また、制御部113は、入力部115により、描画画像を取得する。さらに、制御部113は、入力部115により自ユーザの発話の音声を集音する。
ステップS404において、制御部113は、撮像画像、距離画像、描画画像及び音声情報を符号化し、符号化情報を生成する。
ステップS406において、制御部113は、通信部111により符号化情報をパケット化し、他の端末装置12に向けてサーバ装置10へ送出する。
ステップS407において、制御部113は、表示倍率情報を他の端末装置12に向けてサーバ装置10へ送出する。表示倍率情報は、表示・出力部116による画像の表示倍率を示す情報である。表示倍率は、例えば、自ユーザの入力部115への操作に応じ、制御部113により設定される。あるいは、制御部113は、ディスプレイの解像度を表示・出力部116から取得し、その解像度に応じて表示倍率を決定してもよい。例えば、制御部113は、解像度が高いほど表示倍率を増大させる。制御部113は、表示・出力部116から表示倍率を取得して、通信部101により表示倍率情報を他の端末装置12に向けてサーバ装置10へ送出する。
制御部113は、撮像、集音を中断するための、又は仮想対面コミュニケーションを退出するための、自ユーザによる操作に対応して入力される情報を取得すると(S408のYes)、図4Aの処理手順を終了し、中断又は退出のための操作に対応する情報を取得しない間は(S408のNo)ステップS402~S407を実行して、自ユーザを表す3Dモデルを生成するための情報、描画画像、及び音声を出力するための情報を他の端末装置12に向けてサーバ装置へ送出する。
図4Bは、端末装置12が他ユーザの3Dモデルの画像、描画画像、及び音声を出力するときの、制御部113の動作手順に関する。制御部113は、他の端末装置12が図4Aの手順を実行することで送出するパケットを、サーバ装置10を介して受けると、ステップS410~S413を実行する。
ステップS410において、制御部113は、他の端末装置12から受けたパケットに含まれる符号化情報を復号して撮像画像、距離画像、描画画像及び音声情報を取得する。
ステップS411において、制御部113は、他ユーザの3Dモデルを表示するときの表示倍率を設定する。制御部113は、他の端末装置12から送られたその端末装置12の表示倍率に基づき、自らの端末装置12における表示倍率を設定する。制御部113は、他の端末装置12の表示倍率がN倍(Nは任意の正の数)のとき、自らの表示倍率を(1/N)倍に設定する。なお、複数の他の端末装置12からそれぞれ異なる表示倍率の情報が送られる場合、制御部113は、各端末装置12からの3Dモデルごとに表示倍率を設定する。
ステップS412において、制御部113は、撮像画像及び距離画像に基づいて、他の端末装置12の自ユーザを表す3Dモデルを生成する。複数の他の端末装置12から情報を受ける場合、制御部113は、他の端末装置12それぞれについてステップS410~S412を実行し、各自ユーザの3Dモデルを生成する。このとき、制御部113は、各3Dモデルを、その左右を反転させて生成する。例えば、制御部113は、3Dモデルを構成するポリゴンの座標において左右方向の座標を任意の中心に対し反転させることで、左右を反転させた3Dモデルを生成する。
ステップS413において、制御部113は、仮想空間に他ユーザを表す3Dモデルを配置する。記憶部112には、予め、仮想空間の座標情報と、他ユーザ毎の、例えば認証された順番に応じて3Dモデルを配置すべき座標の情報が格納される。制御部113は、仮想空間内の座標に、生成した3Dモデルを配置する。その際、制御部113は、他ユーザが存在する現実空間の撮像画像から、現実空間の左右を反転させた仮想空間を生成し、その仮想空間に左右を反転させた3Dモデルを配置してもよい。
ステップS414において、制御部113は、表示用画像を生成する。制御部113は、仮想空間に配置した3Dモデルを仮想の視点から撮像したレンダリング画像を生成する。なお、制御部113は、ステップS412で左右反転させた3Dモデルを生成し、ステップS413で現実空間の左右を反転させた仮想空間に左右を反転させた3Dモデルを配置する代わりに、ステップS412では左右反転させない状態で3Dモデルを生成し、ステップS414にて現実空間に対応する仮想空間に3Dモデルを配置してレンダリング画像を生成して、そのレンダリング画像の左右を反転させてもよい。そして、制御部113は、反転した3Dモデルに対応する位置に、左右反転させた描画画像を重畳して、表示用画像を生成してもよい。
ステップS416において、制御部113は、表示・出力部116により表示用画像を表示するとともに音声を出力する。
制御部113がステップS410~S416を繰り返し実行することで、自ユーザは、他ユーザの3Dモデルと、その3Dモデルが描画する描画画像を含んだ動画を見ながら、他ユーザの発話の音声を聞くことができる。その際、3Dモデルと描画画像が左右反転されているので、自ユーザにおいて利便性が向上する。例えば、図5Aに示すように、他ユーザ20の3Dモデルと入力部115が検出したとおりの描画画像23とを表示・出力部116に表示すると、描画画像が文字を含む場合など特に、左右が反転して認識しづらいおそれがある。その点、本実施形態によれば、図5Bに示すように、他ユーザ20の3Dモデルと描画画像23とが左右反転された状態で表示・出力部116に表示されるので、自ユーザにとって描画画像23の認識が容易になる。よって、自ユーザにとって利便性が向上する。
また、端末装置12における表示倍率を他の端末装置12における表示倍率に応じて設定することで、ユーザ同士のアイコンタクトが容易となる。
図6A~6Dは、仮想対面コミュニケーションにおける表示倍率の変化を模式的に示す。
図6Aは、ユーザ64、65が、それぞれの端末装置12における表示倍率が1:1の状態でコミュニケーションをする場合を示す。この場合、ユーザ64の視線66が自らの表示・出力部116におけるユーザ65の3Dモデルの目の位置に向かう一方、ユーザ65の視線67が自らの表示・出力部116におけるユーザ64の3Dモデルの目の位置に向かうことで、アイコンタクトが成立している。ここで、ユーザ64が表示倍率をM倍(M>1)にした場合が、図6B、6Cに示される。
図6Bには、ユーザ64の表示・出力部116において、ユーザ65の3DモデルがM倍の大きさに表示される態様が示される。すると、ユーザ64の視線66は、ユーザ65のM倍された3Dモデルの目の位置に、すなわち仰角を呈して上方に向かう。一方、図6Cには、ユーザ65の表示・出力部116において、ユーザ64の3Dモデルが1倍の大きさのままで表示される態様が示される。このとき、ユーザ64の3Dモデルの視線66が上方に向かうので、ユーザ65の視線67と合致しなくなり、アイコンタクトが失われる。そこで、ユーザ65の表示・出力部116において、表示倍率を(1/M)倍に設定することで、アイコンタクトが回復される。
図6Dには、ユーザ64の表示・出力部116において、ユーザ65の3DモデルがM倍の大きさに表示され、ユーザ65の表示・出力部116において、ユーザ64の3Dモデルが(1/M)倍の大きさに表示される態様が示される。ユーザ65の表示・出力部116において、ユーザ64の3Dモデルが(1/M)倍の表示倍率で、すなわち縮小されて表示されるので、ユーザ64の3Dモデルの上方へ向かう視線66が、ユーザ65の目の位置に向かうようになる。一方、ユーザ65は、ユーザ65の表示・出力部116において、縮小されたユーザ64の3Dモデルの目の位置に視線67を向かわせるようになるので、アイコンタクトが回復される。
他の端末装置12の表示倍率が増大した場合を例として説明したが、他の端末装置12の表示倍率が低下した場合には表示倍率を増大させることで、他のユーザとのアイコンタクトを回復させることが可能となる。
上述のように、端末装置12における表示倍率を他の端末装置12における表示倍率に応じて変更することで、ユーザ同士のアイコンタクトを確実に成立させることが可能となる。よって、仮想対面コミュニケーションにおけるリアリティと利便性の向上が可能となる。
上述の例では、端末装置12が他の端末装置12から他ユーザの3Dモデルを生成するための情報、すなわち、撮像画像、距離画像等を受けてから、3Dモデルを生成して仮想空間に3Dモデルを配置したレンダリング画像を生成した。しかしながら、3Dモデルの生成、レンダリング画像の生成等の処理は、適宜、端末装置12間で分散してもよい。例えば、他の端末装置12にて撮像画像等に基づき他ユーザの3Dモデルが生成され、3Dモデルの情報を受けた端末装置12が、その3Dモデルを用いてレンダリング画像を生成してもよい。
上述において、実施形態を諸図面及び実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形及び修正を行うことが容易であることに注意されたい。従って、これらの変形及び修正は本開示の範囲に含まれることに留意されたい。例えば、各手段、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数の手段、ステップ等を1つに組み合わせたり、或いは分割したりすることが可能である。
1 通話システム
10 サーバ装置
11 ネットワーク
12 端末装置
101、111 通信部
102、112 記憶部
103、113 制御部
105、115 入力部
106 出力部
116 表示・出力部
117 撮像部

Claims (3)

  1. 通信部と、
    表示部と、
    前記表示部に重畳するタッチパネルを有する入力部と、
    ユーザを撮像する撮像部と、
    前記通信部により通信を行う制御部とを有する端末装置において、
    前記制御部は、他の端末装置を用いる他のユーザの撮像画像に基づき当該他のユーザを表すモデル画像を生成するための情報と、当該他のユーザが当該他の端末装置のタッチパネルに描画する描画画像の情報とを当該他の端末装置から受け、左右を反転させた前記モデル画像と左右を反転させた前記描画画像とを互いに重畳させた表示用画像を前記表示部に表示させ
    前記制御部は、前記表示部による前記表示用画像の第1の表示倍率を前記他の端末装置における表示用画像の第2の表示倍率が増大したときに減少させ、前記第1の表示倍率を前記第2の表示倍率が減少したときに増大させる、
    端末装置。
  2. 請求項1において、
    前記制御部は、前記他のユーザが存在する現実空間の左右を反転させた仮想空間に左右を反転させた前記モデル画像と当該モデル画像を配置したレンダリング画像を生成し、当該レンダリング画像に前記左右を反転させた描画画像を重畳させて前記表示用画像を生成する、
    端末装置。
  3. 請求項1において、
    前記制御部は、前記他のユーザが存在する現実空間に対応する仮想空間に前記モデル画像と当該モデル画像を配置したレンダリング画像を生成し、当該レンダリング画像の左右を反転させて前記左右を反転させた画像と重畳させることで前記表示用画像を生成する、端末装置。
JP2022167110A 2022-10-18 2022-10-18 端末装置 Active JP7694530B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022167110A JP7694530B2 (ja) 2022-10-18 2022-10-18 端末装置
CN202311342645.9A CN117915062A (zh) 2022-10-18 2023-10-17 终端装置
US18/489,508 US20240127769A1 (en) 2022-10-18 2023-10-18 Terminal apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022167110A JP7694530B2 (ja) 2022-10-18 2022-10-18 端末装置

Publications (2)

Publication Number Publication Date
JP2024059435A JP2024059435A (ja) 2024-05-01
JP7694530B2 true JP7694530B2 (ja) 2025-06-18

Family

ID=90626782

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022167110A Active JP7694530B2 (ja) 2022-10-18 2022-10-18 端末装置

Country Status (3)

Country Link
US (1) US20240127769A1 (ja)
JP (1) JP7694530B2 (ja)
CN (1) CN117915062A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005287004A (ja) 2004-03-03 2005-10-13 Canon Inc 画像表示方法、プログラム、画像表示装置及び画像表示システム
JP2010193043A (ja) 2009-02-17 2010-09-02 Sharp Corp テレビ電話装置
JP6714942B1 (ja) 2020-03-04 2020-07-01 フォクレット合同会社 コミュニケーションシステム、コンピュータプログラム、及び情報処理方法
WO2021220494A1 (ja) 2020-04-30 2021-11-04 塁 佐藤 通信端末装置、通信方法、およびソフトウェアプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8537196B2 (en) * 2008-10-06 2013-09-17 Microsoft Corporation Multi-device capture and spatial browsing of conferences
WO2021045276A1 (ko) * 2019-09-06 2021-03-11 엘지전자 주식회사 이동 단말기 및 그 제어 방법
US11265181B1 (en) * 2021-01-30 2022-03-01 Zoom Video Communications, Inc. Multi-point video presentations with live annotation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005287004A (ja) 2004-03-03 2005-10-13 Canon Inc 画像表示方法、プログラム、画像表示装置及び画像表示システム
JP2010193043A (ja) 2009-02-17 2010-09-02 Sharp Corp テレビ電話装置
JP6714942B1 (ja) 2020-03-04 2020-07-01 フォクレット合同会社 コミュニケーションシステム、コンピュータプログラム、及び情報処理方法
WO2021220494A1 (ja) 2020-04-30 2021-11-04 塁 佐藤 通信端末装置、通信方法、およびソフトウェアプログラム

Also Published As

Publication number Publication date
JP2024059435A (ja) 2024-05-01
US20240127769A1 (en) 2024-04-18
CN117915062A (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
JP7694530B2 (ja) 端末装置
CN116264596B (zh) 终端装置、终端装置的动作方法以及系统
JP7666479B2 (ja) 端末装置
JP7632429B2 (ja) 端末装置
JP7694555B2 (ja) 端末装置
JP7718448B2 (ja) 端末装置
JP7616109B2 (ja) 端末装置、端末装置の動作方法及びプログラム
JP7605179B2 (ja) サーバ装置、システム、及びシステムの動作方法
JP2023092323A (ja) 端末装置、端末装置の動作方法、及びシステム
JP2024059439A (ja) 端末装置
JP7835003B2 (ja) 端末装置、プログラム、及び端末装置の動作方法
JP7687330B2 (ja) 端末装置
US12499791B2 (en) Terminal apparatus, method, and non-transitory computer readable medium for displaying stereoscopic images using light field display
JP7673708B2 (ja) 端末装置、端末装置の動作方法、及びシステム
US12353705B2 (en) Terminal apparatus
JP2024109394A (ja) 端末装置
JP2024095387A (ja) 端末装置及び端末装置の動作方法
JP2024101886A (ja) 端末装置
JP2024044908A (ja) 方法、プログラム、及び端末装置
JP2023146940A (ja) 端末装置、端末装置の動作方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240403

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250520

R150 Certificate of patent or registration of utility model

Ref document number: 7694530

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150