JP6550307B2 - Image display system and image display method - Google Patents
Image display system and image display method Download PDFInfo
- Publication number
- JP6550307B2 JP6550307B2 JP2015180009A JP2015180009A JP6550307B2 JP 6550307 B2 JP6550307 B2 JP 6550307B2 JP 2015180009 A JP2015180009 A JP 2015180009A JP 2015180009 A JP2015180009 A JP 2015180009A JP 6550307 B2 JP6550307 B2 JP 6550307B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- display
- computer
- user
- home server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Closed-Circuit Television Systems (AREA)
Description
本発明は、画像表示システム及び画像表示方法に係り、特に、ユーザの映像を構成するフレーム画像について、その画像データの伝送負荷を軽減することが可能な画像表示システム及び画像表示方法に関する。 The present invention relates to an image display system and an image display method, and more particularly to an image display system and an image display method capable of reducing a transmission load of image data of a frame image constituting a video of a user.
ICT(情報通信技術)を利用した画像表示システムは既に知られている。かかるシステムは、例えば、互いに離れた空間に居るユーザ同士が対話する際に利用される。このようなケースにおいて、各ユーザは、スクリーン等の表示器に表示された対話相手の画像(より具体的には、複数のフレーム画像からなる映像)を見ながら、当該対話相手を話すことが可能である。これにより、表示器を通じて対話相手を見ているユーザは、当該対話相手と実際に対面しているときと同じ雰囲気(臨場感)の中で対話することが可能となる。 Image display systems using ICT (information communication technology) are already known. Such a system is used, for example, when users in different spaces interact with each other. In such a case, each user can talk to the other party while viewing the image of the other party (more specifically, a video composed of a plurality of frame images) displayed on the display such as a screen. It is. This enables the user who is looking at the other party of the dialogue through the display to interact in the same atmosphere (realism) as when actually facing the other party of the dialogue.
一方、対話の臨場感は、表示器に表示される対話相手の画像が高画質であるほど向上する。しかし、その反面、対話相手の画像が高画質になるほど、当該対話相手側から送られてくる画像データのデータ容量が大きくなってしまい、当該画像データの送受信に係る負荷(通信負荷)が大きくなってしまう。このような問題に対する方策としては、例えば、画像を新たに取得した際に、前回取得した画像との差分に相当する画像(すなわち、動いた部分の画像)のみの画像データを送ることが考えられる(特許文献1参照)。かかる構成であれば、画像データの送信時にデータ容量を削減すると共に、画像受信装置において高画質な画像(映像)を表示させることが可能となる。 On the other hand, the sense of realism of dialogue improves as the image of the other party of the dialogue displayed on the display device has higher image quality. However, on the other hand, the higher the quality of the image of the conversation partner, the larger the data capacity of the image data sent from the conversation partner, and the load (communication load) associated with transmission and reception of the image data increases. It will As a measure against such a problem, for example, when an image is newly acquired, it is possible to send image data of only an image (that is, an image of a moved part) corresponding to the difference from the previously acquired image. (See Patent Document 1). With such a configuration, it is possible to reduce the data capacity at the time of transmission of the image data and to display a high quality image (video) in the image receiving apparatus.
ところで、フレーム画像に表示されている人物が動いた場合には、動いた部分(被特定部分)を特定した上で、当該被特定部分の画像データを送信することになる。一方、被特定部分を特定する際には、当然ながら適切な手順によって精度よく特定することが求められる。特に、上記システムを用いた対話では、被特定部分が適切に特定されるかどうかが対話の臨場感に対して影響を及ぼし得る。 By the way, when the person displayed in the frame image moves, after the moved portion (specified portion) is specified, the image data of the specified portion is transmitted. On the other hand, when specifying the specified part, it is naturally required to specify with high accuracy by an appropriate procedure. In particular, in the dialog using the above system, whether or not the specified part is properly identified may affect the realism of the dialog.
そこで、本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、画像データの伝送負荷を軽減しつつ、フレーム画像に映し出された人物に動きがあった際にその部分を適切に特定することが可能な画像表示システムを提供することである。同様に、本発明の他の目的は、画像データの伝送負荷を軽減しつつ、フレーム画像に映し出された人物に動きがあった際にその部分を適切に特定することが可能な画像表示方法を提供することである。 Therefore, the present invention has been made in view of the above problems, and the object of the present invention is to reduce the transmission load of image data and to move the person displayed in the frame image. It is providing the image display system which can identify a part appropriately. Similarly, another object of the present invention is to provide an image display method capable of appropriately specifying a part when a person shown in a frame image moves while reducing transmission load of image data. It is to provide.
前記課題は、本発明の画像表示システムによれば、(A)第一ユーザを撮像する撮像装置と、(B)前記第一ユーザの身体各部の位置に関する計測対象値を計測する計測装置と、(C)該撮像装置が撮像した前記第一ユーザの映像を構成するフレーム画像を取得する第一コンピュータと、(D)前記フレーム画像を取得するために前記第一コンピュータと通信する第二コンピュータと、(E)該第二コンピュータが取得した前記フレーム画像を、前記第一ユーザとは異なる場所に居る第二ユーザに対して表示する表示器と、を有し、(F)前記第一コンピュータは、(f1)前回の前記フレーム画像の取得時から今回の前記フレーム画像の取得時までの期間中における前記計測対象値の計測結果の変化に基づいて、前記身体各部のうち、前記期間中に動いた被特定部分を特定する処理と、(f2)前記第一コンピュータが今回取得した前記フレーム画像における前記第一ユーザの人物画像のうち、前記被特定部分を含む領域を抽出する処理と、(f3)前記領域の画像データを生成して前記第二コンピュータに向けて送信する処理と、を実行し、(G)前記第二コンピュータは、前記領域の前記画像データを受信すると、該画像データの受信前に前記表示器に表示された前記フレーム画像のうち、前記領域と対応した位置に前記領域の画像を重ね合わせることで構成された前記フレーム画像を、前記表示器に表示させることにより解決される。 According to the image display system of the present invention, the subject includes (A) an imaging device for imaging a first user, and (B) a measurement device for measuring a measurement target value regarding the position of each part of the first user. (C) a first computer for acquiring a frame image constituting an image of the first user captured by the imaging device; (D) a second computer for communicating with the first computer for acquiring the frame image; (E) a display for displaying the frame image acquired by the second computer to a second user located at a place different from the first user, and (F) the first computer (F1) The above-mentioned each of the body parts based on the change in the measurement result of the measurement target value during the period from the previous acquisition of the frame image to the current acquisition of the frame image. (F2) a process of extracting an area including the identified part from the person image of the first user in the frame image acquired this time by the first computer; And (f3) a process of generating image data of the area and transmitting it to the second computer, and (G) the second computer receives the image data of the area, The display unit is configured to display the frame image configured by superimposing the image of the area on a position corresponding to the area among the frame images displayed on the display before receiving the image data. Solved by
以上のように構成された本発明の画像表示システムでは、第一ユーザの身体各部の位置に関する計測対象値の計測結果の変化に基づいて、第一ユーザの身体中、前回のフレーム画像取得時から今回のフレーム画像取得時までの期間中に動いた部分(すなわち、被特定部分)を特定する。すなわち、本発明の画像表示システムでは、上記の計測対象値の計測結果の変化に基づいて被特定部分を特定するので、当該被特定部分を的確に特定することが可能となる。
一方、第一コンピュータは、今回取得したフレーム画像における第一ユーザの人物画像から被特定部分を含む領域を抽出し、当該領域の画像データを第二コンピュータに向けて送信する。これにより、第一ユーザの人物画像全体の画像データを送信する場合に比して、データ伝送負荷を軽減することが可能となる。
以上により、本発明の画像表示システムによれば、画像データの伝送負荷を軽減しつつ、フレーム画像に映し出された人物の身体において動いた部分(すなわち、被特定部分)を適切に特定することが可能となる。
In the image display system of the present invention configured as described above, based on the change in the measurement result of the measurement target value regarding the position of each part of the body of the first user, in the body of the first user, from the time of previous frame image acquisition A portion (that is, a specified portion) moved during the period up to the frame image acquisition time this time is identified. That is, in the image display system of the present invention, the identified part is identified based on the change in the measurement result of the measurement target value, so that the identified part can be identified accurately.
On the other hand, the first computer extracts an area including the specified part from the person image of the first user in the frame image acquired this time, and transmits the image data of the area to the second computer. As a result, it is possible to reduce the data transmission load as compared to the case of transmitting the image data of the entire person image of the first user.
As described above, according to the image display system of the present invention, it is possible to appropriately identify a moved part (that is, a specified part) in the body of a person shown in a frame image while reducing the transmission load of image data. It becomes possible.
また、本発明の画像表示システムについて好適な構成を述べると、前記第一コンピュータは、前記被特定部分を特定する処理において、前記期間中における前記計測対象値の計測結果の変化に基づいて、前記第一ユーザの骨格において複数設定された設定部位のうち、前記期間中に動いた前記設定部位を特定し、該設定部位を少なくとも含むように前記被特定部分を特定するとよい。
上記の構成では、第一ユーザの骨格において複数設定された設定部位について動きの有無を見ることで被特定部分を特定することが可能となる。このような構成であれば、被特定部分を特定するにあたり、各設定部位における動きの有無を確認すればよいので、より容易に被特定部分を特定することが可能となる。
Further, to describe a suitable configuration of the image display system according to the present invention, in the process of identifying the specified portion, the first computer determines the configuration based on a change in the measurement result of the measurement target value during the period. Of the plurality of setting sites set in the skeleton of the first user, the setting site moved during the period may be specified, and the specified portion may be specified to include at least the setting site.
In the above configuration, it becomes possible to specify the specified part by looking at the presence or absence of movement for the plurality of set parts set in the skeleton of the first user. With such a configuration, it is possible to identify the specified part more easily because it is sufficient to confirm the presence or absence of the movement at each setting site when specifying the specified part.
また、本発明の画像表示システムについてより好適な構成を述べると、前記第一コンピュータは、前記被特定部分を特定する処理において前記期間中に動いた前記設定部位を特定する際、前記期間中における前記設定部位の変位量が閾値以上であるかどうかの判定を前記設定部位毎に行い、前記変位量が前記閾値以上である前記設定部位を前記期間中に動いた前記設定部位として特定するとよい。
上記の構成では、設定部位の変位量が閾値以上であるかどうかの判定を設定部位毎に行う。このような設定部位毎の判定を通じて、各設定部位における動きの有無、換言すると被特定部位の特定を一段と容易に行うことが可能となる。
Further, to describe a more preferable configuration of the image display system according to the present invention, when the first computer specifies the set site moved during the period in the process of specifying the specified portion, the first computer may The determination as to whether the displacement amount of the setting site is equal to or more than a threshold may be performed for each setting site, and the setting site having the displacement amount equal to or more than the threshold may be specified as the setting site moved during the period.
In the above configuration, it is determined for each set site whether the displacement amount of the set site is equal to or greater than a threshold. Through such determination for each set site, it is possible to more easily determine the presence or absence of movement in each set site, in other words, the specified site.
また、本発明の画像表示システムについて更に好適な構成を述べると、前記第一コンピュータは、前記判定を前記設定部位毎に行う際、ある前記設定部位についての前記判定の次に、ある前記設定部位の隣に位置する前記設定部位についての前記判定を行い、前記被特定部分を含む前記領域を抽出する際には、前記期間中に動いた前記設定部位すべてが前記領域内に含まれるように前記領域を抽出するとよい。
上記の構成では、ある設定部位についての判定の次に、ある設定部位の隣に位置する設定部位についての判定を行う。そして、被特定部分を含む領域を抽出する際には、前回のフレーム画像取得時と今回のフレーム画像取得時までの期間中に動いた設定部位すべてが含まれるように領域を抽出する。これにより、第一ユーザの人物画像中、動いた部分の画像が適切に抽出されるようになる。そして、抽出された領域の画像を前回の表示画像(フレーム画像)に重ね合わせることで、第一コンピュータが今回取得したフレーム画像(厳密には、当該フレーム画像における第一ユーザの人物画像)を適切に再現することが可能となる。
Further, to describe a further preferable configuration of the image display system of the present invention, when the first computer performs the determination for each of the set regions, the first set region after the determination of the predetermined region. When performing the determination on the set site located next to the target area and extracting the area including the specified part, the set site moved during the period is included in the area. It is good to extract the area.
In the above configuration, after the determination on a certain set site, the determination on the set site located next to the certain set site is performed. Then, when extracting the area including the specified part, the area is extracted so as to include all the set parts moved during the period from the previous frame image acquisition to the current frame image acquisition. As a result, in the person image of the first user, the image of the moved part is properly extracted. Then, by superimposing the image of the extracted area on the previous display image (frame image), the frame image acquired this time by the first computer (strictly speaking, the person image of the first user in the frame image) is appropriately used. It is possible to reproduce in
また、本発明の画像表示システムについて一段と好適な構成を述べると、複数設定された前記設定部位のうちの少なくとも一つは、前記第一ユーザの上半身の体軸上にある部位であり、前記第一コンピュータは、前記体軸上にある前記設定部位についての前記判定において前記変位量が前記閾値以上であると判定したとき、前記上半身の画像を前記領域として抽出するとよい。
上記の構成では、体軸上にある設定部位の変位量が閾値以上であると判定したとき、上半身の画像を領域として抽出する。このように上半身画像という単位で領域抽出を行うことにより、領域抽出に係る処理がより簡易的に実行されるようになる。
Further, to describe a further preferable configuration of the image display system of the present invention, at least one of the plurality of set parts set is a part on the body axis of the upper body of the first user, The one computer may extract the image of the upper body as the area when it is determined that the displacement amount is equal to or more than the threshold value in the determination of the set region on the body axis.
In the above configuration, when it is determined that the displacement amount of the set region on the body axis is equal to or more than the threshold, the image of the upper body is extracted as a region. By performing area extraction in units of upper body images in this manner, processing relating to area extraction can be performed more simply.
また、本発明の画像表示システムについて尚一層好適な構成を述べると、前記第一コンピュータは、前記フレーム画像中の背景画像を示す背景画像データを、前記背景画像以外の画像データと分けて生成して前記第二コンピュータに向けて送信する処理を実行し、前記第一コンピュータが前記背景画像データを送信する処理を実行する頻度は、前記第一コンピュータが前記撮像装置から前記フレーム画像を取得する頻度よりも少ないとよい。
上記の構成では、フレーム画像中の背景画像を示す背景画像データを、背景画像以外の画像データと分けて生成して第二コンピュータに向けて送信する。また、背景画像データの送信頻度は、第一コンピュータが撮像装置からフレーム画像を取得する頻度よりも少なくなっている。これは、一般に背景画像における変化が少ないことを反映しているためである。すなわち、背景画像の画像データについては送信回数がより少なく済む。このため、上記の構成のように背景画像データの送信頻度をフレーム画像の取得頻度よりも少なくすることでデータ伝送負荷をより軽減することが可能となる。
Further, to describe the still more preferable configuration of the image display system of the present invention, the first computer generates background image data indicating a background image in the frame image separately from image data other than the background image. And the frequency at which the first computer executes the process of transmitting the background image data is the frequency at which the first computer acquires the frame image from the imaging device. Better than less.
In the above configuration, the background image data indicating the background image in the frame image is generated separately from the image data other than the background image and transmitted to the second computer. Further, the transmission frequency of the background image data is smaller than the frequency at which the first computer acquires the frame image from the imaging device. This is because this generally reflects that the change in the background image is small. That is, for the image data of the background image, the number of transmissions can be reduced. For this reason, it is possible to further reduce the data transmission load by setting the transmission frequency of background image data to be lower than the acquisition frequency of frame images as in the above configuration.
また、本発明の画像表示システムについて益々好適な構成を述べると、前記表示器の前に前記第二ユーザが居る状態で前記第二ユーザと前記表示器との位置関係及び前記第二ユーザの姿勢のうち、少なくとも一つの内容に関する情報を前記第二コンピュータに提供する情報提供装置を有し、前記第一コンピュータは、前記第二コンピュータが前記情報から特定した前記少なくとも一つの内容を取得する処理を更に実行し、前記領域の前記画像データを生成する処理では、前記領域の画像中、前記表示器において前記少なくとも一つの内容に応じて決まる範囲に表示される第一画像よりも該第一画像とは異なる範囲に表示される第二画像が低画質となるように前記領域の前記画像データを生成するとよい。
上記の構成では、抽出された領域の画像中、所定範囲にある画像(例えば、表示器に表示された際に第二ユーザの中心視野領域内にある画像)以外の画像について画質を低下させる。これは、中心視野領域以外の画像が視覚的に認識され難い画像であるため、当該画像の画質が比較的低かったとしても、第二ユーザが感じる対話の臨場感に及ぶ影響が小さいことを反映しているためである。故に、上記の構成によれば、データ伝送負荷を一段と軽減することが可能となる。かかる効果は、抽出された領域が広域になるほど有効に発揮されることとなる。
Further, to describe the configuration of the image display system according to the present invention, the positional relationship between the second user and the display and the posture of the second user in the state where the second user is in front of the display. Information providing apparatus for providing the second computer with information related to at least one content, the first computer processing for acquiring the at least one content specified by the second computer from the information Further, in the process of generating the image data of the area, the first image displayed in the range of the area determined according to the content of the at least one in the image of the area is more The image data of the area may be generated such that a second image displayed in a different area has a low image quality.
In the above configuration, the image quality of an image other than an image in a predetermined range (for example, an image in the central visual field of the second user when displayed on the display) in the extracted area is degraded. This reflects that the images other than the central visual field are difficult to be visually recognized, so even if the image quality of the image is relatively low, the influence on the sense of realism of the dialogue felt by the second user is small. It is because Therefore, according to the above configuration, it is possible to further reduce the data transmission load. Such an effect is more effectively exhibited as the extracted area becomes wider.
また、本発明の画像表示システムについて殊更好適な構成を述べると、前記表示器の前に前記第二ユーザが居る状態で前記第二ユーザと前記表示器との間の距離を計測する距離計測装置を有し、前記第一コンピュータは、前記第二コンピュータから前記距離の計測結果を取得し、前記距離が予め設定された大きさ以上であるときには、前記人物画像の画質を所定の画質まで低下させ、低下後の画質の前記人物画像を示す低画質人物画像データを生成して前記第二コンピュータに向けて送信するとよい。
上記の構成では、第二ユーザと表示器との間の距離が予め設定された大きさ以上であるとき、第一ユーザの人物画像の画質を低下させ、低下後の画質の人物画像を示すデータ(低画質人物画像データ)を生成して第二コンピュータに向けて送信する。これは、上記の距離が設定値よりも大きくなったとき、表示器に表示されている画像の画質が多少低下したとしても、第二ユーザが感じる対話の臨場感に及ぶ影響が小さいことを反映しているためである。故に、上記の構成によれば、対話の臨場感を確保しつつ、データ伝送負荷を軽減することが可能となる。
Further, to describe the particularly preferable configuration of the image display system according to the present invention, a distance measuring device for measuring a distance between the second user and the display in a state where the second user is in front of the display. And the first computer acquires the measurement result of the distance from the second computer, and reduces the image quality of the person image to a predetermined image quality when the distance is greater than or equal to a preset size. Preferably, low-quality person image data representing the person image of the image quality after deterioration is generated and transmitted to the second computer.
In the above configuration, when the distance between the second user and the display is equal to or greater than the preset size, the image quality of the person image of the first user is degraded, and data indicating the person image of the image quality after degradation (Low-quality human image data) is generated and transmitted to the second computer. This reflects that the influence on the sense of realism of the dialogue felt by the second user is small even if the image quality of the image displayed on the display is slightly degraded when the above distance becomes larger than the set value. It is because Therefore, according to the above configuration, it is possible to reduce the data transmission load while securing the sense of reality of the dialogue.
また、前述した課題は、本発明の画像表示方法によれば、撮像装置が撮像した第一ユーザの映像を構成するフレーム画像を取得する第一コンピュータと、前記フレーム画像を取得するために前記第一コンピュータと通信する第二コンピュータと、を用いて、前記第二コンピュータが取得した前記フレーム画像を表示器により前記第一ユーザとは異なる場所に居る第二ユーザに対して表示する画像表示方法であって、(A)前記第一コンピュータが、前記第一ユーザの身体各部の位置に関する計測対象値を計測する計測装置から、前記計測対象値の計測結果を取得する処理を実行することと、(B)前記第一コンピュータが、前回の前記フレーム画像の取得時から今回の前記フレーム画像の取得時までの期間中における前記計測対象値の計測結果の変化に基づいて、前記身体各部のうち、前記期間中に動いた被特定部分を特定する処理を実行することと、(C)前記第一コンピュータが、今回取得した前記フレーム画像における前記第一ユーザの人物画像のうち、前記被特定部分を含む領域を抽出する処理を実行することと、(D)前記第一コンピュータが、前記領域の画像データを生成して前記第二コンピュータに向けて送信する処理を実行することと、(E)前記第二コンピュータが、前記画像データを受信すると、該画像データの受信前に前記表示器に表示された前記フレーム画像のうち、前記領域と対応した位置に前記画像データが示す前記領域の画像を重ね合わせることで構成された前記フレーム画像を、前記表示器に表示させることと、を有することにより解決される。
上記の方法によれば、画像データの伝送負荷を軽減しつつ、フレーム画像における第一ユーザの人物画像中、第一ユーザの身体において動いた部分(すなわち、被特定部分)を適切に特定することが可能となる。
Another object described above, according to the image display method of the present invention, a first computer imaging apparatus acquires a frame image constituting the video of a first user who has captured the in order to obtain the frame image first An image display method for displaying the frame image acquired by the second computer using a display to a second user who is at a different place from the first user using a second computer in communication with the one computer (A) the first computer executes processing for acquiring the measurement result of the measurement target value from a measurement device that measures the measurement target value regarding the position of each part of the first user's body; B) The first computer measures the measurement target value during the period from the previous acquisition of the frame image to the current acquisition of the frame image. Performing, on the basis of the change in the part of the body, a process for identifying a specified part that has moved during the period; and (C) the first computer in the frame image acquired this time. Performing a process of extracting an area including the specified part in the person image of the user; and (D) the first computer generates image data of the area and transmits it to the second computer (E) when the second computer receives the image data, a position corresponding to the area in the frame image displayed on the display before the image data is received And displaying the frame image configured by superimposing the image of the area indicated by the image data on the display.
According to the above method, while reducing the transmission load of the image data, in the person image of the first user in the frame image, it is possible to appropriately identify the moved part (that is, the identified part) in the body of the first user. Is possible.
本発明の画像表示システム及び画像表示方法によれば、画像データの伝送負荷を軽減しつつ、フレーム画像におけるユーザの人物画像のうち、当該ユーザの身体の中で動いた部分を適切に特定することが可能となる。この結果、よりスムーズな画像データの送受信を実現しつつ、対話相手の人物画像を表示器に表示しながら行われる対話の臨場感(リアル感)を確保することが可能となる。 According to the image display system and the image display method of the present invention, it is possible to appropriately identify a portion of the person image of the user in the frame image that has moved within the body of the user while reducing the transmission load of the image data. Is possible. As a result, while realizing smoother image data transmission and reception, it is possible to secure a sense of reality (real feeling) of the dialogue performed while displaying the person image of the dialogue partner on the display.
以下、本発明の一実施形態(以下、本実施形態)について説明する。なお、以下に説明する実施形態は、本発明の理解を容易にするための一例に過ぎず、本発明を限定するものではない。すなわち、本発明は、その趣旨を逸脱することなく、変更、改良され得ると共に、本発明にはその等価物が含まれることは勿論である。 Hereinafter, an embodiment of the present invention (hereinafter, the present embodiment) will be described. The embodiments described below are merely examples for facilitating the understanding of the present invention, and are not intended to limit the present invention. That is, the present invention can be modified and improved without departing from the gist thereof, and the present invention naturally includes the equivalents thereof.
<<本実施形態に係る画像表示システムの用途>>
先ず、本実施形態に係る画像表示システム(以下、本システムS)について、その用途を概説する。本システムSは、互いに離れた場所に居るユーザ同士が互いの姿を見ながら対話するために用いられる。つまり、本システムSを用いた対話(以下、対話通信)において、各ユーザは、実際に対話相手と会って話をしているような感覚を感じるようになる。以下の説明では、上記の視覚的効果を臨場感(リアル感)と呼ぶこととする。
<< Application of image display system according to the present embodiment >>
First, the application of the image display system (hereinafter, the present system S) according to the present embodiment will be outlined. The present system S is used to allow users in distant places to interact with each other while looking at each other. That is, in a dialogue (hereinafter, dialogue communication) using the present system S, each user comes to feel as if he / she is actually talking to the other party. In the following description, the above-mentioned visual effect will be referred to as realism.
なお、本実施形態の対話通信は、各ユーザが各自宅の所定の部屋(自分の部屋)内に居るときに行われるものである。ただし、これに限定されるものではなく、ユーザが自宅以外の場所、例えば、集会所や商業施設、あるいは学校の教室や学習塾、病院等の公共施設、会社や事務所等に居るときに本システムSによる対話通信が行われてもよい。また、同じ建物内に居るユーザが当該建物内の異なる部屋に居るときに対話通信が行われてもよい。
以上のように本システムSは、互いに異なる場所に居る者同士が相手の顔を見ながら対話するシチュエーションにおいて幅広く利用することが可能である。
Note that the dialog communication of this embodiment is performed when each user is in a predetermined room (own room) of each home. However, the present invention is not limited to this, and it is useful when the user is in a place other than home, for example, a meeting place or commercial facility, a school classroom or learning school, a public facility such as a hospital, a company or office, etc. Dialogue communication may be performed by the system S. In addition, interactive communication may be performed when users in the same building are in different rooms in the building.
As described above, the present system S can be widely used in situations where persons in different places interact with each other while looking at the face of the other.
以下、ユーザであるAさんとBさんとが対話通信を行うケースを例に挙げて説明する。また、以下では、Bさん側の視点(換言すると、Aさんの姿を見る立場)から説明することとする。かかるケースにおいて、Aさんが「第一ユーザ」に相当し、Bさんが「第二ユーザ」に相当する。ここで、「第一ユーザ」及び「第二ユーザ」は、画像を見る者及び見られる者の関係に応じて切り替わる相対的な概念であり、Aさん側の視点を基準としたときにはBさんが「第一ユーザ」に相当し、Aさんが「第二ユーザ」に相当することとなる。 Hereinafter, a case in which the user A and the user B communicate with each other will be described as an example. Also, in the following, it will be explained from the viewpoint of Mr. B (in other words, the position to see Mr. A's figure). In such a case, Mr. A corresponds to the "first user", and Mr. B corresponds to the "second user". Here, “first user” and “second user” are relative concepts that are switched according to the relationship between the viewer and the viewer of the image. It corresponds to the "first user" and Mr. A corresponds to the "second user".
Aさん及びBさんの双方は、対話通信を行うにあたり、各自の部屋に入室する。具体的に説明すると、各自の部屋にはミラー型の表示器(詳しくは図2に図示のディスプレイ5)が配置されている。Aさん及びBさんは、対話通信を行う上で、表示器の正面位置まで移動する。この際、本システムSが起動していると対話通信が開始される。なお、システム起動タイミングについては、特に限定されるものではなく、好適なタイミングであれば上記の内容と異なるタイミングであってもよい。
Both Mr. A and Mr. B will enter their own room when conducting dialogue communication. Specifically, a mirror-type display (specifically, the
対話通信が開始されると、Bさん側の表示器にAさんの画像が表示される。この画像は、Aさん側に設けられたカメラ2(撮像装置に相当)が撮像した画像であり、厳密に説明すると、当該カメラ2が撮像したAさんの映像を構成するフレーム画像である。すなわち、Bさん側の表示器に表示される画像は、一定の速度(具体的には、フレーム画像の取得速度に相当する速度)にて切り替わるようになる。これにより、表示器にはAさんの連続画像、すなわち映像が表示されるようになり、Bさんは、あたかもAさんと対面しているような感じ(臨場感)を感じるようになる。
When the dialog communication is started, the image of Mr. A is displayed on the display of Mr. B's side. This image is an image captured by a camera 2 (corresponding to an imaging device) provided on the side of Mr. A, and described strictly, it is a frame image constituting a video of Mr. A captured by the
ちなみに、Bさん側の表示器には、Aさんの全身画像が等身大で表示されることになっている。具体的に説明すると、表示器は、前述したようにミラー型のディスプレイ5によって構成されており、一般的な姿見と同様の形状・サイズとなっており、Aさんの全身映像を等身大で表示するのに適した形状及びサイズとなっている。このような構成により、Bさんは、表示器に映る等身大のAさんを見るようになり、あたかもガラス越しにAさんと会っている感じを感じるようになる。
By the way, the whole body image of Mr. A is to be displayed in a life-size on the indicator of Mr. B's side. Specifically, as described above, the display is configured by the mirror-
<<本実施形態に係る画像表示システムの構成について>>
次に、本システムSについてその具体的構成を説明する。本システムSは、Aさんの自宅及びBさんの自宅の双方に用意された情報通信用のユニット(以下、通信ユニット)によって構成されている。具体的に説明すると、Aさんの自宅においてAさんにより利用される第一通信ユニット100Aと、Bさんの自宅においてBさんにより利用される第二通信ユニット100Bによって本システムSが構成されている。以下、第一通信ユニット100A及び第二通信ユニット100Bのそれぞれの構成について説明する。
<< About the Configuration of the Image Display System According to the Present Embodiment >>
Next, the specific configuration of the present system S will be described. The present system S is configured by a unit for information communication (hereinafter referred to as a communication unit) prepared in both A's home and B's home. Specifically, the present system S is configured by a first communication unit 100A used by Mr. A at Mr. A's home and a second communication unit 100 B used by Mr. B at Mr. B's home. The configurations of the first communication unit 100A and the second communication unit 100B will be described below.
なお、「第一通信ユニット100A」及び「第二通信ユニット100B」は、前述した第一ユーザ及び第二ユーザの関係に付随して決まる概念であり、Aさんを第一ユーザとして見た場合、Aさんが利用する通信ユニットが第一通信ユニット100Aに該当し、Bさんが利用する通信ユニットが第二通信ユニット100Bに該当する。反対に、Aさんを第二ユーザとして見た場合には、Bさんが利用する通信ユニットが第一通信ユニット100Aに該当し、Aさんが利用する通信ユニットが第二通信ユニット100Bに該当する。 Note that “first communication unit 100A” and “second communication unit 100B” are concepts determined in accordance with the relationship between the first user and the second user described above, and when Mr. A is viewed as the first user, The communication unit used by Mr. A corresponds to the first communication unit 100A, and the communication unit used by Mr. B corresponds to the second communication unit 100B. Conversely, when Mr. A is viewed as the second user, the communication unit used by Mr. B corresponds to the first communication unit 100A, and the communication unit used by Mr. A corresponds to the second communication unit 100B.
第一通信ユニット100A及び第二通信ユニット100Bは、略同様のメカ構成となっており、具体的に説明すると、図1に示すように、いずれのユニットにもホームサーバ1とカメラ2とマイク3と赤外線センサ4とディスプレイ5とスピーカ6とが搭載されている。これらの機器のうち、カメラ2、マイク3、赤外線センサ4、ディスプレイ5及びスピーカ6は、各ユーザの自宅における各自の部屋(対面対話を行う際に入室する部屋)内に配置されている。図1は、本システムSの構成を示す概念図である。
The first communication unit 100A and the second communication unit 100B have substantially the same mechanical configuration, and to be specific, as shown in FIG. 1, the home server 1, the
ホームサーバ1は、本システムSの中枢をなす装置であり、CPU、ROMやRAM等のメモリ、通信用インタフェース及びハードディスクドライブ等を有するコンピュータである。なお、第一通信ユニット100Aが有するホームサーバ1は、第一コンピュータに相当し、第二通信ユニット100Bが有するホームサーバ1は、第二コンピュータに相当する。 The home server 1 is a device that forms the core of the present system S, and is a computer having a CPU, a memory such as a ROM and a RAM, a communication interface, a hard disk drive, and the like. The home server 1 of the first communication unit 100A corresponds to a first computer, and the home server 1 of the second communication unit 100B corresponds to a second computer.
また、ホームサーバ1には、対話通信用のプログラムがインストールされている。このプログラムがCPUに実行されることで、ホームサーバ1が後述する対話通信機能を発揮するようになる。また、ホームサーバ1同士は、インターネット等の外部通信ネットワークGNを介して通信可能に接続されており、互いに各種データの送受信を行う。ここで、ホームサーバ1が送受信するデータは、対話通信に必要なデータであり、例えば、各種画像の画像データや音声データである。 Further, a program for interactive communication is installed in the home server 1. By the CPU executing this program, the home server 1 exerts an interactive communication function described later. The home servers 1 are communicably connected via an external communication network GN such as the Internet, and transmit / receive various data to / from each other. Here, the data transmitted and received by the home server 1 is data necessary for dialogue communication, and is, for example, image data and audio data of various images.
カメラ2は、撮像範囲(画角)内にある被写体の映像を撮像する撮像装置であり、本実施形態では公知のネットワークカメラによって構成されている。また、カメラ2は、ユーザ(Aさん、Bさん)がディスプレイ5の前に立っているときに当該ユーザの全身像を撮像する。すなわち、第一通信ユニット100Aが有するカメラ2は、Aさんの部屋内に設置されたディスプレイ5の前にAさんが立っているとき、Aさん及びその周辺を撮像する。同様に、第二通信ユニット100Bが有するカメラ2は、Bさんの部屋内に設置されたディスプレイ5の前にBさんが立っているとき、Bさん及びその周辺を撮像する。
The
なお、本実施形態では、図2に示すように、カメラ2のレンズがディスプレイ5の表示画面5aに面している。ここで、表示画面5aを構成するディスプレイ5の鏡面パネルは、透明なガラスによって構成されている。したがって、カメラ2は、ディスプレイ5の前に立っているユーザを上記の鏡面パネル越しで撮像することになる。図2は、各通信ユニットの機器構成を示す図であり、各機器の配置位置についての説明図である。ただし、カメラ2の配置位置は、図2に図示の位置に限定されるものではなく、ディスプレイ5から離れた位置でもよい。
In the present embodiment, as shown in FIG. 2, the lens of the
ちなみに、ユーザがディスプレイ5の前に立っていないとき、カメラ2は、当該カメラ2が設置された部屋の内部空間(厳密には、カメラ2の画角内にある範囲)を撮像することになっている。この際に撮像された映像のフレーム画像は、「背景画像」として利用されることになっている。
By the way, when the user is not standing in front of the
そして、カメラ2の撮像映像を構成するフレーム画像は、データ化されてホームサーバ1(厳密には、同じ通信ユニットに属するホームサーバ1)に伝送される。
Then, the frame image constituting the captured image of the
マイク3は、ユーザの話し声等、マイク3が設置された部屋内で発生する音を集音する装置である。そして、マイク3は、集音した音を示す音声信号をホームサーバ1(厳密には、同じ通信ユニットに属するホームサーバ1)に対して出力する。なお、本実施形態では、図2に示すようにディスプレイ5の直上位置にマイクが設置されている。
The
赤外線センサ4は、所謂デプスセンサであり、赤外線方式にて計測対象物の深度を計測するセンサである。具体的に説明すると、赤外線センサ4は、計測対象物に向けて発光部4aから赤外線を照射し、その反射光を受光部4bにて受光することにより深度を計測する。ここで、「深度」とは、基準位置から計測対象物までの距離(すなわち、奥行距離)のことである。ちなみに、本実施形態では、ディスプレイ5の表示画面5a(前面)の位置が基準位置として設定されている。つまり、赤外線センサ4は、深度として、表示画面5aの法線方向における計測対象物と表示画面5aとの間の距離を計測する。ただし、基準位置については、上記の位置に限定されず、任意の位置に設定することが可能である。
The infrared sensor 4 is a so-called depth sensor, and is a sensor that measures the depth of an object to be measured by an infrared method. Specifically, the infrared sensor 4 irradiates infrared light from the
また、深度の計測結果は、カメラ2が撮像した映像のフレーム画像を所定数の画素に分割した際の当該画素毎に得られる。そして、画素毎に得た深度の計測結果をフレーム画像単位でまとめることで、図3に図示の深度データが得られるようになる。この深度データは、フレーム画像について画素別に深度の計測結果を示すデータであり、図3に図示するように、深度の計測結果に応じて各画素の色・濃淡を設定して得られるビットマップデータとなっている。図3は、フレーム画像と当該フレーム画像についての深度データとを示す図である。
In addition, the measurement result of the depth is obtained for each of the pixels when the frame image of the image captured by the
深度データについてより詳しく説明すると、深度データは、カメラ2の撮像映像を構成するフレーム画像の各々について取得されることになっている。また、図3に示すように、深度データ中、フレーム画像において奥側に位置する被写体の画像に属する画素(図中、黒塗りの画素)と、手前側に位置する被写体の画像に属する画素(図中、白塗りの画素)とでは、当然ながら深度の計測結果が異なってくる。このような性質を利用すれば、深度データを構成する画素のうち、背景画像に属する画素と人物画像に属する画素とを区別、分離することが可能となる。
Describing in more detail about depth data, depth data is to be acquired for each of the frame images that constitute the captured image of the
以上の赤外線センサ4がAさんの部屋及びBさんの部屋の双方に設置されている。つまり、Aさんの部屋に設置されたディスプレイ5の前にAさんが立つと、第一通信ユニット100Aの赤外線センサ4がAさんの身体各部について深度を計測するようになる。すなわち、第一通信ユニット100Aの赤外線センサ4は、Aさんの身体各部の位置に関する計測対象値として深度を計測する計測装置に相当する。
The above infrared sensor 4 is installed in both the room A and the room B. That is, when Mr. A stands in front of the
同様に、Bさんの部屋に設置されたディスプレイ5の前にBさんが立つと、第二通信ユニット100Bの赤外線センサ4がBさんの身体各部について深度を計測するようになる。すなわち、第二通信ユニット100Bの赤外線センサ4は、ディスプレイ5の前にBさんが居る状態で深度、換言すると、Bさんとディスプレイ5との間の距離を計測する距離計測装置に相当する。
Similarly, when Mr. B stands in front of the
なお、身体各部の位置に関する計測対象値を計測する装置(計測装置)については、赤外線センサ4に限定されるものではなく、例えば、ユーザに装着されて身体各部の位置を直接計測するセンサ(モーションキャプチャ用のセンサ)であってもよい。また、ディスプレイ5との間の距離を計測する方法については、赤外線センサ4を用いる方法に限定されるものではなく、例えば、ユーザの立ち位置をセンサ等にて検知し、その検知結果からディスプレイ5との間の距離を計測してもよい。あるいは、カメラ2の撮影映像を解析することで当該距離を割り出してもよい。
The device (measuring device) that measures the measurement target value regarding the position of each part of the body is not limited to the infrared sensor 4; for example, a sensor (motion that is mounted on the user and directly measures the position of each part of the body It may be a sensor for capture. Further, the method of measuring the distance to the
スピーカ6は、ホームサーバ1が受信した音声データを展開することで再生される音声(再生音)を発する装置である。具体的に説明すると、第一通信ユニット100Aのホームサーバ1は、第二通信ユニット100Bのホームサーバ1から音声データを受信すると、当該音声データを展開し、Bさんの部屋で集音された音声をスピーカ6によって再生させる。他方、第二通信ユニット100Bのホームサーバ1は、第一通信ユニット100Aのホームサーバ1から音声データを受信すると、当該音声を展開し、Aさんの部屋で集音された音声をスピーカ6によって再生させる。なお、本実施形態では、図2に示すように、スピーカ6がディスプレイ5の横幅方向においてディスプレイ5を挟む位置に複数(図2では4個)設置されている。
The
ディスプレイ5は、ホームサーバ1が取得したフレーム画像を表示画面5aにて画像を表示する表示器である。より具体的に説明すると、第一通信ユニット100Aが有するディスプレイ5は、第一通信ユニット100Aのホームサーバ1が取得したフレーム画像をAさんに対して表示する。他方、第二通信ユニット100Bが有するディスプレイ5は、第二通信ユニット100Bのホームサーバ1が取得したフレーム画像をBさんに対して表示する。
The
また、本実施形態に係るディスプレイ5は、前述したように、ミラー型の表示器によって構成されている。さらに、本実施形態に係るディスプレイ5は、通常時には、図4の(A)に示すように部屋内に配置された家具、具体的には姿見として機能する。つまり、非対話時(対話通信を行っていないとき)には、ディスプレイ5の表示画面5aにフレーム画像が表示されないため、同表示画面5aが鏡面として機能する。一方、対話時(対話通信を行っているとき)には、図4の(B)に示すように、表示画面5aにフレーム画像が表示(再生)されるようになる。図4の(A)及び(B)は、本実施形態に係るディスプレイ5の構成例を示した図であり、(A)が非対話時の状態を、(B)が対話時の状態をそれぞれ示している。
Moreover, the
以上のように本実施形態に係るディスプレイ5は、非対話時には姿見として利用され、対面時には表示画面5aにてフレーム画像を表示するようになる。これにより、非対話時には表示画面5aの存在が気付かれ難くなる。その一方で、対話時には、あたかも対話相手とガラス越しに対面しているような視覚的演出効果をユーザに感じさせるようになる。
As described above, the
なお、画像の表示器と姿見とを兼用する構成については、例えば国際公開第2009/122716号に記載された構成のように公知の構成が利用可能である。また、ディスプレイ5については、姿見として兼用される構成に限定されるものではない。ディスプレイ5として用いられる機器については、対話相手の全身画像を表示するのに十分なサイズを有しているものであればよい。そして、非対話時に表示画面5aの存在を気付き難くする観点からは、部屋内に設置された他の家具や建築材料であって鏡面部を有するものが好適であり、例えば扉(ガラス戸)や窓(ガラス窓)をディスプレイ5として利用してもよい。なお、ディスプレイ5については、家具や建築材料として兼用されるものに限定されず、起動中、表示画面5aを常時形成する通常の表示器であってもよい。
In addition, about the structure which combines the display of an image and a look, a well-known structure like the structure described, for example in the international publication 2009/122716 can be utilized. In addition, the
<<ホームサーバの機能について>>
次に、各通信ユニットのホームサーバ1が具備する対話通信機能について説明する。なお、以下では、対話通信機能のうち、画像表示に関する機能のみを説明することとし、音声再生に関する機能等については説明を省略することとする。また、以下では、説明を分かり易くするため、Aさん側(つまり、第一通信ユニット100A)から配信されてくる画像をBさん側(つまり、第二通信ユニット100B)にて表示するケースを例に挙げて説明する。なお、付言しておくと、以下に説明する内容は、視点を変えた場合にも成立することになる。つまり、以下の説明中、第一通信ユニット100Aのホームサーバ1の機能については、第二通信ユニット100Bのホームサーバ1にも具備されており、第二通信ユニット100Bのホームサーバ1の機能については、第一通信ユニット100Aのホームサーバ1にも具備されている。
<< Home Server Functions >>
Next, the interactive communication function provided in the home server 1 of each communication unit will be described. In the following, among the interactive communication functions, only the function related to image display will be described, and the description of functions related to sound reproduction and the like will be omitted. Also, in the following, in order to make the description easy to understand, an example is shown in which the image delivered from Mr. A (that is, the first communication unit 100A) is displayed by Mr. B (that is, the second communication unit 100B). I will list and explain. In addition, the contents to be described below hold true even when the viewpoint is changed. That is, in the following description, the function of the home server 1 of the first communication unit 100A is also included in the home server 1 of the second communication unit 100B, and the function of the home server 1 of the second communication unit 100B is , And the home server 1 of the first communication unit 100A.
第一通信ユニット100Aのホームサーバ1は、画像配信側のサーバとして機能し、具体的には下記(1)〜(5)の機能を具備している。
(1)フレーム画像取得機能
(2)骨格モデル特定機能
(3)現在情報特定・通知機能
(4)相手方視野推定機能
(5)画像加工・送信機能
The home server 1 of the first communication unit 100A functions as a server on the image distribution side, and specifically includes the following functions (1) to (5).
(1) Frame image acquisition function (2) Skeletal model identification function (3) Current information identification / notification function (4) Opposite party visual field estimation function (5) Image processing / transmission function
また、第二通信ユニット100Bのホームサーバ1は、画像表示側のサーバとして機能し、具体的には下記(6)の機能を具備している。
(6)表示画像再構築機能
以下、各機能について詳細に説明する。
Further, the home server 1 of the second communication unit 100B functions as a server on the image display side, and specifically, has the following function (6).
(6) Display Image Reconstruction Function Hereinafter, each function will be described in detail.
(フレーム画像取得機能)
第一通信ユニット100Aのホームサーバ1は、同ユニットに属するカメラ2のフレームレートに相当する間隔で、当該カメラ2が撮像したフレーム画像を取得する。より具体的に説明すると、Aさんが部屋(厳密には、対話通信の際に入室する部屋)内でディスプレイ5の前方に居るとき、カメラ2は、Aさん及びその背景を撮像する。このため、ホームサーバ1は、Aさんの人物画像とその背景画像を含むフレーム画像を取得することになる。一方、Aさんが部屋内に居ないとき、ホームサーバ1は、背景画像(部屋の内部空間の画像)のみからなるフレーム画像を取得することになる。
(Frame image acquisition function)
The home server 1 of the first communication unit 100A acquires a frame image captured by the
なお、第一通信ユニット100Aのホームサーバ1は、フレーム画像を取得する際、当該フレーム画像についての深度データを取得する。フレーム画像についての深度データは、前述したように、当該フレーム画像を所定の画素にて分割した際の各画素について深度の計測結果を示すものであり、具体的には図3に図示したビットマップデータによって構成されている。 When acquiring a frame image, the home server 1 of the first communication unit 100A acquires depth data for the frame image. As described above, the depth data of the frame image indicates the measurement result of the depth for each pixel when the frame image is divided into predetermined pixels, and more specifically, the bit map illustrated in FIG. 3 It consists of data.
(骨格モデル特定機能)
第一通信ユニット100Aのホームサーバ1は、前述したように、フレーム画像を取得する都度、当該フレーム画像についての深度データを取得する。そして、ホームサーバ1は、フレーム画像(厳密には、フレーム画像中のAさんの人物画像)と当該フレーム画像についての深度データに基づいて、Aさんの骨格モデルを特定する。具体的に説明すると、Aさんの人物画像を含むフレーム画像についての深度データでは、図3に示すように、人物画像に属する画素(図3中、白抜きの画素)と、それ以外の画像に属する画素(図3中、黒抜きの画素や斜線ハッチングの画素)とでは、明らかに深度が異なっている。このような特徴を利用して、ホームサーバ1は、深度データ中、人物画像に属する画素を抽出する。その上で、ホームサーバ1は、抽出した画素からAさんの骨格モデルを特定する。
(Skeletal model identification function)
As described above, each time the frame image is acquired, the home server 1 of the first communication unit 100A acquires depth data of the frame image. Then, the home server 1 specifies the skeletal model of Mr. A based on the frame image (strictly, the person's human image in the frame image) and the depth data of the frame image. Specifically, in depth data of a frame image including a person image of Mr. A, as shown in FIG. 3, pixels belonging to the person image (in FIG. 3, white pixels) and the other images are included. The depth is obviously different from that of the pixel to which the pixel belongs (in FIG. 3, the black pixels and the hatched pixels). Using such a feature, the home server 1 extracts pixels belonging to a person image in depth data. Then, the home server 1 specifies a skeleton model of Mr. A from the extracted pixels.
骨格モデルは、図3に示すように、人間の骨格、特に頭部、肩、肘、手、脚、腰、股関節、膝、足に関する位置情報を簡易的にモデル化したものである。ここで、骨格モデルにおいて設定された上記の部位は、本発明の「設定部位」に相当する。また、当該設定部位の中には、第一ユーザの上半身の体軸上にある部位が含まれており、具体的には、頭部及び腰が該当する。ちなみに、骨格モデルを特定する方法については、公知の方法(例えば、特開2014−155693号公報や特開2013−116311号公報に記載の方法)が利用可能である。 As shown in FIG. 3, the skeletal model is a simplified model of position information on the human skeleton, in particular, the head, shoulders, elbows, hands, legs, hips, hips, knees, and feet. Here, the above-described site set in the skeletal model corresponds to the "set site" in the present invention. In addition, the setting site includes a site on the body axis of the upper body of the first user, and specifically, the head and the waist correspond. Incidentally, as a method of specifying a skeletal model, known methods (for example, methods described in Japanese Patent Application Laid-Open Nos. 2014-155693 and 2013-116311) can be used.
そして、第一通信ユニット100Aのホームサーバ1は、深度データを取得する都度、換言すると、フレーム画像を取得する都度、骨格モデルを特定する。これにより、骨格モデルとして表されるAさんの身体各部の位置変化、より具体的には骨格モデルにおいて設定された複数の設定部位の各々について、動き(変位)の有無を検出することが可能となる。 Then, the home server 1 of the first communication unit 100A specifies the skeleton model each time depth data is acquired, in other words, each time a frame image is acquired. Thereby, it is possible to detect the presence or absence of movement (displacement) for the change in position of each part of the body of Mr. A represented as a skeletal model, more specifically, for each of a plurality of setting parts set in the skeletal model. Become.
また、第一通信ユニット100Aのホームサーバ1は、図3に示すように、あるフレーム画像についての深度データから特定した骨格モデルに基づき、当該あるフレーム画像の中から人物画像を抽出することが可能である。なお、本明細書では、骨格モデルに基づいてフレーム画像の中から人物画像を抽出する方法については説明を省略するが、大まかな手順を述べると、特定した骨格モデルに基づいて深度データ中、人物画像に属する画素群を特定する。その後、特定した画素群と対応する領域をフレーム画像の中から抽出する。かかる手順によって抽出された画像がフレーム画像中の人物画像に該当する。 Further, as shown in FIG. 3, the home server 1 of the first communication unit 100A can extract a person image from the frame image based on the skeleton model specified from the depth data of the frame image. It is. In the present specification, a description of a method of extracting a human image from a frame image based on a skeletal model is omitted, but if a rough procedure is described, a person in depth data based on a skeletal model identified Identify pixel groups that belong to the image. Thereafter, an area corresponding to the specified pixel group is extracted from the frame image. The image extracted by this procedure corresponds to the person image in the frame image.
(現在情報特定・通知機能)
第一通信ユニット100Aのホームサーバ1は、対話通信においてAさんの現在の状態に関する情報(以下、現在情報)を特定し、当該現在情報を第二通信ユニット100Bのホームサーバ1に向けて送信する。ここで、「現在情報」とは、ディスプレイ5の前に居る状態のAさんとディスプレイ5との位置関係、及び、Aさんの姿勢のうち、少なくとも一つに関する内容のことであり、本実施形態では、Aさんとディスプレイ5との間の距離(奥行距離)、Aさんの身長、及び、Aさんの顔の向きである。なお、現在情報として特定される内容については、上記内容に限定されるものではなく、他の情報、例えばAさんの視線の向きや顔の位置(垂直方向及び水平方向の両方向における位置)が含まれてもよい。
(Current information identification / notification function)
The home server 1 of the first communication unit 100A specifies information (hereinafter referred to as current information) related to the current state of the user A in dialog communication, and transmits the current information to the home server 1 of the second communication unit 100B. . Here, the "current information" refers to the content related to at least one of the positional relationship between the user A and the user in the state of being in front of the
各現在情報の特定方法について説明すると、Aさんとディスプレイ5との間の距離については、Aさんがディスプレイ5の前に立っている状態で赤外線センサ4が計測した際の深度の計測結果、すなわち、深度データから特定することが可能である。つまり、第一通信ユニット100Aのホームサーバ1は、赤外線センサ4の計測結果に基づいてAさんとディスプレイ5との間の距離を特定する。換言すると、赤外線センサ4は、Aさんとディスプレイ5との間の距離に関する情報として、深度の計測結果をホームサーバ1に提供する情報提供装置に該当すると言える。
Regarding the method of identifying each piece of current information, regarding the distance between Mr. A and
Aさんの身長については、上記の方法により特定したAさんとディスプレイ5との間の距離と、深度データから特定した骨格モデルと、に基づいて特定することが可能である。より具体的に説明すると、第一通信ユニット100Aのホームサーバ1は、骨格モデル上でのAさんの身長(以下、モデル上の身長)を割り出す。また、ホームサーバ1は、Aさんとディスプレイ5との間の距離から、実際のAさんの身長に対するモデル上の身長の比率を算出する。そして、ホームサーバ1は、割り出したモデル上の身長、及び、算出した比率に基づいてAさんの身長(実際の身長)を特定する。
The height of Mr. A can be identified based on the distance between Mr. A and the
Aさんの顔の向きは、Aさんがディスプレイ5の前に立っている状態でカメラ2が撮像した際のフレーム画像から特定することが可能である。より具体的に説明すると、第一通信ユニット100Aのホームサーバ1は、上記のフレーム画像に対して公知の画像解析処理を適用し、Aさんの顔の向きを特定する。換言すると、カメラ2は、Aさんの姿勢(顔の向き)に関する情報として、Aさんの人物画像を含むフレーム画像をホームサーバ1に提供する情報提供装置に該当すると言える。
The direction of the face of Mr. A can be specified from a frame image when the
第一通信ユニット100Aのホームサーバ1は、上記3つの現在情報を特定した後、これらを第二通信ユニット100Bのホームサーバ1に通知する。一方、現在情報の特定及び通知は、第二通信ユニット100Bのホームサーバ1においても同様に行われる。すなわち、第二通信ユニット100Bのホームサーバ1は、Bさんがディスプレイ5の前に居る状態において、Bさんとディスプレイ5との間の距離、Bさんの身長及びBさんの顔の向きを特定し、これらを第一通信ユニット100Aのホームサーバ1に通知する。なお、第二通信ユニット100Bの赤外線センサ4は、情報提供装置として、Bさんとディスプレイ5との間の距離に関する情報、より具体的には深度の計測結果をホームサーバ1に提供する。また、第二通信ユニット100Bのカメラ2は、情報提供装置として、Bさんの姿勢(顔の向き)に関する情報、より具体的にはBさんの人物画像を含むフレーム画像をホームサーバ1に提供する。
After specifying the three pieces of current information, the home server 1 of the first communication unit 100A notifies the home server 1 of the second communication unit 100B of these. On the other hand, identification and notification of current information are similarly performed in the home server 1 of the second communication unit 100B. That is, the home server 1 of the second communication unit 100B specifies the distance between the B and the
そして、第一通信ユニット100Aのホームサーバ1は、第二通信ユニット100Bのホームサーバ1がBさんの現在情報を通知することで、当該現在情報(すなわち、第二通信ユニット100Bのホームサーバ1が赤外線センサ4やカメラ2からの提供情報に基づいて特定した内容)を取得するようになる。
Then, when the home server 1 of the second communication unit 100B notifies the present information of Mr. B, the home server 1 of the first communication unit 100A notifies the present information (that is, the home server 1 of the second communication unit 100B). The content specified based on the provided information from the infrared sensor 4 or the
(相手方視野推定機能)
第一通信ユニット100Aのホームサーバ1は、取得したBさんの現在情報に基づいて、Bさんの視野と対応する領域、より具体的には中心視野領域と対応する範囲を推定する。より具体的に説明すると、ホームサーバ1は、Bさんの身長及び顔の向きに関する情報からBさんの目線の高さ(目線高さ)及び向き(目線向き)を割り出す。そして、ホームサーバ1は、上記の目線高さから上記の目線向きに向かって延出する仮想線を基準にして所定の角度(視野角)分だけ拡がった範囲を特定する。かかる範囲がBさんの中心視野領域と対応する範囲(以下、単に中心視野領域と言う)に相当する。
(The other party's view estimation function)
The home server 1 of the first communication unit 100A estimates a region corresponding to the field of view of the user B, more specifically, a range corresponding to the central region of view, based on the acquired current information of the user B. More specifically, the home server 1 determines the height (view height) and the direction (view direction) of Mr. B's eyes from the information on the height and the direction of the face of Mr. B. Then, the home server 1 specifies a range expanded by a predetermined angle (viewing angle) based on the virtual line extending from the above-mentioned eye height toward the above-mentioned eye direction. This range corresponds to a range corresponding to the central visual field of Mr. B (hereinafter, referred to simply as a central visual field).
第一通信ユニット100Aのホームサーバ1は、上記の方法によりBさんの中心視野領域を推定した後、その推定結果を示す位置を記憶する。ここで、「推定結果を示す位置」とは、第二通信ユニット100Bが有するディスプレイ5の表示画面5aに対するBさんの中心視野領域の相対位置のことである。
The home server 1 of the first communication unit 100A estimates the central visual field area of Mr. B by the above method, and then stores the position indicating the estimation result. Here, the "position indicating the estimation result" is the relative position of the central visual field of Mr. B with respect to the
以上のように本実施形態では、対話相手の中心視野領域を、対話相手の身長及び顔の向きに基づいて適切に推定することが可能である。なお、中心視野領域を推定する方法としては、上記の方法に限定されるものではなく、中心視野領域を推定するのに好適な方法である限り、他の方法を採用してもよい。 As described above, in the present embodiment, it is possible to appropriately estimate the central visual field of the conversation partner based on the height and the face orientation of the conversation partner. In addition, as a method of estimating a central visual field area, it is not limited to said method, As long as it is a method suitable for estimating a central visual field area, you may employ | adopt another method.
(画像加工・送信機能)
第一通信ユニット100Aのホームサーバ1は、第二通信ユニット100Bのディスプレイ5にBさんの人物画像を含むフレーム画像を表示させるために、第二通信ユニット100Bのホームサーバ1に向けて画像データを送信する。ここで、送信される画像データについて説明すると、対話通信の臨場感を確保する目的から原則として高画質な画像データを送信することとしている。一方、高画質な画像データであるほど、データ伝送時における送信負荷(以下、データ伝送負荷)が大きくなる。このため、第一通信ユニット100Aのホームサーバ1は、データ伝送負荷を軽減すべく、カメラ2から取得したフレーム画像に対して所定の加工処理を行い、処理後の画像のデータ(画像データ)を送信することとしている。
(Image processing and transmission function)
The home server 1 of the first communication unit 100A directs the image data to the home server 1 of the second communication unit 100B in order to display a frame image including a person image of Mr. B on the
以下、データ伝送負荷を軽減するための加工処理について図5乃至8を参照しながら説明する。図5は、フレーム画像の背景画像及び人物画像を分離する処理についての説明図である。図6の(A)、(B)及び(C)は、低画質化処理についての説明図であり、図中の(A)は、Bさんとディスプレイ5との位置関係を示し、(B)は、Bさんがディスプレイ5に近い位置に居るときの当該ディスプレイ5の表示画像を示し、(C)は、Bさんがディスプレイ5から離れた位置に居るときの当該ディスプレイ5の表示画像を示している。図7の(A)、(B)、(C)及び(D)は、フレーム画像の中から選択された画像の切り出しに関する説明図であり、図中の(A)は、前回のフレーム画像と今回のフレーム画像とを対比した図であり、(B)は、前回の骨格モデルと今回の骨格モデルとを対比した図であり、(C)は、今回のフレーム画像の中から送信対象として切り出される画像を示す図であり、(D)は、切り出された画像を用いて表示画像を再構築する手順を示す図である。図8は、画質調整処理についての説明図である。
Hereinafter, processing for reducing the data transmission load will be described with reference to FIGS. 5 to 8. FIG. 5 is an explanatory diagram of processing for separating a background image of a frame image and a person image. (A), (B) and (C) in FIG. 6 are explanatory diagrams of the image quality reduction process, (A) in the figure shows the positional relationship between the B and the
先ず、図5を参照しながら画像分離処理について説明する。第一通信ユニット100Aのホームサーバ1は、対話通信が開始されると、カメラ2から順次送られてくるフレーム画像(撮像画像)を取得する。そして、取得したフレーム画像中にAさんの人物画像及びその背景画像が含まれているとき、ホームサーバ1は、図5に示すようにフレーム画像から人物画像を抽出し、当該人物画像と背景画像とを分離する。その上で、ホームサーバ1は、人物画像の画像データのみ送信する。
First, the image separation processing will be described with reference to FIG. When interactive communication is started, the home server 1 of the first communication unit 100A acquires frame images (captured images) sequentially sent from the
一方、背景画像の画像データについては、背景画像以外の画像データと分けて生成され、第二通信ユニット100Bのホームサーバ1に向けて送信されることになっている。なお、本実施形態では、背景画像データの送信処理の実行頻度が第一通信ユニット100Aのホームサーバ1がカメラ2からフレーム画像を取得する頻度よりも少なくなっている。
On the other hand, the image data of the background image is generated separately from the image data other than the background image, and is transmitted to the home server 1 of the second communication unit 100B. In the present embodiment, the execution frequency of the transmission process of the background image data is smaller than the frequency at which the home server 1 of the first communication unit 100A acquires a frame image from the
より具体的に説明すると、第一通信ユニット100Aのホームサーバ1は、対話通信の開始直後や後述する通信前処理において、背景画像のみからなるフレーム画像をカメラ2から取得する。かかるフレーム画像の取得後、ホームサーバ1は、当該フレーム画像の画像データを背景画像の画像データとして送信する。以降、対話通信が終了するまでの間、ホームサーバ1が背景画像の画像データを送信することはない。このように背景画像の画像データの送信を対話通信の開始時等に限定しているのは、一般に背景画像における変化が少ないことを反映しているためである。
More specifically, the home server 1 of the first communication unit 100A acquires a frame image consisting of only a background image from the
そして、ホームサーバ1は、対話通信の開始時に背景画像の画像データを一回送信すると、それ以降はフレーム画像中の人物画像の画像データのみを送信することとし、背景画像の画像データについては送信しない。これにより、フレーム画像全体の画像データ(すなわち、人物画像及び背景画像の双方の画像データ)を送信する場合に比して、データ伝送負荷を軽減することが可能となる。 When the home server 1 transmits image data of the background image once at the start of the dialogue communication, the home server 1 transmits only the image data of the person image in the frame image thereafter, and transmits the image data of the background image. do not do. This makes it possible to reduce the data transmission load as compared with the case of transmitting image data of the entire frame image (that is, both image data of a person image and a background image).
なお、分離された背景画像と人物画像とは、第二通信ユニット100Bのホームサーバ1によって再合成される。より具体的に説明すると、第二通信ユニット100Bのホームサーバ1は、第一通信ユニット100Aのホームサーバ1が対話通信時等に送信した背景画像の画像データと、その後に送信されてくる人物画像の画像データと、をそれぞれ受信して展開し、両画像を合成した画像(合成画像)を構築する。かかる合成画像は、第一通信ユニット100Aのホームサーバ1がカメラ2から取得した時点でのフレーム画像、すなわち、人物画像と背景画像とに分離される前のフレーム画像と略一致する。
The separated background image and person image are recombined by the home server 1 of the second communication unit 100B. More specifically, the home server 1 of the second communication unit 100B receives the image data of the background image transmitted by the home server 1 of the first communication unit 100A at the time of interactive communication, and the person image transmitted thereafter. The image data of (1) is received and expanded, and an image (synthetic image) in which both images are synthesized is constructed. The composite image substantially matches the frame image at the time when the home server 1 of the first communication unit 100A acquires it from the
第二通信ユニット100Bのホームサーバ1は、以上のように背景画像及び人物画像を合成することで、新たなフレーム画像を取得する。そして、新たに取得したフレーム画像は、今回の表示画像としてディスプレイ5に表示されるようになる。
The home server 1 of the second communication unit 100B acquires a new frame image by combining the background image and the person image as described above. Then, the newly acquired frame image is displayed on the
次に、図6の(A)、(B)及び(C)を参照しながら低画質化処理について説明する。第一通信ユニット100Aのホームサーバ1は、前述したように、カメラ2から取得したフレーム画像の中からAさんの人物画像を抽出し、当該人物画像のデータを送信する。一方、第一通信ユニット100Aのホームサーバ1は、Bさんの現在情報として、Bさんとディスプレイ5との間の距離を第二通信ユニット100Bのホームサーバ1から取得する。
Next, the image quality reduction processing will be described with reference to (A), (B) and (C) of FIG. As described above, the home server 1 of the first communication unit 100A extracts the person image of Mr. A from the frame image acquired from the
そして、Bさんとディスプレイ5との間の距離が閾値未満であるとき(例えば、図6の(A)において記号d1にて示す距離であるとき)、第一通信ユニット100Aのホームサーバ1は、抽出した人物画像をそのままの画質で表示する画像データを生成し、当該画像データを第二通信ユニット100Bのホームサーバ1に向けて送信する。ここで、閾値は、低画質化処理の実行の有無を判定する際の基準値であり、上記の距離に関して予め設定された大きさの値となっている。なお、閾値の具体的な値については、特に限定されるものではないが、低画質化処理の実行の有無を判定するのに好適な値に設定されるのが望ましい。
Then, when the distance between the user B and the
一方で、Bさんとディスプレイ5との間の距離が閾値以上であるとき(例えば、図6の(A)において記号d2にて示す距離であるとき)、第一通信ユニット100Aのホームサーバ1は、抽出した人物画像に対して低画質化処理を実行する。この低画質化処理では、抽出した人物画像の画質を所定の画質まで低下させ、低下後の画質の人物画像を示す画像データ(以下、低画質人物画像データ)を生成する。ここで、「画質を低下させる」とは、解像度を下げることを意味する。また、上述した「所定の画質」については、少なくとも第一通信ユニット100Aのホームサーバ1がカメラ2から取得した時点でのフレーム画像の画質、すなわち、原画像の画質よりも低い画質に設定されることとし、望ましくは、対話通信の臨場感を損なわない程度の画質に設定されるとよい。
On the other hand, when the distance between Mr. B and the
そして、低画質人物画像データは、生成後、第二通信ユニット100Bのホームサーバ1に向けて送信される。このときのデータ送信負荷は、画質を低下された分だけ軽減されることになる。 Then, after the low-quality person image data is generated, it is transmitted to the home server 1 of the second communication unit 100B. The data transmission load at this time is reduced by the amount of image quality degradation.
以上のように、Bさんとディスプレイ5との間の距離が閾値以上であるときと、当該距離が閾値未満であるときとで、第一通信ユニット100Aのホームサーバ1が配信する人物画像の画質が異なってくる。このため、第二通信ユニット100Bのディスプレイ5に表示されるフレーム画像(すなわち、人物画像と背景画像との合成画像)中の人物画像の画質についても、上記の距離に応じて変わることになる。具体的に説明すると、Bさんとディスプレイ5との間の距離が閾値未満である場合には、図6の(B)に示すように、ディスプレイ5の表示画像中の人物画像は、第一通信ユニット100Aのホームサーバ1がカメラ2から取得したフレーム画像(原画像)中の人物画像と略同じ画質となっている。
As described above, the image quality of the person image distributed by the home server 1 of the first communication unit 100A when the distance between Mr. B and the
一方で、Bさんとディスプレイ5との間の距離が閾値以上である場合には、図6の(C)に示すように、ディスプレイ5の表示画像中の人物画像が、第一通信ユニット100Aのホームサーバ1がカメラ2から取得したフレーム画像中の人物画像に比べて幾分低画質(低解像度)となる。ただし、この場合、表示画像中の人物画像の画質が低下していても、ディスプレイ5を見ているBさんは、ディスプレイ5から離れているので、画質低下による違和感を然程感じない。つまり、上記の距離が閾値以上であれば、人物画像に対して低画質化処理を実行して低画質人物画像データを第二通信ユニット100Bのホームサーバ1に向けて送信したとしても、対話通信の臨場感(リアル感)が損なわれない。これにより、表示画像中の人物画像の画質を低下させながらも対話通信の臨場感を確保しつつ、データ伝送負荷を画質低下の分だけ軽減することが可能となる。
On the other hand, when the distance between Mr. B and the
次に、図7の(A)、(B)、(C)及び(D)を参照しながら画像の切り出しについて説明する。第一通信ユニット100Aのホームサーバ1は、前述したように、カメラ2から取得したフレーム画像の中からAさんの人物画像を抽出する。その後、ホームサーバ1は、抽出した人物画像の画像データを生成することになる。この際、Bさんとディスプレイ5との間の距離が閾値未満であるときには、上述したように、原画像と同じ画質となるように人物画像の画像データを生成することになる。かかる画像データは、より高画質となっている分、より大きなデータ伝送負荷を生じさせることになる。
Next, clipping of an image will be described with reference to (A), (B), (C) and (D) of FIG. 7. The home server 1 of the first communication unit 100A extracts the person image of Mr. A from the frame image acquired from the
一方で、図7の(A)に示すように、連続して取得される2つのフレーム画像(前回のフレーム画像と今回のフレーム画像)を対比すると、フレーム画像中の人物画像には、フレーム画像間で異なる部分と、フレーム画像間で共通する部分とがある。つまり、上記2つのフレーム画像のうち、今回取得したフレーム画像中の人物画像には、前回取得したフレーム画像から動いた部分と、動いていない部分とが存在する。 On the other hand, as shown in FIG. 7A, when two frame images (previous frame image and current frame image) acquired continuously are compared, a frame image is displayed for the person image in the frame image. There are parts that differ between the two, and parts that are common to the frame images. That is, of the two frame images, in the human image in the frame image acquired this time, there are a portion moved from the frame image acquired last time and a portion not moved.
そして、第一通信ユニット100Aのホームサーバ1は、今回取得したフレーム画像中の人物画像のうち、動いた部分の画像を切り出し、切り出した画像の画像データを生成して第二通信ユニット100Bのホームサーバ1に向けて送信することとしている。ここで、「動いた部分の画像」とは、Aさんの身体各部のうち、前回のフレーム画像の取得時から今回のフレーム画像の取得時までの期間中に動いた部分の画像のことである。 Then, the home server 1 of the first communication unit 100A cuts out the image of the moved part of the person image in the frame image acquired this time, generates the image data of the cut out image, and generates the home of the second communication unit 100B. It is supposed to be sent to the server 1. Here, the “image of the moved part” refers to an image of a part of the body of Mr. A who moved during the period from the time of acquisition of the previous frame image to the time of acquisition of the current frame image. .
以上のように、本実施形態では、今回取得したフレーム画像中の人物画像のうち、動いた部分の画像データを第二通信ユニット100Bのホームサーバ1に向けて送信することとしている。これにより、送信される人物画像の画像データについて、当該人物画像中の動いていない部分の画像データの分だけ削減することが可能となる。この結果、人物画像の画像データを送信する際のデータ送信負荷を一段と軽減することが可能となる。 As described above, in the present embodiment, the image data of the moving part of the person image in the frame image acquired this time is transmitted to the home server 1 of the second communication unit 100B. This makes it possible to reduce the image data of the transmitted person image by the amount of the image data of the non-moving part in the person image. As a result, it is possible to further reduce the data transmission load when transmitting the image data of a person image.
ところで、動いた部分の画像データを生成するにあたっては、Aさんの身体各部のうち、前回のフレーム画像の取得時から今回のフレーム画像の取得時までの期間中に動いた部分(以下、被特定部分)を特定する必要がある。そして、本実施形態では、被特定部分を特定する際に、上記の期間中における第一通信ユニット100Aの赤外線センサ4の計測結果の変化に基づいて被特定部分を特定することとしている。 By the way, when generating the image data of the moved part, a part of Ms. A's body that moved during the period from the time of acquisition of the previous frame image to the time of acquisition of the current frame image (hereinafter referred to as specified Part) needs to be identified. And in this embodiment, when specifying a to-be-specified part, it is supposed that a to-be-specified part is specified based on the change of the measurement result of the infrared sensor 4 of 1st communication unit 100A in said period.
より具体的に説明すると、図7の(B)に示すように、前回取得したフレーム画像についての深度データ、及び、今回取得したフレーム画像についての深度データの各々から骨格モデルを特定する。そして、2つの骨格モデルを対比することで被特定部分を特定する。ちなみに、図7の(B)に図示のケースでは、手及び肘が被特定部分として特定されることになる。なお、被特定部分を特定する際の具体的手順については、後述することとする。 More specifically, as shown in FIG. 7B, the skeletal model is specified from each of the depth data for the previously acquired frame image and the depth data for the currently acquired frame image. Then, the identified part is identified by comparing the two skeletal models. Incidentally, in the case illustrated in FIG. 7B, the hand and the elbow are identified as the identified part. A specific procedure for specifying the specified part will be described later.
以上のように本実施形態では、フレーム画像におけるAさんの人物画像中、被特定部分(すなわち、Aさんの身体において動いた部分)を特定する際に、2つの骨格モデルを対比して骨格モデル間の相違(変化)から被特定部分を特定する。この結果、被特定部分が適切且つ的確に特定されるようになる。 As described above, in the present embodiment, when identifying the specified part (that is, the moved part in the body of A) in the person image of A in the frame image, the skeletal model is compared with each other for the skeletal model. Identify the identified part from the difference (change) between As a result, the specified part can be properly and accurately identified.
被特定部分の特定後、第一通信ユニット100Aのホームサーバ1は、今回取得したフレーム画像におけるAさんの人物画像のうち、被特定部分を含む領域(以下、切り出し領域、若しくは切り出し画像とも呼ぶ)を抽出する。具体的に説明すると、ホームサーバ1は、前回のフレーム画像の取得時から今回のフレーム画像の取得時までの期間中に動いた設定部位を含むように切り出し領域を抽出する。図7の(B)のケースを例に挙げて説明すると、手及び肘が被特定部分として特定された場合、ホームサーバ1は、図7の(C)に示すように、Aさんの人物画像中、手から肘までの範囲(すなわち、手及び前腕部分)の画像を切り出し領域として抽出する。 After specifying the specified part, the home server 1 of the first communication unit 100A includes an area including the specified part in the person image of Mr. A in the frame image acquired this time (hereinafter, also referred to as cutout area or cutout image) Extract Specifically, the home server 1 extracts the cutout region so as to include the set portion that has moved during the period from the time of acquisition of the previous frame image to the time of acquisition of the current frame image. When the case of FIG. 7B is described as an example, when the hand and the elbow are identified as the identified part, the home server 1 displays a person image of Mr. A, as shown in FIG. 7C. Images of the range from the hand to the elbow (ie, the hand and forearm part) are extracted as cutout regions.
また、本実施形態において、第一通信ユニット100Aのホームサーバ1は、上記の手順により抽出した領域に加え、Aさんの顔全体を含む領域(すなわち、頭部画像)も切り出し領域として抽出することになっている。これは、対話通信においてAさんの顔の表情や口の動きが変化し易いことを反映しているためである。 Further, in the present embodiment, the home server 1 of the first communication unit 100A extracts the area including the entire face of Mr. A (ie, the head image) as the cutout area in addition to the area extracted by the above procedure. It has become. This is because it reflects that the facial expression and mouth movement of Mr. A are likely to change in the dialogue communication.
以上のようにして領域抽出(切り出し領域の選定)が行われると、その後、第一通信ユニット100Aのホームサーバ1は、抽出した領域の画像データを生成し、第二通信ユニット100Bのホームサーバ1に向けて送信する。なお、切り出し領域の画像データには、当該領域の表示位置(厳密には、フレーム画像に対する相対位置)を示す表示位置データが組み込まれている。 After the area extraction (selection of the cutout area) is performed as described above, the home server 1 of the first communication unit 100A then generates image data of the extracted area, and the home server 1 of the second communication unit 100B. Send towards. Note that display position data indicating the display position of the area (strictly speaking, relative position to the frame image) is incorporated in the image data of the cutout area.
一方、第二通信ユニット100Bのホームサーバ1は、切り出し領域の画像データを受信すると、当該画像データを展開することで得られる画像(すなわち、切り出し画像)を、前回表示したフレーム画像に合成することで今回表示するフレーム画像を取得する。ここで、「前回表示したフレーム画像」とは、切り出し領域の画像データを受信する直前にディスプレイ5に表示されていたフレーム画像(表示画像)のことである。
On the other hand, when the home server 1 of the second communication unit 100B receives the image data of the cutout area, the home server 1 combines the image obtained by expanding the image data (that is, the cutout image) with the previously displayed frame image. Get the frame image to be displayed this time. Here, the “frame image displayed last time” is a frame image (display image) displayed on the
より詳しく説明すると、第二通信ユニット100Bのホームサーバ1は、受信した画像データ中の表示位置データを解析して、切り出し領域と対応した位置(すなわち、切り出し画像の表示位置)を特定する。その上で、ホームサーバ1は、図7の(D)に示すように、前回表示したフレーム画像におけるAさんの人物画像のうち、特定した切り出し領域の位置に切り出し画像を重ね合わせる。この結果、同図に示すように、今回表示するフレーム画像(厳密には、フレーム画像におけるAさんの人物画像)が得られるようになる。 More specifically, the home server 1 of the second communication unit 100B analyzes the display position data in the received image data, and specifies the position corresponding to the cutout area (that is, the display position of the cutout image). Then, as shown in (D) of FIG. 7, the home server 1 superimposes the cutout image on the position of the specified cutout area among the person images of Mr. A in the frame image displayed last time. As a result, as shown in the figure, a frame image to be displayed this time (strictly speaking, a person image of Mr. A in the frame image) can be obtained.
次に、図8を参照しながら画質調整処理について説明する。第一通信ユニット100Aのホームサーバ1は、以上までに説明してきたように、カメラ2が撮像したフレーム画像中、Aさんの人物画像や当該人物画像中の一部分の画像(以下、これらをまとめて送信画像という)について画像データを生成する。一方、第一通信ユニット100Aのホームサーバ1は、前述したように、Bさんの中心視野領域を推定する。 Next, the image quality adjustment processing will be described with reference to FIG. As described above, the home server 1 of the first communication unit 100A includes the person image of Mr. A and a partial image of the person image in the frame image captured by the camera 2 (hereinafter, these are collectively Image data is generated for the transmission image). On the other hand, as described above, the home server 1 of the first communication unit 100A estimates the central visual field of Mr. B.
そして、第一通信ユニット100Aのホームサーバ1は、送信画像に対して画質調整処理を実行する。この画像調整処理では、送信画像中、ディスプレイ5の表示画面5aにおいてBさんの中心視野領域内に表示される画像(第一画像)よりも中心視野領域以外の領域に表示される画像(第二画像)を低画質化する。なお、「第一画像よりも第二画像を低画質化する」とは、第一画像の解像度よりも第二画像の解像度を低くすることである。また、第二画像の画質を低下させる際の度合い(低下度合い)については、特に限定されるものではないが、ディスプレイ5に画質低下後の第二画像を表示した際にBさんが違和感を感じない程度に設定されているとよい。
Then, the home server 1 of the first communication unit 100A performs the image quality adjustment process on the transmission image. In this image adjustment process, an image displayed in an area other than the central visual field than the image (first image) displayed in the central visual field of Mr. B on the
また、画像調整処理において、第一通信ユニット100Aのホームサーバ1は、送信画像の画像データとして、第一画像よりも第二画像が低画質となるように当該送信画像の画像データを生成し、第二通信ユニット100Bのホームサーバ1に向けて送信する。 Further, in the image adjustment process, the home server 1 of the first communication unit 100A generates, as the image data of the transmission image, the image data of the transmission image such that the second image has a lower image quality than the first image. It transmits toward the home server 1 of 2nd communication unit 100B.
上記の送信画像の画像データが第二通信ユニット100Bのホームサーバ1に受信されると、第二通信ユニット100Bのディスプレイ5に当該送信画像を含むフレーム画像が表示されるようになる。かかる表示画像中、Bさんの中心視野領域内に表示される第一画像(図8中、ハッチングが施された部分)は、より高画質な画像となっているのに対し、中心視野領域以外(すなわち、周辺視野領域内)に表示される第二画像は、より低画質な画像となっている。このような表示画像であっても、中心視野領域以外に表示される画像(第二画像)は視覚的に認識され難くなっているため、ディスプレイ5を見ているBさんは、違和感を然程感じることがない。つまり、表示画像において画質が異なる部分が存在していても、中心視野領域に表示される部分が高画質であれば、対話通信の臨場感(リアル感)に及ぶ影響が小さくなる。したがって、本実施形態では、表示画像中の第二画像の画質を低下させながらも対話通信の臨場感を確保しつつ、データ伝送負荷を画質低下の分だけ軽減することが可能となる。
When the image data of the transmission image is received by the home server 1 of the second communication unit 100B, a frame image including the transmission image is displayed on the
また、送信画像中、低画質化する範囲(すなわち、第二画像)を選定するにあたり、Bさんの中心視野領域を推定することになるが、本実施形態では前述したように、Bさんの身長及び顔の向きに基づいて中心視野領域を推定することになっている。これにより、Bさんの中心視野領域が適切に推定されるようになり、この結果、Bさんの中心視野領域に応じて決まる第二画像についても、Aさんの人物画像の中から適切な範囲が選定されるようになる。 In addition, in selecting a range (i.e., the second image) to be lowered in image quality in the transmission image, the central visual field area of Mr. B is estimated, but in the present embodiment, as described above, the height of Mr. B is The central visual field area is estimated on the basis of the face orientation. As a result, the central visual field area of Mr. B can be appropriately estimated, and as a result, an appropriate range of the human image of Mr. A is obtained for the second image determined according to the central visual field area of Mr. B as well. It will be selected.
(表示画像再構築機能)
第二通信ユニット100Bのホームサーバ1は、第一通信ユニット100Aのホームサーバ1から送信されてくる画像データを受信し、当該画像を展開して得られる画像をディスプレイ5に表示する。ここで、第一通信ユニット100Aのホームサーバ1から送信されてくる画像データについて述べると、前述したように、背景画像の画像データと人物画像の画像データとが別々に送信されることになっている。このため、第二通信ユニット100Bのホームサーバ1は、それぞれの画像データを受信し、当該画像データを展開した上で背景画像と人物画像とを合成する。このようにして第二通信ユニット100Bのホームサーバ1は、第一通信ユニット100Aのホームサーバ1から受信した各画像(受信画像)を再構築し、今回ディスプレイ5に表示するフレーム画像(表示画像)を取得する。
(Display image reconstruction function)
The home server 1 of the second communication unit 100B receives the image data transmitted from the home server 1 of the first communication unit 100A, and displays an image obtained by expanding the image on the
また、第二通信ユニット100Bのホームサーバ1は、人物画像中の一部分の画像データ(すなわち、切り出し領域の画像データ)を受信した場合、前回表示したフレーム画像のうち、切り出し画像と対応した位置に当該切り出し画像を重ね合わせることで、今回表示するAさんの人物画像を取得する。 In addition, when the home server 1 of the second communication unit 100B receives image data of a part of the person image (that is, image data of the cutout region), the home server 1 of the second communication unit 100B By superimposing the cutout images, a person image of Mr. A to be displayed this time is acquired.
そして、第二通信ユニット100Bのホームサーバ1は、取得したフレーム画像をディスプレイ5に表示させる。この際、第二通信ユニット100Bのホームサーバ1は、フレーム画像中のAさんの人物画像の表示サイズをAさんの実際のサイズ(等身大サイズ)となるように調整する。具体的に説明すると、第二通信ユニット100Bのホームサーバ1は、第一通信ユニット100Aのホームサーバ1から取得したAさんの現在情報のうち、Aさんとディスプレイ5との間の距離及びAさんの距離に応じて、Aさんの人物画像の表示サイズを調整する。
Then, the home server 1 of the second communication unit 100B causes the
<<本実施形態に係る画像表示システムを用いた対話の流れ>>
次に、本システムSを用いて行われるユーザ間の対話、すなわち、対話通信の具体的な流れ(以下、対話通信フロー)について、図9乃至16を参照しながら説明する。図9は、対話通信フローの流れを示した図である。図10は、通信前処理の流れを示した図である。図11は、現在情報通知処理の流れを示した図である。図12は、画像加工送信処理の流れを示した図である。図13は、切り出し領域の選定処理の流れを示した図である。図14は、切り出し領域の算出処理の流れを示した図である。図15は、画質調整処理の流れを示した図である。図16は、表示映像の再構築処理の流れを示した図である。
<< Flow of dialogue using the image display system according to the present embodiment >>
Next, user interaction performed using the present system S, that is, a specific flow of dialogue communication (hereinafter, dialogue communication flow) will be described with reference to FIGS. FIG. 9 is a diagram showing the flow of the interactive communication flow. FIG. 10 is a diagram showing the flow of communication pre-processing. FIG. 11 is a diagram showing a flow of current information notification processing. FIG. 12 is a diagram showing the flow of the image processing transmission process. FIG. 13 is a diagram showing a flow of selection processing of the cutout region. FIG. 14 is a diagram showing a flow of calculation processing of the cutout region. FIG. 15 is a diagram showing a flow of image quality adjustment processing. FIG. 16 is a diagram showing a flow of display image reconstruction processing.
ところで、以下に説明する対話通信フローでは、本発明の画像表示方法が採用されている。すなわち、本発明の画像表示方法は、本システムSの各機器、特に第一通信ユニット100A及び第二通信ユニット100Bの各々のホームサーバ1(第一コンピュータ及び第二コンピュータに相当)が各自の機能を発揮することで実現される。 By the way, in the interactive communication flow described below, the image display method of the present invention is adopted. That is, according to the image display method of the present invention, each device of the system S, in particular, the home server 1 (corresponding to the first computer and the second computer) of each of the first communication unit 100A and the second communication unit 100B has their own functions. It is realized by exerting
先ず、対話通信フローの大まかな流れについて図9を参照しながら説明すると、対話通信フローの開始に際して通信前処理が実行される(S001)。通信前処理は、対話通信の開始の可否を判定するために実行される処理であり、対話通信フローの開始前、例えば、Aさん又はBさんが部屋(厳密には、対話通信を行う際に居る部屋)に入室した時点で実行される。 First, a rough flow of the dialog communication flow will be described with reference to FIG. 9. At the start of the dialog communication flow, communication pre-processing is executed (S001). The communication pre-processing is a process executed to determine whether or not to start dialogue communication, and before the start of the dialogue communication flow, for example, when Mr. A or Mr. It is executed when entering the room).
通信前処理の実行後に対話通信が開始されると、その後、現在情報通知処理(S002)、相手方現在情報の受信(S003)、画像加工送信処理(S004)、相手方画像の受信(S005)、及び表示画像の再構築処理(S006)が実行される。これらの処理は、第一通信ユニット100A及び第二通信ユニット100Bの双方のホームサーバ1において実行され、対話通信が終了するまで繰り返し実行される(S007)。そして、Aさん又はBさんが対話通信において当該対話通信を終了する動作を行うと、かかる終了動作を本システムSが受け付け、その結果、対話通信が終了する。 When dialogue communication is started after execution of communication preprocessing, current information notification processing (S002), reception of partner current information (S003), image processing / transmission processing (S004), reception of partner image (S005), and the like A display image reconstruction process (S006) is performed. These processes are performed in the home server 1 of both the first communication unit 100A and the second communication unit 100B, and are repeatedly performed until the interactive communication is completed (S007). Then, when Mr. A or Mr. B performs an operation of ending the dialog communication in the dialog communication, the present system S receives the ending operation, and as a result, the dialog communication is ended.
次に、対話通信フローにおける各処理S001〜S007の流れについて説明する。なお、Aさん側の通信ユニット(すなわち、第一通信ユニット100A)で実行される処理の流れと、Bさん側の通信ユニット(すなわち、第二通信ユニット100B)で実行される処理の流れとは略同様である。このため、以下では、後述する表示画像の再構築処理を除き、第一通信ユニット100Aで行われる処理の流れのみを説明することし、表示画像の再構築処理については、第二通信ユニット100Bで行われる処理の流れを説明することとする。 Next, the flow of each process S001 to S007 in the interactive communication flow will be described. The flow of processing executed by the communication unit on the A side (that is, the first communication unit 100A) and the flow of processing executed by the communication unit on the B side (that is, the second communication unit 100B) It is substantially the same. For this reason, in the following, only the flow of processing performed in the first communication unit 100A will be described except for the display image reconstruction processing described later, and the second communication unit 100B will be described for the display image reconstruction processing. The flow of processing to be performed will be described.
はじめに、通信前処理について図10を参照しながら説明する。通信前処理は、カメラ2が設置されている部屋を当該カメラ2が撮像して部屋内の撮像画像(フレーム画像)を、ホームサーバ1が取得するところから始まる(S011)。この際、ホームサーバ1は、フレーム画像と共に当該フレーム画像についての深度データを取得する(S012)。
First, communication pre-processing will be described with reference to FIG. The communication preprocessing starts from the point where the home server 1 acquires a captured image (frame image) in the room by the
そして、ホームサーバ1は、前ステップS011、S012で取得したフレーム画像及び深度データに基づいて、ディスプレイ5の前にAさんが居るかどうかを判定する(S013)。ディスプレイ5の前にAさんが居ると判定した場合、ホームサーバ1は、相手方のホームサーバ1が同様の判定結果(すなわち、Bさんがディスプレイ5の前に居るという判定結果)を得るまで待機する。そして、双方のホームサーバ1が上記の判定結果を得た時点で通信開始可能となり(S014)、かかる時点で通信前処理が終了する。
Then, the home server 1 determines whether or not Mr. A is present in front of the
一方、ディスプレイ5の前にAさんが居ないと判定した場合、ホームサーバ1は、背景画像の更新時間に至っているかどうかを判定する(S015)。背景画像の更新に至っていると判定した場合、ホームサーバ1は、前ステップS011で取得したフレーム画像の画像データを相手方のホームサーバ1に向けて送信する(S016)。この際に送信される画像データは、Aさんが映っておらず部屋内のみが映っている画像、すなわち背景画像の画像データとなっている。
On the other hand, when it is determined that Mr. A is not present in front of the
以上のように、ホームサーバ1は、通信前処理においてディスプレイ5の前にAさんが居ない間、背景画像の更新時間に至る度に背景画像の画像データを送信する。なお、背景画像の更新周期(時間間隔)については、特に限定されるものではなく、任意に設定することが可能である。
As described above, the home server 1 transmits the image data of the background image every time it reaches the update time of the background image while Mr. A is not present in front of the
次に、現在情報通知処理について図11を参照しながら説明する。現在情報通知処理は、Aさんがディスプレイ5の前に居る状態で行われ、かかる状態におけるAさんの位置や姿勢を現在情報として相手方のホームサーバ1に通知する。具体的に説明すると、現在情報通知処理において、ホームサーバ1は、Aさんが映っているフレーム画像と共に取得した深度データに基づいて、Aさんとディスプレイ5との間の距離を計算する(S021)。また、ホームサーバ1は、上記の深度データ及びフレーム画像からAさんの骨格モデルを特定する(S022)。また、ホームサーバ1は、ステップS021で計算した距離の計算結果と、ステップS022で特定した骨格モデルからAさんの身長を計算する(S023)。さらに、ホームサーバ1は、取得したフレーム画像中、Aさんの人物画像からAさんの顔の向きを特定する(S024)。
Next, the current information notification process will be described with reference to FIG. The present information notification process is performed in a state where Mr. A is in front of the
そして、ホームサーバ1は、以上までのステップにより得られた現在情報、すなわち、Aさんとディスプレイとの間の距離、Aさんの身長及びAさんの顔の向きを相手方のホームサーバ1に通知する(S025)。かかる時点で現在情報通知処理が終了する。 Then, the home server 1 notifies the home server 1 of the other party of the present information obtained by the above steps, that is, the distance between Mr. A and the display, the height of Mr. A and the orientation of Mr. A's face. (S025). At this point in time, the current information notification process ends.
次に、相手方現在情報の受信について説明する。ホームサーバ1は、相手方のホームサーバ1との通信を通じて、当該相手方のホームサーバ1が通知した相手方現在情報(すなわち、Bさんの現在情報)を取得する。具体的に説明すると、ホームサーバ1は、Bさんとディスプレイ5との間の距離、Bさんの身長及びBさんの顔の向きを示すデータを、相手方のホームサーバ1から受信する。
Next, reception of the other party current information will be described. The home server 1 acquires the other party current information notified by the other party home server 1 (that is, the current information of Mr. B) through communication with the other party's home server 1. Specifically, the home server 1 receives, from the other party's home server 1, data indicating the distance between the B and the
次に、画像加工送信処理について図12を参照しながら説明する。画像加工送信処理は、ホームサーバ1がカメラ2からフレーム画像を取得する度に実行され、同処理では、取得したフレーム画像あるいは当該フレーム画像中の一部分の画像データを相手方のホームサーバ1に送信する。そして、画像加工送信処理において送信される画像データの種類は、対話通信開始後の経過時間や取得したBさんの現在情報等に応じて変化する。
Next, the image processing transmission process will be described with reference to FIG. The image processing and transmission process is executed each time the home server 1 acquires a frame image from the
具体的に説明すると、対話通信の開始直後には、背景画像の画像データが送信されることになっている(S031、S032)。この際に送信される背景画像の画像データは、通信開始の事前段階(例えば、前述の通信前処理)にホームサーバ1が予め取得していたフレーム画像、より詳細には、Aさんがディスプレイ5の前に移動してくる前にカメラ2が撮像した際のフレーム画像を示す画像データである。
Specifically, immediately after the start of the dialogue communication, image data of the background image is to be transmitted (S031, S032). The image data of the background image transmitted at this time is a frame image acquired in advance by the home server 1 at the preliminary stage of communication start (for example, the above-mentioned communication preprocessing), more specifically, Mr. A displays 5 The image data indicates a frame image when the
なお、背景画像の画像データは、通信開始直後に送信されると、それ以降、対話通信が終了するまで送られないことになっている。すなわち、背景画像の画像データを送信する処理については、ホームサーバ1がカメラ2からフレーム画像を取得する頻度よりも少ない頻度にて実行される。この結果、対話通信中、通信開始直後に背景画像の画像データを一回送信してからは、背景画像の画像データを送信せずに済み、その分、データ伝送負荷が軽減されるようになる。
When the image data of the background image is transmitted immediately after the start of communication, it is not transmitted until after the interactive communication ends. That is, the process of transmitting the image data of the background image is executed at a frequency less than the frequency at which the home server 1 acquires a frame image from the
一方、背景画像の画像データを送信した後には、専らAさんの人物画像の画像データが送信されることになる。つまり、背景画像の画像データの送信後、ホームサーバ1は、カメラ2から取得したフレーム画像からAさんの人物画像を抽出する(S033)。その後、ホームサーバ1は、取得したBさんの現在情報のうち、Bさんとディスプレイ5との間の距離に基づいて以降の処理内容を決定する。
On the other hand, after transmitting the image data of the background image, the image data of the person image of Mr. A is transmitted exclusively. That is, after transmission of the image data of the background image, the home server 1 extracts the person image of Mr. A from the frame image acquired from the camera 2 (S033). Thereafter, the home server 1 determines the subsequent processing contents based on the distance between the user B and the
具体的に説明すると、ホームサーバ1は、Bさんとディスプレイ5との間の距離が閾値以上であるかどうかを判定する(S034)。かかる判定において上記の距離が閾値以上であるとき、ホームサーバ1は、ステップS033で抽出したAさんの人物画像に対して低画質化処理を実行する(S035)。これにより、抽出されたAさんの人物画像の画質が所定の画質(解像度)まで低下されるようになる。そして、ホームサーバ1は、低下後の画質の人物画像を示す画像データすなわち、低画質人物画像データを生成して相手方のホームサーバ1に向けて送信する(S036)。この際に送信される低画質人物画像データは、Aさんの人物画像、より厳密にはAさんの全身画像を低下後の画質にて表示するデータとなっている。
If it explains concretely, home server 1 will judge whether the distance between Mr. B and
以上のようにBさんとディスプレイ5との間の距離が閾値以上であるときに、Bさんに対して表示されるAさんの人物画像がより低画質な画像となるように低画質人物画像データを生成する。そして、ホームサーバ1は、生成した低画質人物画像データを相手方のホームサーバ1に向けて送信する。このように低画質人物画像データを送信することにより、画質低下の分だけ、データ伝送負荷が軽減されるようになる。
As described above, when the distance between Mr. B and the
一方、Bさんとディスプレイ5との間の距離が閾値未満である場合、ホームサーバ1は、Aさんの人物画像の中から一部の領域を切り出し、当該切り出し領域の画像データを送信することになっている。これに際して、ホームサーバ1は、Aさんの人物画像の中からどの領域を切り出すかを選定する処理、すなわち、切り出し領域の選定処理を実行する(S037)。
On the other hand, when the distance between Mr. B and the
切り出し領域の選定処理の手順について図13を参照しながら説明すると、本処理では、先ず、Aさんの体軸上にある設定部位、具体的には頭と腰についてそれぞれの変位量を計算する(S101)。ここで、「変位量」とは、ホームサーバ1が前回のフレーム画像取得時点から今回のフレーム画像取得時点までの期間(以下、画像取得間期間)における移動量のことである。そして、本実施形態では、現在情報通知処理において特定したAさんの骨格モデルの変化(具体的には、前回のフレーム画像取得時に特定した骨格モデルと、今回のフレーム画像取得時に特定した骨格モデルとの差分)から上記の変位量を計算することとしている。 The procedure of the process of selecting the cutout region will be described with reference to FIG. 13. In this process, first, displacement amounts of the set region on the body axis of person A, specifically, the head and the waist are calculated ( S101). Here, the “displacement amount” refers to the movement amount of the home server 1 in a period from the previous frame image acquisition time to the current frame image acquisition time (hereinafter, an image acquisition interval). Then, in the present embodiment, the change of the skeletal model of Mr. A identified in the current information notification process (specifically, the skeletal model identified at the previous frame image acquisition, and the skeletal model identified at the current frame image acquisition) The above displacement amount is calculated from the difference of
変位量の計算後、ホームサーバ1は、頭及び腰のうち、少なくとも一方の変位量が閾値以上であるかどうかを判定する(S102)。ここで、「閾値」とは、切り出し領域の選定用に設定された値であり、骨格モデル中の各設定部位が画像取得間期間中に動いたかどうかを判定する際の基準値となっている。なお、閾値の具体的な値については、特に限定されるものではないが、切り出し領域を適切に選定する上で好適な値に設定されていることが望ましい。 After calculating the displacement amount, the home server 1 determines whether or not the displacement amount of at least one of the head and the waist is equal to or greater than a threshold (S102). Here, the “threshold” is a value set for selection of the cutout region, and is a reference value for determining whether each set site in the skeletal model has moved during the image acquisition period. . The specific value of the threshold is not particularly limited, but is preferably set to a suitable value for appropriately selecting the cutout region.
そして、頭及び腰のうち、少なくとも一方の変位量が閾値以上であるとき、ホームサーバ1は、さらに各足の変位量を計算する(S103)。その後、ホームサーバ1は、各足の変位量が閾値以上であるかどうかを判定する(S104)。かかる判定において少なくとも一方の足の変位量が閾値以上であると判定した場合、ホームサーバ1は、Aさんの人物画像中、上半身画像及び下半身画像、すなわち全身画像を切り出す(S105)。反対に、2つの足の変位量がいずれも閾値未満であると判定した場合、ホームサーバ1は、Aさんの人物画像中、上半身画像を切り出す(S106)。 Then, when at least one displacement amount of the head and the waist is equal to or more than the threshold, the home server 1 further calculates the displacement amount of each foot (S103). Thereafter, the home server 1 determines whether the displacement amount of each foot is equal to or more than a threshold (S104). If it is determined in this determination that the displacement amount of at least one foot is equal to or greater than the threshold value, the home server 1 cuts out the upper body image and the lower body image, that is, the whole body image in the person image of Mr. A (S105). Conversely, if it is determined that the displacement amounts of the two feet are both less than the threshold value, the home server 1 cuts out the upper body image in the person image of Mr. A (S106).
以上のように本実施形態では、頭及び腰のうち、少なくともいずれか一方の変位量が閾値以上であるとき、Aさんの人物画像の中から上半身画像を切り出すこととしている。これは、頭及び腰の少なくともいずれか一方が動いていれば、体軸、すなわち上半身が動いて変位していると想定されるためである。そして、上半身画像という単位で切り出し領域の選定を行えば、その選定に係る処理をより簡易的に実行することが可能となる。 As described above, in the present embodiment, when the displacement amount of at least one of the head and the waist is equal to or larger than the threshold value, the upper body image is cut out from the person image of Mr. A. This is because it is assumed that the body axis, that is, the upper body is moving and displaced if at least one of the head and the waist is moving. Then, if the cutout region is selected in units of upper body images, it is possible to more simply execute the processing related to the selection.
一方、頭及び腰の変位量がいずれも閾値未満であるとき、ホームサーバ1は、四肢(2つの手及び2つの足)のそれぞれについて変位量を計算する(S107)。そして、ホームサーバ1は、四肢それぞれの変位量が閾値以上であるかを判定する(S108)。かかる判定において、いずれの変位量も閾値未満であると判定した場合、ホームサーバ1は、Aさんの人物画像の中から頭部画像を切り出す(S109)。 On the other hand, when the displacement amounts of the head and the waist are both less than the threshold value, the home server 1 calculates displacement amounts for each of the limbs (two hands and two legs) (S107). Then, the home server 1 determines whether the displacement amount of each of the four limbs is equal to or more than a threshold (S108). In this determination, when it is determined that any displacement amount is less than the threshold, the home server 1 cuts out a head image from the person's image of Mr. A (S109).
これに対し、少なくとも一つの変位量が閾値以上であると判定した場合、ホームサーバ1は、切り出し領域を更に細かく決めるための処理として、切り出し領域の算出処理を実行する(S110)。切り出し領域の算出処理の手順について図14を参照しながら説明すると、本処理では、先ず、既に変位量を計算した設定部位(すなわち、頭、腰及び四肢)以外の設定部位について変位量を計算する(S121)。より具体的に説明すると、ホームサーバ1は、四肢のうち、変位量の閾値以上となった部位を特定し、当該部位と隣接する設定部位について変位量を計算する。なお、「ある部位と隣接する設定部位」とは、骨格モデルにおいて複数設定された設定部位のうち、ある部位の隣に位置する設定部位、より厳密には、ある部位とは体軸に近い側で隣り合う設定部位のことである。 On the other hand, when it is determined that at least one displacement amount is equal to or more than the threshold value, the home server 1 executes cutout area calculation processing as processing for determining the cutout area in more detail (S110). The procedure of calculation processing of the cutout region will be described with reference to FIG. 14. In this processing, first, the displacement amount is calculated for the setting portion other than the setting portion (that is, the head, the waist and the limbs) for which the displacement amount has already been calculated. (S121). More specifically, the home server 1 specifies a part of the four limbs that is equal to or greater than the threshold of the displacement amount, and calculates the displacement amount for a set part adjacent to the part. Note that “a setting site adjacent to a certain site” means a setting site located next to a certain site among a plurality of setting sites set in the skeletal model, and more strictly, a side closer to the body axis with a certain site It is a setting part adjacent to each other.
そして、ホームサーバ1は、計算した変位量が閾値以上であるかどうかを判定する(S122)。かかる判定において変位量が閾値以上であると判定したとき、ホームサーバ1は、変位量が閾値以上であると判定された設定部位(以下、該当部位)について、前回のフレーム画像における座標と、今回のフレーム画像における座標と、を記憶する(S123)。ここで、「前回のフレーム画像における座標」とは、ホームサーバ1がカメラ2から前回取得したフレーム画像に対する該当部位の相対位置を表す座標(二次元座標)のことであり、「今回のフレーム画像における座標」とは、ホームサーバ1がカメラ2から今回取得したフレーム画像に対する該当部位の相対位置を表す座標(二次元座標)のことである。
Then, the home server 1 determines whether the calculated displacement amount is equal to or more than a threshold (S122). When it is determined in this determination that the displacement amount is equal to or greater than the threshold value, the home server 1 determines the coordinates of the previous frame image with respect to the set portion (hereinafter referred to as the corresponding portion) determined to have the displacement amount equal to or more than the threshold value. And the coordinates in the frame image of the image are stored (S123). Here, “coordinates in the previous frame image” is coordinates (two-dimensional coordinates) representing the relative position of the corresponding part with respect to the frame image acquired by the home server 1 from the
その後、ホームサーバ1は、該当部位と隣接する設定部位が有るかどうかを判定し(S124)、該当部位と隣接する設定部位が有る場合には、その設定部位について変位量を計算し(S125)、その計算結果が閾値以上であるかを判定する(S126)。かかる判定において変位量が閾値以上であると判定したとき、ホームサーバ1は、変位量が閾値以上であると判定された設定部位(すなわち、新たに該当部位となる設定部位)について、前回のフレーム画像における座標と今回のフレーム画像における座標とを記憶する(S123)。 After that, the home server 1 determines whether there is a set part adjacent to the corresponding part (S124), and if there is a set part adjacent to the corresponding part, calculates the displacement amount for the set part (S125) Then, it is determined whether the calculation result is equal to or more than a threshold (S126). If it is determined in this determination that the displacement amount is equal to or greater than the threshold value, the home server 1 determines the previous frame with respect to the set portion determined to have the displacement amount equal to or greater than the threshold value (ie, the set portion to be newly corresponding). The coordinates in the image and the coordinates in the current frame image are stored (S123).
以後、ホームサーバ1は、新たに該当部位となった設定部位と隣接する設定部位について、変位量の計算(S125)、閾値との対比(S126)及び座標の記憶(S123)を繰り返す。そして、変位量が閾値未満となる設定部位、すなわち動いていない設定部位まで達した時点で、ホームサーバ1は、それまで記憶していた座標を読み出し、各座標のX成分及びY成分をそれぞれ特定する。その上で、ホームサーバ1は、成分毎に最大値及び最小値を特定する(S127)。その後、ホームサーバ1は、各成分の最小値及び最大値により規定される領域(具体的には、各成分の最小値及び最大値を頂点座標とする矩形領域)を切り出し領域とする(S128)。 Thereafter, the home server 1 repeats the calculation of the displacement amount (S125), the comparison with the threshold (S126), and the storage of the coordinates (S123) for the setting site that is newly the corresponding site and the setting site adjacent thereto. Then, when reaching the set region where the displacement amount is less than the threshold, ie, the non-moving region, the home server 1 reads the coordinates stored so far and specifies the X component and the Y component of each coordinate. Do. Then, the home server 1 specifies the maximum value and the minimum value for each component (S127). After that, the home server 1 sets an area defined by the minimum value and the maximum value of each component (specifically, a rectangular area having the minimum value and the maximum value of each component as vertex coordinates) as a cutout area (S128) .
以上までに説明してきた一連のステップS121〜S128は、すべての設定部位について処理が完了するまで繰り返して行われる(S129)。そして、未処理の設定部位が無くなった時点で、ホームサーバ1は、切り出し領域の算出処理を終了する。 The series of steps S121 to S128 described above are repeated until the processing is completed for all the set parts (S129). Then, when there are no unprocessed set parts, the home server 1 ends the cutout area calculation process.
切り出し領域の選定処理についての説明に戻ると、切り出し領域の算出処理が実行されたとき、ホームサーバ1は、当該算出処理において算出(決定)された領域の画像及び頭部画像をAさんの人物画像中から切り出す(S111)。
そして、以上までに説明してきた手順により切り出し領域が選定された時点で、ホームサーバ1は、切り出し領域の選定処理を終了する。
Returning to the explanation of the selection processing of the cutout region, when the calculation processing of the cutout region is executed, the home server 1 performs the image of the region calculated (decided) in the calculation processing and the head image of the person A's person Cut out from the image (S111).
Then, when the cutout area is selected according to the procedure described above, the home server 1 ends the cutout area selection process.
以上のように本実施形態では、Bさんとディスプレイ5との間の距離が閾値未満である場合、ホームサーバ1は、Aさんの人物画像の中から一部の領域を切り出し、当該領域の画像データのみを相手方のホームサーバ1に送信する。これにより、Aさんの人物画像全体の画像データを送信する場合に比して、データ送信負荷が軽減されるようになる。また、切り出される領域としては、Aさんの身体中、前回のフレーム画像取得時から今回のフレーム画像取得時までの期間(画像取得間期間)中に動いた設定部位を含む領域と、頭部画像とが選定されることになっている。
As described above, in the present embodiment, when the distance between Mr. B and the
一方、本実施形態では、画像取得間期間中に動いた設定部位を特定する際、骨格モデルの変化(具体的には、前回の骨格モデルと今回の骨格モデルとの差分)に基づいて特定している。これにより、Aさんの身体中、画像取得間期間中に動いた部分(被特定部分)を適切且つ的確に特定することが可能となる。 On the other hand, in the present embodiment, when specifying the setting site moved during the image acquisition period, it is specified based on the change of the skeletal model (specifically, the difference between the previous skeletal model and the present skeletal model). ing. This makes it possible to appropriately and accurately identify the part (specified part) that has moved during the image acquisition period in the body of Mr. A.
また、本実施形態では、画像取得間期間中における動きの有無を設定部位単位で確認することになっている。この結果、Aさんの身体中、画像取得間期間中に動いた部分(被特定部分)を容易に特定することが可能となる。また、本実施形態では、画像取得間期間中における各設定部位の動きの有無を確認する上で、各設定部位について画像取得間期間中の変位量を計算し、当該変位量の計算結果が閾値以上であるか否かの判定を行うことになっている。このような手順であれば、画像取得間期間中に動いた部分をより一層容易に特定することが可能となる。 Further, in the present embodiment, the presence or absence of movement during the image acquisition period is to be confirmed in units of set parts. As a result, it becomes possible to easily identify the part (specified part) which has moved during the image acquisition period in the body of Mr. A. Further, in the present embodiment, when confirming the presence or absence of the movement of each setting site during the image acquisition interval, the displacement amount during the image acquisition interval is calculated for each setting site, and the calculation result of the displacement amount is a threshold. It is to be judged whether it is above or not. With such a procedure, it is possible to more easily identify the portion moved during the image acquisition period.
さらに、本実施形態では、切り出し領域の算出処理において、ある設定部位について変位量と閾値との対比(判定)を行った次には、ある設定部位の隣に位置する設定部位について判定を行うことになっている。そして、切り出し領域を選定する際には、画像取得間期間中に動いた設定部位(該当部位)すべてが含まれるような領域を選定する。具体的に説明すると、各該当部位について前回のフレーム画像における座標と、今回のフレーム画像における座標とを求める。また、該当部位毎に求めた上記座標のX成分及びY成分について最大値と最小値とを特定する。そして、特定した各成分の最大値及び最小値により規定される領域を切り出し領域として選定する。 Furthermore, in the present embodiment, after the displacement amount and the threshold value are compared (decided) with respect to a certain set site in the process of calculating the cutout region, next, the judgment with respect to the set site located next to the certain set site is performed. It has become. Then, when selecting the cutout region, the region is selected so as to include all the set parts (corresponding parts) moved during the inter-image acquisition period. Specifically, the coordinates in the previous frame image and the coordinates in the current frame image for each corresponding portion are determined. In addition, the maximum value and the minimum value are specified for the X component and the Y component of the coordinates obtained for each corresponding part. Then, a region defined by the maximum value and the minimum value of each of the identified components is selected as a cutout region.
以上のような手順にて切り出し領域を選定することにより、Aさんの人物画像中、画像取得間期間中に動いた部分の画像が適切に選定されるようになる。さらに、当該切り出し画像を前回の表示画像(フレーム画像)に重ね合わせて今回の表示画像を構成することにより、ホームサーバ1が今回取得したフレーム画像(厳密には、当該フレーム画像中、Aさんの人物画像)を適切に再現することが可能となる。 By selecting the cutout region according to the above-described procedure, an image of a portion that has moved during the image acquisition period can be appropriately selected in the person image of person A. Furthermore, by superimposing the cut-out image on the previous display image (frame image) to construct the display image of this time, the frame image acquired this time by the home server 1 (strictly speaking, in the frame image, Mr. A's It is possible to appropriately reproduce a person image).
画像加工送信処理についての説明に戻ると、切り出し領域の選定後、ホームサーバ1は、当該切り出し領域の画像データ(すなわち、送信対象の画像データ)のデータ容量を確認する。そして、ホームサーバ1は、データ容量が設定値以上であるかどうかを判定する(S039)。ここで、「設定値」とは、送信画像に対する画質調整処理の実行の有無を決めるための基準値として予め設定された値である。なお、設定値の具体的な値については、特に限定されるものではないが、画質調整処理の実行の有無を適切に判定する上で好適な値に設定されるのが望ましい。 Returning to the description of the image processing and transmission process, after selecting the cutout area, the home server 1 confirms the data capacity of the image data of the cutout area (that is, the image data to be transmitted). Then, the home server 1 determines whether the data capacity is equal to or more than the set value (S039). Here, the “set value” is a value set in advance as a reference value for determining the presence or absence of the execution of the image quality adjustment process on the transmission image. The specific value of the setting value is not particularly limited, but is preferably set to a suitable value in order to appropriately determine whether or not the image quality adjustment processing is to be performed.
上記の判定においてデータ容量が設定値未満である場合、ホームサーバ1は、切り出し領域の画像(切り出し画像)に対して画質調整処理を行うことなく、当該切り出し領域の画像データを相手方のホームサーバ1に向けて送信する(S040)。一方、上記の判定においてデータ容量が設定値以上である場合、ホームサーバ1は、切り出し画像に対して画質調整処理を実行する(S041)。画質調整処理の終了後、ホームサーバ1は、画質調整処理が施された切り出し画像(すなわち、画質調整済み画像)を表示させる画像データを生成し、相手方のホームサーバ1に向けて送信する(S042)。 If the data capacity is less than the set value in the above determination, the home server 1 does not perform the image quality adjustment process on the image of the cutout area (clipped image), and the image data of the cutout area is processed by the home server 1 of the other party. Send toward (S040). On the other hand, when the data capacity is equal to or greater than the set value in the above determination, the home server 1 executes the image quality adjustment processing on the cutout image (S041). After the end of the image quality adjustment processing, the home server 1 generates image data for displaying the clipped image (that is, the image quality adjusted image) subjected to the image quality adjustment processing, and transmits it to the other party's home server 1 (S042) ).
画質調整処理の手順について図15を参照しながら説明すると、本処理では、先ず、取得したBさんの現在情報、具体的にはBさんの身長及びBさんの顔の向きからBさんの中心視野領域を推定する(S131)。その後、ホームサーバ1は、送信対象である切り出し画像のデータがAさんの全身画像のデータであるかどうかを判別する(S132)。 The procedure of the image quality adjustment process will be described with reference to FIG. 15. In this process, first, the present information of Mr. B, specifically, the height of Mr. B and the direction of Mr. B's face from Mr. B's central visual field An area is estimated (S131). After that, the home server 1 determines whether the data of the cutout image to be transmitted is the data of the whole-body image of Mr. A (S132).
切り出し画像のデータが全身画像のデータである場合(分かり易くは、切り出し領域の選定処理でステップS105に至った場合)、ホームサーバ1は、当該切り出し画像中、ディスプレイ5の表示画面5aに表示した際にBさんの中心視野領域内に位置する画像(第一画像)よりも中心視野領域以外の領域に表示される画像(第二画像)を低画質化する(S133)。
When the data of the cut-out image is data of a whole-body image (intelligibly, when the selection processing of the cut-out area has reached step S105), the home server 1 displays on the
一方、切り出し画像のデータが全身画像のデータでない場合、ホームサーバ1は、その切り出し画像を選択する(S134)。そして、ホームサーバ1は、選択した切り出し画像中、ディスプレイ5の表示画面5aに表示した際にBさんの中心視野領域以外の領域に表示される画像(第二画像)があるかどうかを判定する(S135)。かかる判定において、選択した切り出し画像中に第二画像に相当する部分が存在すると判定した場合、ホームサーバ1は、Bさんの中心視野領域内に表示される画像(第一画像)に対して第二画像を低画質化する(S133)。
On the other hand, when the data of the cutout image is not the data of the whole body image, the home server 1 selects the cutout image (S134). Then, the home server 1 determines whether or not there is an image (second image) to be displayed in an area other than the central visual field of Mr. B when displayed on the
その後、ホームサーバ1は、未処理の切り出し画像が残っているどうかを判定し(S136)、未処理の切り出し画像に対して画像選択(S134)、第二画像の有無の判定(S135)及び第二画像の低画質化(S133)を繰り返す。そして、未処理の切り出し画像が無くなった時点で、ホームサーバ1は、画質調整処理を終了する。 Thereafter, the home server 1 determines whether or not an unprocessed cutout image remains (S136), selects an image with respect to the unprocessed cutout image (S134), determines the presence or absence of a second image (S135), and The image quality reduction of the two images (S133) is repeated. Then, when there is no unprocessed cutout image, the home server 1 ends the image quality adjustment processing.
以上のように本実施形態では、送信する切り出し画像の画像データの容量が設定値以上であるとき、切り出し画像の一部を低画質化する画質調整処理を実行する。これにより、処理後の切り出し画像の画像データが処理前の画像データよりも小さくなり、当該画像データの伝送負荷が軽減される。なお、かかる効果は、Aさんの人物画像の中から切り出された領域(すなわち、切り出し領域)が広くなるほど、有効に発揮されることとなる。 As described above, in the present embodiment, when the capacity of the image data of the cutout image to be transmitted is equal to or more than the set value, the image quality adjustment processing is performed to reduce the image quality of part of the cutout image. As a result, the image data of the cutout image after processing becomes smaller than the image data before processing, and the transmission load of the image data is reduced. Such an effect is more effectively exhibited as the area (that is, the cutout area) cut out from the person image of Mr. A becomes wider.
また、切り出し画像中、低画質化する部分(第二画像)を選ぶにあたってBさんの中心視野領域を推定する。そして、切り出し画像中、ディスプレイ5の表示画面5aにおいて推定したBさんの中心視野領域から外れた領域(周辺視野領域)に表示される部分の画質を所定の画質まで低下させる。これは、周辺視野領域内にある画像が視覚的に認識され難く、当該画像の画質が多少低かったとしても、表示画像を見る者が感じる対話通信の臨場感に及ぶ影響が小さいことを反映している。以上の結果、切り出し画像中、画質を低下させる部分(第二画像)が適切に選定されるようになるため、対話通信の臨場感が損なわれることなくデータ伝送負荷を効果的に軽減することが可能となる。
In addition, in selecting a portion (second image) to be degraded in the cut-out image, the central visual field area of Mr. B is estimated. Then, in the cutout image, the image quality of the portion displayed in the area (peripheral visual field area) outside the central visual field area of Mr. B estimated on the
そして、ホームサーバ1は、各種画像データの送信を終えた時点で画像加工送信処理を終了する。 Then, the home server 1 ends the image processing and transmission process when transmission of various image data is completed.
次に、表示映像の再構築処理について図16を参照しながら説明する。本処理は、第二通信ユニット100Bのホームサーバ1が第一通信ユニット100Aのホームサーバ1から受信した画像データを展開して得られる各画像を再構築し、今回ディスプレイ5に表示させる画像(フレーム画像)を取得する処理である。 Next, display image reconstruction processing will be described with reference to FIG. The present process reconstructs each image obtained by expanding the image data received by the home server 1 of the second communication unit 100B from the home server 1 of the first communication unit 100A, and displays this on the display 5 (frame (frame Image) is acquired.
より具体的に説明すると、第二通信ユニット100Bのホームサーバ1は、対話通信の開始直後に背景画像の画像データを受信する(S051でNo)。それ以降、第二通信ユニット100Bのホームサーバ1は、Aさんの人物画像の画像データを受信する(S051でYes)。この際に受信した画像データがAさんの全身画像のデータである場合(S052でYes)、ホームサーバ1は、Aさんの現在情報(具体的にはAさんの身長)に応じて上記の全身画像の表示サイズを、Aさんの実際のサイズ(等身大サイズ)となるように調整する(S054)。その後、ホームサーバ1は、既に取得済みの背景画像と今回取得したAさんの人物画像とを合成することにより、今回ディスプレイ5に表示するフレーム画像(表示画像)を取得する(S055)。
More specifically, the home server 1 of the second communication unit 100B receives the image data of the background image immediately after the start of the dialogue communication (No in S051). After that, the home server 1 of the second communication unit 100B receives the image data of the person image of Mr. A (Yes in S051). If the image data received at this time is the data of the whole-body image of Mr. A (Yes in S052), the home server 1 responds to the current information of Mr. A (specifically, the height of Mr. A). The display size of the image is adjusted to be the actual size (life size size) of Mr. A (S054). Thereafter, the home server 1 acquires a frame image (display image) to be displayed on the
一方、第一通信ユニット100Aのホームサーバ1から受信した画像データがAさんの人物画像の一部(すなわち、切り出し画像)の画像データである場合(S052でNo)、第二通信ユニット100Bのホームサーバ1は、上記の画像データを用いてAさんの人物画像を再構築する。 On the other hand, when the image data received from the home server 1 of the first communication unit 100A is image data of a part of the person's image of A (that is, the cutout image) (No in S052), the home of the second communication unit 100B. The server 1 reconstructs the person image of Mr. A using the image data described above.
詳しく説明すると、第二通信ユニット100Bのホームサーバ1は、今回受信した画像データが示す画像(切り出し画像)と、前回ディスプレイ5に表示したAさんの人物画像と、を重ね合わせる(S053)。この際、ホームサーバ1は、今回受信した画像データに組み込まれた表示位置データを解析して切り出し画像の表示位置を特定し、前回ディスプレイ5に表示したAさんの人物画像において上記の表示位置に切り出し画像を重ね合わせる。なお、特定される切り出し画像の表示位置は、切り出し領域の画像データの受信直前にディスプレイ5に表示されたフレーム画像(すなわち、前回の表示画像)中、切り出し領域と対応した位置、つまり切り出し領域として選定された矩形領域と対応した位置となっている。
Explaining in detail, the home server 1 of the second communication unit 100B superimposes the image (cutout image) indicated by the image data received this time and the person image of Mr. A displayed on the
以上のように、第二通信ユニット100Bのホームサーバ1は、切り出し画像と前回表示されたAさんの人物画像とを用いて、今回ディスプレイ5に表示するAさんの人物画像を再構築(取得)する。その後、第二通信ユニット100Bのホームサーバ1は、上述した手順と同様の手順にてAさんの人物画像の表示サイズを調整し、その上で、背景画像と今回取得したAさんの人物画像とを合成して今回の表示画像を取得する(S055)。
As described above, the home server 1 of the second communication unit 100B reconstructs (acquires) the person image of Mr. A displayed on the
そして、第二通信ユニット100Bのホームサーバ1は、今回取得したフレーム画像(表示画像)をディスプレイ5に表示させる(S056)。かかる時点で、ホームサーバ1は、表示映像の再構築処理を終了する。
Then, the home server 1 of the second communication unit 100B causes the
以上までに説明してきた一連の処理については、対話通信が終了するまで繰り返し実行される。これにより、データ伝送の負荷を効果的に軽減しつつ、臨場感(リアル感)がある対話通信が実現されるようになる。 The series of processes described above are repeatedly executed until the dialogue communication is completed. As a result, while effectively reducing the load of data transmission, interactive communication with a sense of reality (realism) can be realized.
1 ホームサーバ
2 カメラ(撮像装置,情報提供装置)
3 マイク
4 赤外線センサ(計測装置,情報提供装置,距離計測装置)
5 ディスプレイ(表示器)
5a 表示画面
6 スピーカ
100A 第一通信ユニット
100B 第二通信ユニット
GN 外部ネットワーク
S 本システム(画像表示システム)
1
3 Microphone 4 Infrared sensor (measuring device, information providing device, distance measuring device)
5 Display
Claims (9)
前記第一ユーザの身体各部の位置に関する計測対象値を計測する計測装置と、
該撮像装置が撮像した前記第一ユーザの映像を構成するフレーム画像を取得する第一コンピュータと、
前記フレーム画像を取得するために前記第一コンピュータと通信する第二コンピュータと、
該第二コンピュータが取得した前記フレーム画像を、前記第一ユーザとは異なる場所に居る第二ユーザに対して表示する表示器と、を有し、
前記第一コンピュータは、
前回の前記フレーム画像の取得時から今回の前記フレーム画像の取得時までの期間中における前記計測対象値の計測結果の変化に基づいて、前記身体各部のうち、前記期間中に動いた被特定部分を特定する処理と、
前記第一コンピュータが今回取得した前記フレーム画像における前記第一ユーザの人物画像のうち、前記被特定部分を含む領域を抽出する処理と、
前記領域の画像データを生成して前記第二コンピュータに向けて送信する処理と、を実行し、
前記第二コンピュータは、前記領域の前記画像データを受信すると、該画像データの受信前に前記表示器に表示された前記フレーム画像のうち、前記領域と対応した位置に前記領域の画像を重ね合わせることで構成された前記フレーム画像を、前記表示器に表示させることを特徴とする画像表示システム。 An imaging device for imaging a first user;
A measurement device for measuring a measurement target value regarding the position of each part of the body of the first user;
A first computer for acquiring a frame image constituting an image of the first user captured by the imaging device;
A second computer in communication with the first computer to obtain the frame image;
And a display for displaying the frame image acquired by the second computer to a second user who is at a different place from the first user,
The first computer is
Of the various parts of the body, the specified part that moved during the period, based on the change in the measurement result of the measurement value during the period from the time of acquisition of the frame image to the time of acquisition of the frame image this time. And the process of identifying
A process of extracting an area including the specified part from the person image of the first user in the frame image acquired this time by the first computer;
Executing processing of generating image data of the area and transmitting it to the second computer;
When the second computer receives the image data of the area, the second computer superimposes the image of the area on a position corresponding to the area among the frame images displayed on the display before the image data is received. An image display system configured to display the frame image configured as described above on the display.
前記第一コンピュータは、前記体軸上にある前記設定部位についての前記判定において前記変位量が前記閾値以上であると判定したとき、前記上半身の画像を前記領域として抽出することを特徴とする請求項3又は4に記載の画像表示システム。 At least one of the plurality of setting sites set is a site on the body axis of the upper body of the first user,
The first computer extracts the image of the upper body as the area when it is determined that the displacement amount is equal to or more than the threshold value in the determination on the set region on the body axis. Item 5. An image display system according to item 3 or 4.
前記第一コンピュータが前記背景画像データを送信する処理を実行する頻度は、前記第一コンピュータが前記撮像装置から前記フレーム画像を取得する頻度よりも少ないことを特徴とする請求項1乃至5のいずれか一項に記載の画像表示システム。 The first computer executes processing for generating background image data indicating a background image in the frame image separately from image data other than the background image, and transmitting the generated image data to the second computer.
The frequency at which the first computer executes the process of transmitting the background image data is less than the frequency at which the first computer acquires the frame image from the imaging device. The image display system according to any one of the items.
前記第一コンピュータは、前記第二コンピュータが前記情報から特定した前記少なくとも一つの内容を取得する処理を更に実行し、前記領域の前記画像データを生成する処理では、前記領域の画像中、前記表示器において前記少なくとも一つの内容に応じて決まる範囲に表示される第一画像よりも該第一画像とは異なる範囲に表示される第二画像が低画質となるように前記領域の前記画像データを生成することを特徴とする請求項1乃至6のいずれか一項に記載の画像表示システム。 Providing information relating to at least one of the positional relationship between the second user and the display and the posture of the second user while the second user is present in front of the display, to the second computer Has an information provision device,
The first computer further executes a process of acquiring the at least one content specified from the information by the second computer, and in the process of generating the image data of the area, the display is performed in the image of the area. The image data of the area is set such that the second image displayed in a range different from the first image is lower than the first image displayed in the range determined according to the at least one content in the device. The image display system according to any one of claims 1 to 6, wherein the image display system generates the image.
前記第一コンピュータは、前記第二コンピュータから前記距離の計測結果を取得し、前記距離が予め設定された大きさ以上であるときには、前記人物画像の画質を所定の画質まで低下させ、低下後の画質の前記人物画像を示す低画質人物画像データを生成して前記第二コンピュータに向けて送信することを特徴とする請求項1乃至7のいずれか一項に記載の画像表示システム。 It has a distance measurement device that measures the distance between the second user and the display while the second user is in front of the display.
The first computer acquires the measurement result of the distance from the second computer, and when the distance is equal to or larger than a preset size, the image quality of the person image is reduced to a predetermined image quality, The image display system according to any one of claims 1 to 7, wherein low-quality person image data indicating the person image of image quality is generated and transmitted to the second computer.
前記第一コンピュータが、前記第一ユーザの身体各部の位置に関する計測対象値を計測する計測装置から、前記計測対象値の計測結果を取得する処理を実行することと、
前記第一コンピュータが、前回の前記フレーム画像の取得時から今回の前記フレーム画像の取得時までの期間中における前記計測対象値の計測結果の変化に基づいて、前記身体各部のうち、前記期間中に動いた被特定部分を特定する処理を実行することと、
前記第一コンピュータが、今回取得した前記フレーム画像における前記第一ユーザの人物画像のうち、前記被特定部分を含む領域を抽出する処理を実行することと、
前記第一コンピュータが、前記領域の画像データを生成して前記第二コンピュータに向けて送信する処理を実行することと、
前記第二コンピュータが、前記画像データを受信すると、該画像データの受信前に前記表示器に表示された前記フレーム画像のうち、前記領域と対応した位置に前記画像データが示す前記領域の画像を重ね合わせることで構成された前記フレーム画像を、前記表示器に表示させることと、
を有することを特徴とする画像表示方法。 The second computer comprises a first computer for acquiring a frame image constituting a video of a first user captured by an imaging device, and a second computer for communicating with the first computer to acquire the frame image. The image display method, wherein the frame image acquired by the computer is displayed by a display to a second user who is at a different place from the first user,
Performing a process of acquiring the measurement result of the measurement target value from a measurement device that measures the measurement target value regarding the position of each part of the body of the first user;
The first computer calculates the duration of the period among the body parts based on a change in the measurement result of the measurement target value during the period from the previous acquisition of the frame image to the current acquisition of the frame image. Executing processing for identifying the identified part moved to
Performing a process of extracting an area including the specified part from the person image of the first user in the frame image acquired this time;
Performing processing of generating image data of the area and transmitting the image data to the second computer;
When the second computer receives the image data, an image of the area indicated by the image data is displayed at a position corresponding to the area in the frame image displayed on the display before the image data is received. Displaying the frame image configured by superimposing on the display;
An image display method characterized by comprising:
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015180009A JP6550307B2 (en) | 2015-09-11 | 2015-09-11 | Image display system and image display method |
| PCT/JP2016/076857 WO2017043661A1 (en) | 2015-09-11 | 2016-09-12 | Image display system and image display method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015180009A JP6550307B2 (en) | 2015-09-11 | 2015-09-11 | Image display system and image display method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017055354A JP2017055354A (en) | 2017-03-16 |
| JP6550307B2 true JP6550307B2 (en) | 2019-07-24 |
Family
ID=58240010
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015180009A Expired - Fee Related JP6550307B2 (en) | 2015-09-11 | 2015-09-11 | Image display system and image display method |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP6550307B2 (en) |
| WO (1) | WO2017043661A1 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7060544B6 (en) * | 2019-04-26 | 2022-05-23 | 塁 佐藤 | Exercise equipment |
| CN111866375A (en) * | 2020-06-22 | 2020-10-30 | 上海摩象网络科技有限公司 | Target action recognition method and device and camera system |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH07288789A (en) * | 1994-04-15 | 1995-10-31 | Hitachi Ltd | Intelligent encoding device and image communication device |
| JP2000059772A (en) * | 1998-08-05 | 2000-02-25 | Toshiba Corp | Video display method |
| JP4467224B2 (en) * | 2002-04-01 | 2010-05-26 | 富士フイルム株式会社 | Image transmission / reception system, image transmission apparatus, and image reception apparatus |
| JP2006197321A (en) * | 2005-01-14 | 2006-07-27 | Sony Corp | Image processing method and apparatus, and program |
| US9628755B2 (en) * | 2010-10-14 | 2017-04-18 | Microsoft Technology Licensing, Llc | Automatically tracking user movement in a video chat application |
| JP6102111B2 (en) * | 2012-07-27 | 2017-03-29 | 富士通株式会社 | Transmission device, communication device, data transmission program, and data transmission method |
| JP6229314B2 (en) * | 2013-05-30 | 2017-11-15 | ソニー株式会社 | Information processing apparatus, display control method, and program |
-
2015
- 2015-09-11 JP JP2015180009A patent/JP6550307B2/en not_active Expired - Fee Related
-
2016
- 2016-09-12 WO PCT/JP2016/076857 patent/WO2017043661A1/en not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| WO2017043661A1 (en) | 2017-03-16 |
| JP2017055354A (en) | 2017-03-16 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6461679B2 (en) | Video display system and video display method | |
| JP6496172B2 (en) | Video display system and video display method | |
| US11415935B2 (en) | System and method for holographic communication | |
| JP7519991B2 (en) | Apparatus and method for processing audiovisual data - Patents.com | |
| WO2016024288A1 (en) | Realistic viewing and interaction with remote objects or persons during telepresence videoconferencing | |
| JP5833526B2 (en) | Video communication system and video communication method | |
| CN109598796A (en) | Real scene is subjected to the method and apparatus that 3D merges display with dummy object | |
| US12560995B2 (en) | Asymmetric communication system with viewer position indications | |
| WO2018095317A1 (en) | Data processing method, device, and apparatus | |
| JP2004289527A (en) | Stereoscopic image display device | |
| JP6599183B2 (en) | Image display system and image display method | |
| WO2016159165A1 (en) | Image display system and image display method | |
| WO2017141584A1 (en) | Information processing apparatus, information processing system, information processing method, and program | |
| CN105933637A (en) | Video communication method and system | |
| JP5731462B2 (en) | Video communication system and video communication method | |
| JP6550307B2 (en) | Image display system and image display method | |
| US9773350B1 (en) | Systems and methods for greater than 360 degree capture for virtual reality | |
| CN120564748B (en) | Voice processing method and device and XR equipment | |
| CN112085777A (en) | Six-degree-of-freedom VR glasses | |
| JP5833525B2 (en) | Video communication system and video communication method | |
| JP5759439B2 (en) | Video communication system and video communication method | |
| CN104601875A (en) | Video image processing method and device | |
| CN103945218A (en) | Stereo image quality evaluating method based on binocular vision fusion | |
| JP2016062184A (en) | Moving image generation system, moving image generation device, moving image generation method, and computer program | |
| CN120499587B (en) | Stereo naked eye three-dimensional picture playing method, device, equipment and medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20170221 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170221 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180817 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190402 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190517 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190604 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190701 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6550307 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |