JP7716232B2 - Image processing device, control method thereof, and program - Google Patents
Image processing device, control method thereof, and programInfo
- Publication number
- JP7716232B2 JP7716232B2 JP2021089463A JP2021089463A JP7716232B2 JP 7716232 B2 JP7716232 B2 JP 7716232B2 JP 2021089463 A JP2021089463 A JP 2021089463A JP 2021089463 A JP2021089463 A JP 2021089463A JP 7716232 B2 JP7716232 B2 JP 7716232B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- information
- viewpoint
- image
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/111—Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
- H04N13/117—Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation the virtual viewpoint locations being selected by the viewers or determined by viewer tracking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/158—Switching image signals
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T15/00—Three-dimensional [3D] image rendering
- G06T15/10—Geometric effects
- G06T15/20—Perspective computation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/111—Transformation of image signals corresponding to virtual viewpoints, e.g. spatial image interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/10—Processing, recording or transmission of stereoscopic or multi-view image signals
- H04N13/106—Processing image signals
- H04N13/167—Synchronising or controlling image signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N13/00—Stereoscopic video systems; Multi-view video systems; Details thereof
- H04N13/20—Image signal generators
- H04N13/282—Image signal generators for generating image signals corresponding to three or more geometrical viewpoints, e.g. multi-view systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Geometry (AREA)
- Computing Systems (AREA)
- Computer Graphics (AREA)
- General Physics & Mathematics (AREA)
- Processing Or Creating Images (AREA)
- Image Generation (AREA)
- Closed-Circuit Television Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本発明は、画像処理装置およびその制御方法、プログラムに関する。 The present invention relates to an image processing device, a control method thereof, and a program.
昨今、複数のカメラを異なる位置に設置して多視点で同期撮影し、当該撮影により得られた多視点映像を用いて仮想視点映像を生成する技術が注目されている。例えば、特許文献1には、被写体を取り囲むように複数のカメラを配置し、これら複数のカメラで撮影した被写体の画像を用いて任意の視点の画像を生成する技術が開示されている。このような多視点映像から仮想視点映像を生成する技術によれば、例えば、サッカーやバスケットボールのハイライトシーンを様々な角度から視聴することが出来るため、通常の映像と比較して視聴者に高臨場感を与えることが出来る。また、音楽イベントの撮影やライブ配信、ミュージックビデオなどでは、アーティストを様々な角度から写した映像を作成することができる。 Recently, attention has been focused on technology that uses multiple cameras installed in different positions to capture synchronized images from multiple viewpoints and generate virtual viewpoint images using the multi-view images obtained through this capture. For example, Patent Document 1 discloses technology in which multiple cameras are positioned to surround a subject and images of the subject captured by these cameras are used to generate an image from any viewpoint. This technology for generating virtual viewpoint images from multi-view images allows viewers to view highlight scenes of soccer or basketball games from various angles, for example, providing a greater sense of realism to viewers than with regular images. Furthermore, when filming music events, live streaming, or music videos, it is possible to create images of artists from various angles.
音楽イベントの撮影やライブ配信、ミュージックビデオ等の撮影では、複数台のカメラから同時に得られる複数の映像を切り替えて使用することが行われる。例えば、第1のカメラにより被写体の周辺を含めたロングショットの映像から被写体のバストショットまでのいわゆる「引きの映像」を撮影する。また、例えば、第2のカメラにより被写体のバストショットの映像からクローズショットまでのいわゆる「よりの映像」を撮影する。そして、これら第1のカメラと第2のカメラにより撮影された映像を切り替えて使用することで、様々な被写体のサイズに対応した映像を生成することができる。このとき、例えば、第1のカメラを上述した仮想視点映像を生成する仮想視点(本明細書では仮想カメラと称する)とし、第2のカメラを仮想視点映像に利用しない画像を撮影する実態のあるカメラ(本明細書では実カメラと称する)とすることが考えられる。 When filming music events, live broadcasts, music videos, etc., it is common to switch between multiple images captured simultaneously from multiple cameras. For example, a first camera is used to capture what is known as a "long shot" ranging from a long shot including the subject's surroundings to a bust shot of the subject. A second camera is used to capture what is known as a "close-up shot" ranging from a bust shot to a close-up of the subject. By switching between the images captured by the first and second cameras, it is possible to generate images that correspond to various subject sizes. In this case, for example, the first camera could be used as a virtual viewpoint (referred to herein as a virtual camera) that generates the virtual viewpoint image described above, and the second camera could be used as a physical camera (referred to herein as a real camera) that captures images that are not used for the virtual viewpoint image.
一般に、2つの映像を切り替えて1つの映像を出力する映像切替装置では、映像を瞬時に別の映像に切り替わるため、切り替え時に映像が大きく変化する。このため、視聴者が違和感を持つ場合がある。映像の切り替え時における視聴者の違和感を低減するための方法として、映像の切り替えにおいて、フェードイン、フェードアウト等の映像効果を加えることが知られている。しかしながら、切り替え時においては第1のカメラによる映像と第2のカメラによる映像が用いられることに変わりはなく、映像の切り替えに起因した不自然な映像の変化の発生を避けることはできない。 Generally, video switching devices that switch between two videos and output one video instantly switch from one video to another, resulting in a significant change in the video when switching. This can cause viewers to feel uncomfortable. One known method for reducing the sense of discomfort felt by viewers when switching between videos is to add visual effects such as fade-in and fade-out when switching between videos. However, this still means that the video from the first camera and the video from the second camera are used when switching, and it is impossible to avoid unnatural changes in the video caused by switching between videos.
本発明の一態様によれば、2つの映像を切り替えて出力する際の映像の不自然な変化を低減する技術が提供される。 One aspect of the present invention provides technology that reduces unnatural changes in images when switching between two images for output.
本発明の一態様による画像処理装置は以下の構成を有する。すなわち、
少なくとも一方が撮像装置により得られる撮像映像である第1の映像及び第2の映像に係る情報を取得する取得手段であって、前記第1の映像を得るための第1の視点の情報と、前記第1の映像の時刻と対応する時刻の前記第2の映像を得るための第2の視点の情報とを取得する前記取得手段と、
出力される映像を前記第1の映像から前記第2の映像に切り替える際に、前記第1の映像の出力の終了から前記第2の映像の出力の開始までの期間を設定する設定手段と、
前記期間における前記第1の視点の情報と前記期間における前記第2の視点の情報とに基づいて、前記期間における仮想視点の情報を生成する第1生成手段と、
前記期間における仮想視点の情報に基づいて前記期間の仮想視点映像を生成する第2生成手段と、
前記第1の映像、前記期間の仮想視点映像、前記第2の映像の順に切り替えて出力する出力手段と、
を有し、
前記第1生成手段は、前記第1の視点の情報、前記第2の視点の情報、前記期間の開始からの経過時間と前記期間の全体の時間との比率に基づいて前記期間の仮想視点を生成する。
本発明の他の態様による画像処理装置は以下の構成を有する。すなわち、
少なくとも一方が撮像装置により得られる撮像映像である第1の映像及び第2の映像に係る情報を取得する取得手段であって、前記第1の映像を得るための第1の視点の情報と、前記第1の映像の時刻と対応する時刻の前記第2の映像を得るための第2の視点の情報とを取得する前記取得手段と、
出力される映像を前記第1の映像から前記第2の映像に切り替える際に、前記第1の映像の出力の終了から前記第2の映像の出力の開始までの期間を設定する設定手段と、
前記期間における前記第1の視点の情報と前記期間における前記第2の視点の情報とに基づいて、前記期間における仮想視点の情報を生成する第1生成手段と、
前記期間における仮想視点の情報に基づいて前記期間の仮想視点映像を生成する第2生成手段と、
前記第1の映像、前記期間の仮想視点映像、前記第2の映像の順に切り替えて出力する出力手段と、
前記期間に受け付けたユーザ操作に応じて比率を設定する設定手段と、
を有し、
前記第1生成手段は、前記第1の視点の情報、前記第2の視点の情報、前記設定手段により設定された比率に基づいて前記期間の仮想視点を生成する。
本発明のさらに他の態様による画像処理装置は以下の構成を有する。すなわち、
少なくとも一方が撮像装置により得られる撮像映像である第1の映像及び第2の映像に係る情報を取得する取得手段であって、前記第1の映像を得るための第1の視点の情報と、前記第1の映像の時刻と対応する時刻の前記第2の映像を得るための第2の視点の情報とを取得する前記取得手段と、
出力される映像を前記第1の映像から前記第2の映像に切り替える際に、前記第1の映像の出力の終了から前記第2の映像の出力の開始までの期間を設定する設定手段と、
前記期間における前記第1の視点の情報と前記期間における前記第2の視点の情報とに基づいて、前記期間における仮想視点の情報を生成する第1生成手段と、
前記期間における仮想視点の情報に基づいて前記期間の仮想視点映像を生成する第2生成手段と、
前記第1の映像、前記期間の仮想視点映像、前記第2の映像の順に切り替えて出力する出力手段と、
を有し、
前記第1生成手段は、前記期間における各時刻の仮想視点を、前記各時刻における前記第1の視点の情報と、前記各時刻における前記第2の視点の情報とに基づいて生成する。
An image processing device according to one aspect of the present invention has the following configuration:
an acquisition means for acquiring information relating to a first image and a second image, at least one of which is an image captured by an imaging device, the acquisition means acquiring information about a first viewpoint for acquiring the first image and information about a second viewpoint for acquiring the second image at a time corresponding to the time of the first image;
a setting means for setting a period from the end of output of the first video to the start of output of the second video when switching the video to be output from the first video to the second video;
a first generating means for generating virtual viewpoint information for the period based on the first viewpoint information for the period and the second viewpoint information for the period;
a second generating means for generating a virtual viewpoint video for the period based on information about a virtual viewpoint for the period;
an output means for switching between and outputting the first video, the virtual viewpoint video for the period, and the second video in that order;
and
The first generation means generates a virtual viewpoint for the period based on information about the first viewpoint, information about the second viewpoint, and a ratio of the elapsed time from the start of the period to the total time of the period.
An image processing device according to another aspect of the present invention has the following configuration:
an acquisition means for acquiring information relating to a first image and a second image, at least one of which is an image captured by an imaging device, the acquisition means acquiring information about a first viewpoint for acquiring the first image and information about a second viewpoint for acquiring the second image at a time corresponding to the time of the first image;
a setting means for setting a period from the end of output of the first video to the start of output of the second video when switching the video to be output from the first video to the second video;
a first generating means for generating virtual viewpoint information for the period based on the first viewpoint information for the period and the second viewpoint information for the period;
a second generating means for generating a virtual viewpoint video for the period based on information about a virtual viewpoint for the period;
an output means for switching between and outputting the first video, the virtual viewpoint video for the period, and the second video in that order;
a setting means for setting a ratio in accordance with a user operation received during the period;
and
The first generating means generates a virtual viewpoint for the period based on the information about the first viewpoint, the information about the second viewpoint, and the ratio set by the setting means.
An image processing apparatus according to still another aspect of the present invention has the following configuration:
an acquisition means for acquiring information relating to a first image and a second image, at least one of which is an image captured by an imaging device, the acquisition means acquiring information about a first viewpoint for acquiring the first image and information about a second viewpoint for acquiring the second image at a time corresponding to the time of the first image;
a setting means for setting a period from the end of output of the first video to the start of output of the second video when switching the video to be output from the first video to the second video;
a first generating means for generating virtual viewpoint information for the period based on the first viewpoint information for the period and the second viewpoint information for the period;
a second generating means for generating a virtual viewpoint video for the period based on information about a virtual viewpoint for the period;
an output means for switching between and outputting the first video, the virtual viewpoint video for the period, and the second video in that order;
and
The first generation means generates a virtual viewpoint at each time during the period based on information about the first viewpoint at each time and information about the second viewpoint at each time.
本発明によれば、2つの映像を切り替えて出力する際の映像の不自然な変化が低減される。 This invention reduces unnatural changes in the images when switching between two images for output.
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。 The following describes the embodiments in detail with reference to the attached drawings. Note that the following embodiments do not limit the scope of the claimed invention. While the embodiments describe multiple features, not all of these features are necessarily essential to the invention, and multiple features may be combined in any desired manner. Furthermore, in the attached drawings, the same reference numbers are used to designate identical or similar components, and redundant explanations will be omitted.
<第1実施形態>
以下、出力される映像を、第1の視点の映像から第2の視点の映像へ替える画像処理装置について説明する。第1実施形態では、第1の視点を、複数の撮像装置により撮影された複数の画像から仮想視点映像を生成するための仮想的な撮像装置の視点とし、第2の視点を、映像を撮影する物理的な撮像装置の視点とする。すなわち、第1の視点の映像は仮想視点映像であり、第2の視点の映像は実カメラによる映像(以下、実カメラ映像)である。以下では、仮想視点映像を生成する画像処理システムにおいて、仮想視点映像から実カメラ映像への切り替えにおいて、それら2つの映像をなめらかにつなげる新たな仮想視点映像を生成する例を説明する。
First Embodiment
An image processing device that changes an output image from a first viewpoint image to a second viewpoint image will be described below. In the first embodiment, the first viewpoint is the viewpoint of a virtual imaging device for generating a virtual viewpoint image from multiple images captured by multiple imaging devices, and the second viewpoint is the viewpoint of a physical imaging device that captures the image. That is, the first viewpoint image is a virtual viewpoint image, and the second viewpoint image is an image captured by a real camera (hereinafter, referred to as a real camera image). An example will be described below in which, in an image processing system that generates a virtual viewpoint image, a new virtual viewpoint image is generated that smoothly connects the two images when switching from the virtual viewpoint image to the real camera image.
図1は、第1実施形態にかかわる仮想視点映像を生成する画像処理システムの構成例を示すブロック図である。カメラ群101は仮想視点映像を生成するために、撮影範囲の多視点画像を取得する複数の撮像装置(以下、カメラと称する)で構成される。複数のカメラの各々は内部に撮像素子を備え、その前方にレンズが備えられている。複数のカメラは、撮影範囲に向けて撮影範囲の周囲に設置固定されている。カメラ制御部102は、カメラ群101の各カメラを制御する。カメラ制御部102は、カメラ群101のカメラごとに設けられ、カメラ制御ケーブルとカメラ画像出力ケーブルとでカメラ群101の各カメラと接続されている。また、複数のカメラ制御部102の間は、ローカルネットワークケーブル等を介して、例えばデイジーチェインで接続され、後段に接続される画像処理装置103にカメラ群101の画像を送信する。なお、複数のカメラ制御部102を接続するためのネットワーク構成はデイジーチェインに限られるものではなく、カメラ制御それぞれが画像処理装置に接続されるスター型のネットワーク構成であってもよい。 FIG. 1 is a block diagram showing an example configuration of an image processing system for generating a virtual viewpoint video according to the first embodiment. The camera group 101 is composed of multiple imaging devices (hereinafter referred to as cameras) that capture multi-viewpoint images of the shooting range in order to generate a virtual viewpoint video. Each of the multiple cameras has an internal imaging element and a lens in front of it. The multiple cameras are fixedly installed around the shooting range, facing the shooting range. A camera control unit 102 controls each camera in the camera group 101. A camera control unit 102 is provided for each camera in the camera group 101, and is connected to each camera in the camera group 101 via a camera control cable and a camera image output cable. The multiple camera control units 102 are connected to each other via a local network cable or the like, for example, in a daisy chain, and transmit images from the camera group 101 to an image processing device 103 connected downstream. The network configuration for connecting the multiple camera control units 102 is not limited to a daisy chain, and may be a star-type network configuration in which each camera control unit is connected to an image processing device.
画像処理装置103は、カメラ群101で取得した画像(多視点画像)を基に仮想的な視点からの映像である仮想視点映像を生成し、出力する機能を有する。以下、画像処理装置103の機能構成について説明する。 The image processing device 103 has the function of generating and outputting a virtual viewpoint image, which is an image from a virtual viewpoint, based on the images (multi-viewpoint images) acquired by the camera group 101. The functional configuration of the image processing device 103 is described below.
画像取得部104は、カメラ制御部102から、カメラ群101により取得された撮影画像(多視点画像)を取得する。なお、画像取得部104は、撮影対象(前景)が含まれていない撮影領域をカメラ群101により撮影することで得られた撮影画像を背景画像として事前に取得し、背景画像記憶部105に記憶する。分離部106は、撮影領域を撮影した撮影画像から、その画像に含まれている撮影対象(前景)を分離する。分離部106は、例えば、背景差分による分離を行う。より具体的には、分離部106は、事前に取得され背景画像記憶部105に記憶されている背景画像と撮影画像を比較し、その差分を撮影対象である前景として識別することにより、前景と背景を分離する。分離部106は、分離した前景を含む画像(以下、前景画像という)を前景画像記憶部107に記憶する。なお、分離部106が用いる前景と背景の分離方法は、上述の背景差分を用いた分離手法に限られるものではなく、例えば、距離画像を利用した分離手法など、周知の分離手法が用いられ得る。 The image acquisition unit 104 acquires captured images (multi-view images) acquired by the camera group 101 from the camera control unit 102. The image acquisition unit 104 also acquires, in advance, captured images obtained by the camera group 101 capturing an image of a capturing area that does not include the subject (foreground) as background images and stores the images in the background image storage unit 105. The separation unit 106 separates the subject (foreground) included in the captured image from the captured image of the capturing area. The separation unit 106 performs separation by, for example, background subtraction. More specifically, the separation unit 106 compares the captured image with a background image acquired in advance and stored in the background image storage unit 105, and identifies the difference as the foreground, which is the subject, thereby separating the foreground from the background. The separation unit 106 stores the separated image including the foreground (hereinafter referred to as the foreground image) in the foreground image storage unit 107. Note that the method of separating the foreground and background used by the separation unit 106 is not limited to the separation method using background subtraction described above, and any well-known separation method, such as a separation method using a distance image, can be used.
前景画像記憶部107には、撮影領域の周囲に設置されたカメラ群101の撮影画像から分離部106により分離された複数の前景画像(複数のカメラ(すなわち複数の視点)で取得された複数の前景画像)が記憶される。3Dモデル生成部108は、前景画像記憶部107から前景画像を取得し、前景の3Dモデルを生成する。3Dモデル生成部108は、例えば、複数視点で取得された前景画像から視体積交差法を用いて前景の3Dモデルを生成する。生成された前景の3Dモデルとその位置情報は3Dモデル記憶部109に記憶される。 The foreground image storage unit 107 stores multiple foreground images (multiple foreground images acquired from multiple cameras (i.e., multiple viewpoints)) separated by the separation unit 106 from images captured by the group of cameras 101 installed around the shooting area. The 3D model generation unit 108 acquires the foreground images from the foreground image storage unit 107 and generates a 3D model of the foreground. The 3D model generation unit 108 generates a 3D model of the foreground using, for example, a volume intersection method from the foreground images acquired from multiple viewpoints. The generated foreground 3D model and its position information are stored in the 3D model storage unit 109.
仮想カメラ情報生成部110は、ジョイスティックや各種入力部などのユーザインターフェースから受け付けた、仮想視点の位置、視線の方向などを指示するユーザ操作に応じて仮想カメラ情報を生成する。仮想カメラ情報は、仮想視点映像の仮想視点(以下、仮想カメラともいう)の位置・姿勢(視線方向)・画角(焦点距離)の情報及び時刻情報を含む。すなわち、仮想カメラ情報生成部110の機能は、ジョイスティック等の入力部を用いた操作者による仮想カメラの操作に応じて、仮想視点映像を生成するために必要な仮想視点の時刻ごとの情報を生成する。 The virtual camera information generation unit 110 generates virtual camera information in response to user operations that specify the position of the virtual viewpoint, the direction of the line of sight, etc., received from a user interface such as a joystick or various input units. The virtual camera information includes information on the position, attitude (line of sight direction), and angle of view (focal length) of the virtual viewpoint (hereinafter also referred to as the virtual camera) of the virtual viewpoint video, as well as time information. In other words, the function of the virtual camera information generation unit 110 is to generate time-specific information about the virtual viewpoint required to generate the virtual viewpoint video in response to operation of the virtual camera by the operator using an input unit such as a joystick.
仮想視点映像生成部111は、仮想カメラ情報生成部110または後述の仮想カメラ情報自動生成部117により生成された仮想カメラ情報により表される時刻、仮想カメラの位置、姿勢、画角に基づいて仮想視点映像を生成する。例えば、仮想視点映像生成部111は、仮想視点映像を生成するために、当該時刻の前景画像を前景画像記憶部107から、当該時刻の前景3Dモデルを3Dモデル記憶部109から取得し、仮想カメラの位置、姿勢、画角に対応した前景画像を生成する。また、仮想視点映像生成部111は、背景画像記憶部105に記憶された背景画像を取得し、あらかじめ用意されている背景3Dモデルを取得し、仮想カメラの位置、姿勢、画角に対応した背景画像を生成する。仮想視点映像生成部111は、生成した前景画像と背景画像を合成して仮想視点映像として出力する。仮想視点映像は、映像切替部115に提供され、最終的な映像として出力される映像候補の1つとなる。 The virtual viewpoint video generation unit 111 generates a virtual viewpoint video based on the time, position, attitude, and angle of view of the virtual camera represented by the virtual camera information generated by the virtual camera information generation unit 110 or the automatic virtual camera information generation unit 117 (described below). For example, to generate a virtual viewpoint video, the virtual viewpoint video generation unit 111 acquires a foreground image for that time from the foreground image storage unit 107 and a foreground 3D model for that time from the 3D model storage unit 109, and generates a foreground image corresponding to the position, attitude, and angle of view of the virtual camera. The virtual viewpoint video generation unit 111 also acquires a background image stored in the background image storage unit 105, acquires a prepared background 3D model, and generates a background image corresponding to the position, attitude, and angle of view of the virtual camera. The virtual viewpoint video generation unit 111 combines the generated foreground image and background image and outputs the result as a virtual viewpoint video. The virtual viewpoint video is provided to the video switching unit 115 and becomes one of the candidate images to be output as the final video.
実カメラ112は、カメラ群101とは独立に、仮想カメラの撮影範囲を撮影することが可能なカメラである。実カメラ112は、仮想視点映像のために必要な画像を取得するのではなく、被写体をクローズアップで撮影したりするために用いられる。なお、本実施形態では、仮想視点映像に必要な画像を取得するカメラ群101、および、実際には存在しないが仮想視点映像を取得しているかのような位置に仮想的に配置される仮想カメラと区別するために、実カメラという名称を用いている。実カメラ112により得られる撮像映像は、後述する映像切替部115に提供され、最終的な映像として出力される映像候補の1つとなる。 The real camera 112 is a camera that can capture images within the shooting range of the virtual camera independently of the camera group 101. The real camera 112 is used not to capture images necessary for the virtual viewpoint video, but to capture close-up images of a subject. Note that in this embodiment, the term "real camera" is used to distinguish it from the camera group 101 that captures images necessary for the virtual viewpoint video, and the virtual camera that does not actually exist but is virtually placed in a position as if capturing the virtual viewpoint video. The captured image obtained by the real camera 112 is provided to the image switching unit 115, which will be described later, and becomes one of the image candidates to be output as the final image.
実カメラ情報取得部113は、実カメラ112の位置、姿勢(視線方向)、画角(焦点距離)を含む情報を取得する。実カメラ情報取得部113は、実カメラ112の位置および姿勢を、例えば、実カメラ112が移動する範囲に配置されたマーカが実カメラ112により撮影された画像に映り込んでいる位置から推定する。但し、これに限られるものではなく、例えば、実カメラ112に実カメラとは別に位置推定用にマーカを撮影するカメラを接続することでマーカの画像を得てもよい。また、マーカを配置せず、実カメラ112により撮影された画像から、位置が既知である特徴的な個所を特定し、実カメラ112の位置および姿勢を推定するようにしてもよい。 The real camera information acquisition unit 113 acquires information including the position, orientation (line of sight direction), and angle of view (focal length) of the real camera 112. The real camera information acquisition unit 113 estimates the position and orientation of the real camera 112, for example, from the position at which a marker placed within the range in which the real camera 112 moves is reflected in an image captured by the real camera 112. However, this is not limited to this, and for example, an image of the marker may be obtained by connecting a camera that captures markers for position estimation to the real camera 112 separately from the real camera. Alternatively, without placing a marker, the position and orientation of the real camera 112 may be estimated by identifying characteristic locations whose positions are known from images captured by the real camera 112.
映像決定部114は、複数の出力映像の候補から出力映像を選択して決定する。映像決定部114は、映像出力を選択するスイッチや、音量等を調整するフェーダーなどの入力部を備えている。また、映像を切り替える際の各種映像効果(トランジション)を加えて切り替えることもできる。例えば、仮想視点映像を出力すると決定したり、仮想視点映像から実カメラ映像に切替をしたり、切り替える際にフェードインやフェードアウト等の映像効果を加えるよう決定したりすることができる。映像決定部114は、選択した映像を指定するチャンネル情報や、切り替える際に実行される映像効果を示す情報を映像切替部115に送信する。映像切替部115は、映像決定部114からの情報を基に映像候補から映像を選択し、映像出力部116へ出力する。映像出力部116は、映像切替部115から供給される映像を外部へ出力する。 The video determination unit 114 selects and determines an output video from multiple output video candidates. The video determination unit 114 has input units such as a switch for selecting video output and a fader for adjusting volume, etc. The video determination unit 114 can also add various video effects (transitions) when switching between videos. For example, it can determine to output a virtual viewpoint video, switch from a virtual viewpoint video to a real camera video, or determine to add video effects such as fade-in or fade-out when switching. The video determination unit 114 transmits channel information specifying the selected video and information indicating the video effects to be executed when switching to the video switching unit 115. The video switching unit 115 selects a video from the video candidates based on the information from the video determination unit 114 and outputs it to the video output unit 116. The video output unit 116 outputs the video supplied from the video switching unit 115 to the outside.
仮想カメラ情報自動生成部117は、仮想カメラの映像から実カメラの映像へ出力映像を切り替える際に、切替前後の映像を繋ぐような仮想視点映像を得るための仮想カメラ情報を自動的に生成する。仮想カメラ情報自動生成部117で生成される仮想カメラ情報は、映像を切り替える際の映像効果の一つであり、仮想カメラと実カメラの位置、姿勢(視線の方向)、画角(焦点距離(ズーム値))が異なる場合に、仮想カメラ情報と実カメラ情報から新たな仮想カメラ情報を自動で生成し、映像の切り替え時における映像の変化をなめらかにする。 When switching the output video from a virtual camera to a real camera, the automatic virtual camera information generation unit 117 automatically generates virtual camera information to obtain a virtual viewpoint video that connects the videos before and after the switch. The virtual camera information generated by the automatic virtual camera information generation unit 117 is one of the video effects when switching videos. When the positions, attitudes (directions of gaze), and angle of view (focal length (zoom value)) of the virtual camera and real camera are different, new virtual camera information is automatically generated from the virtual camera information and real camera information, smoothing the change in video when switching videos.
次に、以上のような機能構成を実現する画像処理装置103のハードウェア構成について、図10を用いて説明する。画像処理装置103は、CPU(中央演算装置)1001、ROM(リードオンリーメモリ)1002、RAM(ランダムアクセスメモリ)1003、補助記憶装置1004、表示部1005、操作部1006、通信I/F1007、及びバス1018を有する。 Next, the hardware configuration of the image processing device 103 that realizes the above-described functional configuration will be described using FIG. 10. The image processing device 103 has a CPU (Central Processing Unit) 1001, ROM (Read Only Memory) 1002, RAM (Random Access Memory) 1003, auxiliary storage device 1004, display unit 1005, operation unit 1006, communication I/F 1007, and bus 1018.
CPU1001は、ROM1002やRAM1003に格納されているコンピュータプログラムやデータを用いて画像処理装置103の全体を制御することで、図1に示す画像処理装置103の各機能を実現する。なお、画像処理装置103がCPU1001とは異なる1又は複数の専用のハードウェアを有し、CPU1001による処理の少なくとも一部を専用のハードウェアが実行してもよい。専用のハードウェアの例としては、ASIC(特定用途向け集積回路)、FPGA(フィールドプログラマブルゲートアレイ)、およびDSP(デジタルシグナルプロセッサ)などがある。ROM1002は、変更を必要としないプログラムなどを格納する。RAM1003は、補助記憶装置1004から供給されるプログラムやデータ、及び通信I/F1007を介して外部から供給されるデータなどを一時記憶する。補助記憶装置1004は、例えばハードディスクドライブ等で構成され、画像データや音声データなどの種々のデータを記憶する。 The CPU 1001 realizes each function of the image processing device 103 shown in FIG. 1 by controlling the entire image processing device 103 using computer programs and data stored in the ROM 1002 and RAM 1003. The image processing device 103 may have one or more pieces of dedicated hardware separate from the CPU 1001, and at least some of the processing by the CPU 1001 may be performed by the dedicated hardware. Examples of dedicated hardware include an ASIC (application-specific integrated circuit), an FPGA (field-programmable gate array), and a DSP (digital signal processor). The ROM 1002 stores programs that do not require modification. The RAM 1003 temporarily stores programs and data supplied from the auxiliary storage device 1004, as well as data supplied from the outside via the communication I/F 1007. The auxiliary storage device 1004 is composed of, for example, a hard disk drive, and stores various data such as image data and audio data.
表示部1005は、例えば液晶ディスプレイやLED等で構成され、ユーザが画像処理装置103を操作するためのGUI(Graphical User Interface)などを表示する。操作部1006は、例えばキーボードやマウス、ジョイスティック、タッチパネル等で構成され、ユーザによる操作を受けて各種の指示をCPU1001に入力する。通信I/F1007は、画像処理装置103の外部の装置との通信に用いられる。例えば、画像処理装置103が外部の装置と有線で接続される場合には、通信用のケーブルが通信I/F1007に接続される。画像処理装置103が外部の装置と無線通信する機能を有する場合には、通信I/F1007はアンテナを備える。バス1018は、画像処理装置103の各部をつないで情報を伝達する。 The display unit 1005 is composed of, for example, an LCD display or LEDs, and displays a GUI (Graphical User Interface) that allows the user to operate the image processing device 103. The operation unit 1006 is composed of, for example, a keyboard, mouse, joystick, touch panel, etc., and receives operations from the user to input various instructions to the CPU 1001. The communication I/F 1007 is used for communication with devices external to the image processing device 103. For example, if the image processing device 103 is connected to an external device via a wired connection, a communication cable is connected to the communication I/F 1007. If the image processing device 103 has the function of wirelessly communicating with external devices, the communication I/F 1007 is equipped with an antenna. The bus 1018 connects each unit of the image processing device 103 to transmit information.
本実施形態では表示部1005と操作部1006が画像処理装置103の内部に存在するものとするが、表示部1005と操作部1006との少なくとも一方が画像処理装置103の外部に別の装置として存在していてもよい。この場合、CPU1001が、表示部1005を制御する表示制御部、及び操作部1006を制御する操作制御部として動作してもよい。 In this embodiment, the display unit 1005 and operation unit 1006 are assumed to exist inside the image processing device 103, but at least one of the display unit 1005 and operation unit 1006 may exist as a separate device outside the image processing device 103. In this case, the CPU 1001 may operate as a display control unit that controls the display unit 1005 and an operation control unit that controls the operation unit 1006.
次に、以上のような構成を備えた画像処理装置103による、仮想カメラと実カメラの映像を切り替える際の処理について図2を用いて説明する。図2は第1実施形態の画像処理装置による出力映像決定処理を示すフローチャートである。なお、図2では、カメラ群101により取得された画像を前景画像記憶部107に記憶する処理、分離部106により分離された前景画像を3Dモデル記憶部109に記憶する処理は省略されている。 Next, the process of switching between images from a virtual camera and a real camera performed by the image processing device 103 configured as described above will be described with reference to Figure 2. Figure 2 is a flowchart showing the output image determination process performed by the image processing device of the first embodiment. Note that Figure 2 omits the process of storing images acquired by the camera group 101 in the foreground image storage unit 107 and the process of storing foreground images separated by the separation unit 106 in the 3D model storage unit 109.
ステップS201において、仮想視点映像生成部111は、仮想カメラ情報生成部110で生成された仮想カメラ情報を取得する。ステップS202において、仮想視点映像生成部111は、取得した仮想カメラ情報に基づいて仮想視点映像を生成する。ステップS203において、映像切替部115は、映像決定部114から出力映像の切替情報を取得する。切替情報は、例えば、映像決定部114が決定した切り替え後の出力映像のチャンネル、切り替える時刻などを示す。ステップS204において、映像切替部115は、ステップS203で取得した切替情報を基に出力映像を停止するかどうかを判断する。出力映像を停止すると判断された場合(ステップS204でYES)、ステップS205において、映像切替部115が映像の出力を停止する。出力映像を停止しないと判断された場合(S204でNO)、処理はステップS206に進む。 In step S201, the virtual viewpoint video generation unit 111 acquires the virtual camera information generated by the virtual camera information generation unit 110. In step S202, the virtual viewpoint video generation unit 111 generates a virtual viewpoint video based on the acquired virtual camera information. In step S203, the video switching unit 115 acquires output video switching information from the video determination unit 114. The switching information indicates, for example, the channel of the output video after switching determined by the video determination unit 114, the time of switching, etc. In step S204, the video switching unit 115 determines whether to stop the output video based on the switching information acquired in step S203. If it is determined that the output video should be stopped (YES in step S204), the video switching unit 115 stops the video output in step S205. If it is determined that the output video should not be stopped (NO in S204), the processing proceeds to step S206.
ステップS206において、映像切替部115は、ステップS203で取得した切替情報を基に出力映像を切り替えるかどうかを判断する。出力映像を切り替えないと判断された場合(ステップS206でNO)、ステップS207において、映像切替部115は出力映像を切り替えることなく映像の出力を継続する。そして、処理はステップS201に戻る。一方、出力映像を切り替えると判断された場合(ステップS206でYES)、処理はステップS208に進む。 In step S206, the video switching unit 115 determines whether to switch the output video based on the switching information acquired in step S203. If it is determined not to switch the output video (NO in step S206), in step S207 the video switching unit 115 continues outputting the video without switching the output video. Then, the process returns to step S201. On the other hand, if it is determined to switch the output video (YES in step S206), the process proceeds to step S208.
ステップS208において、映像切替部115は、出力映像の切替時に仮想カメラ情報を自動生成するかを判断する。仮想カメラ情報を自動生成しないと判断された場合(ステップS208でNO)、ステップS209において、映像切替部115は切替情報を基に映像出力部116へ出力する映像を、切替情報が示す切り替え後の映像へ直ちに切り替える。例えば、仮想カメラ情報生成部110が生成する仮想視点から仮想視点映像生成部111が生成した仮想視点映像から、実カメラ112により撮影された実カメラ映像への切り替えが行われる。そして、処理はステップS201に戻る。一方、仮想カメラ情報を自動生成すると判定された場合(ステップS208でYES)、処理はステップS210に進む。 In step S208, the video switching unit 115 determines whether to automatically generate virtual camera information when switching the output video. If it is determined that virtual camera information should not be automatically generated (NO in step S208), in step S209, the video switching unit 115 immediately switches the video to be output to the video output unit 116 based on the switching information to the post-switching video indicated by the switching information. For example, switching is performed from the virtual viewpoint generated by the virtual camera information generation unit 110 to the virtual viewpoint video generated by the virtual viewpoint video generation unit 111 to the real camera video captured by the real camera 112. Then, processing returns to step S201. On the other hand, if it is determined that virtual camera information should be automatically generated (YES in step S208), processing proceeds to step S210.
映像決定部114からの切替情報は仮想カメラ情報自動生成部117にも提供されている。ステップS210において、仮想カメラ情報自動生成部117は、映像決定部114から受信した切替情報から切替条件を取得する。切替条件は、例えば仮想カメラ情報を自動生成する期間(開始時刻と終了時刻)を示す移行期間の情報を含む。仮想カメラ情報自動生成部117は、仮想視点を生成するのに必要な仮想カメラ情報を仮想カメラ情報生成部110から、実カメラ情報を実カメラ情報取得部113から取得する。ステップS211において、仮想カメラ情報自動生成部117は、仮想カメラ情報と実カメラ情報と切替条件に基づいて、映像を切り替える際の新たな仮想視点の情報(仮想カメラ情報)を生成する。ステップS212において、仮想視点映像生成部111は、仮想カメラ情報自動生成部117により新たに生成された仮想視点に基づいて仮想視点映像を生成する。映像切替部115は、この新たな仮想視点から得られる仮想視点映像を出力した後、選択された映像(本例では実カメラ映像)の出力を開始する。そして、処理はステップS201に戻る。 The switching information from the video determination unit 114 is also provided to the virtual camera information automatic generation unit 117. In step S210, the virtual camera information automatic generation unit 117 acquires switching conditions from the switching information received from the video determination unit 114. The switching conditions include, for example, transition period information indicating the period (start time and end time) for automatically generating virtual camera information. The virtual camera information automatic generation unit 117 acquires virtual camera information necessary to generate a virtual viewpoint from the virtual camera information generation unit 110 and real camera information from the real camera information acquisition unit 113. In step S211, the virtual camera information automatic generation unit 117 generates new virtual viewpoint information (virtual camera information) for switching videos based on the virtual camera information, real camera information, and switching conditions. In step S212, the virtual viewpoint video generation unit 111 generates a virtual viewpoint video based on the new virtual viewpoint generated by the virtual camera information automatic generation unit 117. The video switching unit 115 outputs the virtual viewpoint video obtained from this new virtual viewpoint and then starts outputting the selected video (in this example, the real camera video). Processing then returns to step S201.
以下に仮想カメラから実カメラに出力映像を切り替える際の時刻経過ごとの仮想視点映像、実カメラ映像と出力映像の関係を、図3を使って説明する。図3は第1実施形態における映像の切り替え処理のタイムラインを示す図である。図3において、第1の仮想視点映像301は、仮想カメラ情報生成部110により生成された仮想カメラ情報(第1の仮想カメラ情報ともいう)に基づいて仮想視点映像生成部111が生成した仮想視点映像である。実カメラ映像302は、実カメラ112が撮影し出力する映像である。第2の仮想視点映像303は、仮想カメラ情報自動生成部117により生成された仮想カメラ情報(第2の仮想カメラ情報ともいう)に基づいて仮想視点映像生成部111が生成した仮想視点映像である。出力映像304は、映像切替部115が、候補映像である第1の仮想視点映像301、実カメラ映像302および第2の仮想視点映像303の中から選択し、出力する映像である。なお、横軸は時刻を表している。 The relationship between the virtual viewpoint video, real camera video, and output video over time when switching the output video from the virtual camera to the real camera is explained below using Figure 3. Figure 3 is a diagram showing a timeline of the video switching process in the first embodiment. In Figure 3, the first virtual viewpoint video 301 is a virtual viewpoint video generated by the virtual viewpoint video generation unit 111 based on the virtual camera information (also referred to as first virtual camera information) generated by the virtual camera information generation unit 110. The real camera video 302 is a video captured and output by the real camera 112. The second virtual viewpoint video 303 is a virtual viewpoint video generated by the virtual viewpoint video generation unit 111 based on the virtual camera information (also referred to as second virtual camera information) generated by the virtual camera information automatic generation unit 117. The output video 304 is a video selected by the video switching unit 115 from among the candidate videos of the first virtual viewpoint video 301, real camera video 302, and second virtual viewpoint video 303, and output. The horizontal axis represents time.
仮想視点映像生成部111は、操作者による仮想カメラ操作に応じて仮想カメラ情報生成部110が生成する仮想カメラ情報に従って第1の仮想視点映像301を生成し、出力している。実カメラ112も、自身が撮影した実カメラ映像302を出力している。なお、実カメラ112はカメラマンにより撮影中の位置及び姿勢、ズームなどが操作されている。時刻t0において、映像決定部114は、t2-t0秒後に第1の仮想視点映像301から実カメラ映像302へ、t7-t2秒かけて第2の仮想視点映像303を用いて切り替えることを示す切替情報310を、映像切替部115に出力する。図3の例では、第1の仮想視点映像の出力を終了する時刻t2から、実カメラ映像302の出力を開始する時刻t7までの間が移行期間として設定されている。 The virtual viewpoint video generation unit 111 generates and outputs a first virtual viewpoint video 301 in accordance with virtual camera information generated by the virtual camera information generation unit 110 in response to virtual camera operation by the operator. The real camera 112 also outputs a real camera video 302 that it has captured. Note that the real camera 112's position, orientation, zoom, etc. are controlled by the cameraman during capture. At time t0, the video determination unit 114 outputs switching information 310 to the video switching unit 115, indicating that switching will be performed from the first virtual viewpoint video 301 to the real camera video 302 after t2-t0 seconds, and then over t7-t2 seconds using the second virtual viewpoint video 303. In the example of Figure 3, the period from time t2, when output of the first virtual viewpoint video ends, to time t7, when output of the real camera video 302 begins, is set as a transition period.
映像切替部115が受け付ける切替情報310は、第1の仮想視点映像301から実カメラ映像302へ出力映像を切り替えること、切替条件として第2の仮想視点映像303を用いることを指示している。なお、第2の仮想視点映像303は、仮想カメラ情報自動生成部117が生成する仮想カメラ情報に基づいて仮想視点映像生成部111が生成した仮想視点画像である。また、切替条件には、時刻t2からt7が、映像の切り替えのための移行期間(第2の仮想視点映像を出力する期間)として設定されている。 The switching information 310 received by the video switching unit 115 instructs that the output video be switched from the first virtual viewpoint video 301 to the real camera video 302, and that the second virtual viewpoint video 303 be used as the switching condition. Note that the second virtual viewpoint video 303 is a virtual viewpoint image generated by the virtual viewpoint video generation unit 111 based on the virtual camera information generated by the automatic virtual camera information generation unit 117. Furthermore, the switching condition sets the time from t2 to t7 as the transition period for switching the video (the period during which the second virtual viewpoint video is output).
上述のような切替条件を含む切替情報310が映像決定部114から出力されると、図2のステップS206とステップS208でYESと判定される。仮想カメラ情報自動生成部117は、この切替条件を受け付けると、時刻t2から時刻t7にかけて第1の仮想視点映像301から実カメラ映像302へ切り替えるための第2の仮想視点映像303を作成するための新たな仮想視点(第2の仮想視点ともいう)を生成する。より具体的には、まず、仮想カメラ情報自動生成部117は時刻t2から時刻t7までの仮想視点の情報を作成するために、仮想カメラ情報生成部110から仮想カメラ情報を、実カメラ情報取得部113から実カメラ情報を取得する。仮想カメラ情報は、仮想視点映像生成部111が第1の仮想視点映像301を生成するのに用いている仮想視点の位置、視線の方向、画角の情報を含む。実カメラ情報は、実カメラ映像302を撮影している実カメラ112の位置、姿勢、画角の情報を含む。映像切替部115は、時刻t2までは第1の仮想視点映像301を選択して映像出力部116へ出力する。時刻t2で、映像切替部115は、映像出力部116へ出力する映像を、第1の仮想視点映像301から第2の仮想視点映像303に切り替える。さらに、時刻t7で、映像切替部115は、映像出力部116へ出力する映像を、第2の仮想視点映像303から実カメラ映像302に切り替える。映像出力部116は、映像切替部115から送られた映像を出力する。 When switching information 310 including the switching conditions described above is output from the image determination unit 114, YES is determined in steps S206 and S208 of FIG. 2. When the automatic virtual camera information generation unit 117 receives this switching condition, it generates a new virtual viewpoint (also referred to as a second virtual viewpoint) for creating a second virtual viewpoint video 303 for switching from the first virtual viewpoint video 301 to the real camera video 302 from time t2 to time t7. More specifically, to create virtual viewpoint information from time t2 to time t7, the automatic virtual camera information generation unit 117 first acquires virtual camera information from the virtual camera information generation unit 110 and real camera information from the real camera information acquisition unit 113. The virtual camera information includes information on the position, line of sight direction, and angle of view of the virtual viewpoint used by the virtual viewpoint video generation unit 111 to generate the first virtual viewpoint video 301. The real camera information includes information on the position, attitude, and angle of view of the real camera 112 capturing the real camera video 302. Until time t2, the video switching unit 115 selects the first virtual viewpoint video 301 and outputs it to the video output unit 116. At time t2, the video switching unit 115 switches the video to be output to the video output unit 116 from the first virtual viewpoint video 301 to the second virtual viewpoint video 303. Furthermore, at time t7, the video switching unit 115 switches the video to be output to the video output unit 116 from the second virtual viewpoint video 303 to the real camera video 302. The video output unit 116 outputs the video sent from the video switching unit 115.
仮想カメラ情報自動生成部117による仮想カメラ情報の自動生成処理の一例について図4A~図4Cを用いて詳細に説明する。図4A~図4Cは第1実施形態における、仮想カメラ情報の自動生成処理の例である。図4Aは、第1の仮想視点映像301を生成するための仮想カメラ、第2の仮想視点映像303を生成するための仮想カメラ、および、実カメラ映像302を撮影する実カメラ112の、時刻t0からt10の間の時刻ごとの位置と姿勢を示している。以下では仮想カメラと実カメラの位置について説明するが、その他のカメラ情報(姿勢、ズーム状態など)も同様に算出可能である。なお、t0~t10のタイムラインは、図3に示したタイムラインに対応している。 An example of the process for automatically generating virtual camera information by the virtual camera information automatic generation unit 117 will be described in detail using Figures 4A to 4C. Figures 4A to 4C show an example of the process for automatically generating virtual camera information in the first embodiment. Figure 4A shows the positions and orientations at each time between t0 and t10 of the virtual camera for generating the first virtual viewpoint video 301, the virtual camera for generating the second virtual viewpoint video 303, and the real camera 112 that captures the real camera video 302. The positions of the virtual camera and real camera are described below, but other camera information (orientation, zoom state, etc.) can also be calculated in a similar manner. The timeline from t0 to t10 corresponds to the timeline shown in Figure 3.
図4A~図4Cにおいて、第1の仮想カメラ情報401は、仮想カメラ情報生成部110で生成された第1の仮想カメラの位置情報によって示される位置を黒色の破線矢印で示している。第1の仮想カメラは、t0からt10の間、黒色の破線矢印に沿って、矢印の方向へ時々刻々と移動している。実カメラ情報403は、実カメラ情報取得部113にて取得された実カメラ112の位置情報によって示される位置を白抜きの破線矢印で示している。実カメラ112はt0からt10の間、白抜きの破線矢印にそって矢印の方向へ時々刻々と移動している。仮想カメラ情報自動生成部117は、時刻t2の仮想カメラ情報を起点にし、各時刻の実カメラ情報に近づいていくように第2の仮想カメラ情報402を生成していく。第2の仮想カメラ情報402による第2の仮想カメラの移動を、図4A~図4Cでは、黒の実線矢印で示している。 In Figures 4A to 4C, first virtual camera information 401 indicates the position indicated by the position information of the first virtual camera generated by the virtual camera information generation unit 110 with a black dashed arrow. The first virtual camera moves moment by moment along the black dashed arrow in the direction of the arrow between t0 and t10. Real camera information 403 indicates the position indicated by the position information of the real camera 112 acquired by the real camera information acquisition unit 113 with a white dashed arrow. The real camera 112 moves moment by moment along the white dashed arrow in the direction of the arrow between t0 and t10. The virtual camera information automatic generation unit 117 generates second virtual camera information 402 starting from the virtual camera information at time t2, gradually approaching the real camera information at each time. In Figures 4A to 4C, the movement of the second virtual camera based on the second virtual camera information 402 is indicated by a black solid arrow.
以下、図4Bから図4Cを用いて、仮想カメラ情報自動生成部117が、時々刻々と移動していく第1の仮想カメラの位置と実カメラ112の位置から第2の仮想カメラ2の位置を生成する手法を説明する。以下では、第1の仮想カメラの情報と実カメラの情報、移行期間の開始からの経過時間と移行期間の全体の時間との比率に基づいて第2の仮想視点の情報を生成する例を説明する。 The following describes, using Figures 4B and 4C, how the automatic virtual camera information generation unit 117 generates the position of the second virtual camera 2 from the position of the first virtual camera, which moves from moment to moment, and the position of the real camera 112. Below, we explain an example of generating information about the second virtual viewpoint based on information about the first virtual camera, information about the real camera, and the ratio between the elapsed time from the start of the transition period and the total time of the transition period.
図4Bの4aは、第1の仮想カメラ、実カメラ112、および第2の仮想カメラの時刻t2における位置を示している。時刻t2の時点では、第2の仮想カメラの位置と第1の仮想カメラの位置とは同じである。4bは、第1の仮想カメラ、実カメラ112、第2の仮想カメラの時刻t3における位置を示している。第2の仮想カメラの時刻t3における位置は、経過時間(t3-t2)と移行期間の全体の時間(t7-t2)との比率に基づいて決定される。より具体的には、第1の仮想カメラの時刻t2の位置と実カメラ112の時刻t3位置とを結ぶ線分上を、(t3-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方へ進んだ位置が第2の仮想カメラの時刻t3の位置となる。換言すると、第1の仮想視点の位置と実カメラ112の位置を比率に基づいて加重平均することにより移行期間における第2の仮想カメラの位置が生成される。4cは、第1の仮想カメラ、実カメラ112、第2の仮想カメラの時刻t4における位置を示している。第2の仮想カメラの時刻t4の位置は、時刻t3と同様の方法で生成される。すなわち、第1の仮想カメラの時刻t2の位置と実カメラ112の時刻t4の位置とを結ぶ線分上を、(t4-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方へ進んだ位置が第2の仮想カメラの時刻t4の位置となる。 4a in Figure 4B shows the positions of the first virtual camera, real camera 112, and second virtual camera at time t2. At time t2, the position of the second virtual camera is the same as the position of the first virtual camera. 4b shows the positions of the first virtual camera, real camera 112, and second virtual camera at time t3. The position of the second virtual camera at time t3 is determined based on the ratio of the elapsed time (t3 - t2) to the total time of the transition period (t7 - t2). More specifically, the position of the second virtual camera at time t3 is the position on the line segment connecting the position of the first virtual camera at time t2 and the position of real camera 112 at time t3, which is located a distance from the first virtual camera toward real camera 112 by the ratio (t3 - t2) / (t7 - t2). In other words, the position of the second virtual camera during the transition period is generated by taking a weighted average based on the ratio between the position of the first virtual viewpoint and the position of the real camera 112. 4c shows the positions of the first virtual camera, real camera 112, and second virtual camera at time t4. The position of the second virtual camera at time t4 is generated in the same manner as time t3. That is, the position of the second virtual camera at time t4 is the position on the line segment connecting the position of the first virtual camera at time t2 and the position of the real camera 112 at time t4, moved from the first virtual camera toward the real camera 112 by a ratio of (t4 - t2) / (t7 - t2).
図4Cの4dは、第1の仮想カメラ、実カメラ112、第2の仮想カメラの時刻t5における位置を示している。第2の仮想カメラの時刻t5の位置も、時刻t3と同様の方法で生成される。すなわち、第1の仮想カメラの時刻t2の位置と実カメラ112の時刻t5の位置とを結ぶ線分上で、(t5-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方向へ進んだ位置が第2の仮想カメラの時刻t5の位置となる。図Cの4eは、第1の仮想カメラ、実カメラ112、第2の仮想カメラの時刻t6における位置を示している。時刻t6の第2の仮想カメラの位置も上記と同様に生成される。すなわち、第1の仮想カメラの時刻t2の位置と実カメラ112の時刻t6の位置とを結ぶ線分上を、(t6-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方へ進んだ位置である。図4Cの4fは、第1の仮想カメラ、実カメラ112、第2の仮想カメラの時刻t7における位置を示している。第2の仮想カメラの時刻t7の位置は、第1の仮想カメラの時刻t2の位置と実カメラ112の時刻t7の位置とを結ぶ線分上を、(t7-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方向へ進んだ位置である。すなわち、移行期間の終了時刻である時刻t7において、第2の仮想カメラの位置と実カメラ112の位置は同じになる。 4d in Figure 4C shows the positions of the first virtual camera, real camera 112, and second virtual camera at time t5. The position of the second virtual camera at time t5 is also generated in a similar manner to that of time t3. That is, the position of the second virtual camera at time t5 is the position on the line segment connecting the position of the first virtual camera at time t2 and the position of real camera 112 at time t5, which is moved from the first virtual camera toward real camera 112 by a ratio of (t5 - t2) / (t7 - t2). 4e in Figure C shows the positions of the first virtual camera, real camera 112, and second virtual camera at time t6. The position of the second virtual camera at time t6 is also generated in a similar manner. That is, the position is the position on the line segment connecting the position of the first virtual camera at time t2 and the position of real camera 112 at time t6, which is moved from the first virtual camera toward real camera 112 by a ratio of (t6 - t2) / (t7 - t2). 4f in Figure 4C shows the positions of the first virtual camera, real camera 112, and second virtual camera at time t7. The position of the second virtual camera at time t7 is a position on the line segment connecting the position of the first virtual camera at time t2 and the position of real camera 112 at time t7, moved from the first virtual camera toward real camera 112 by a ratio of (t7 - t2) / (t7 - t2). In other words, at time t7, which is the end time of the transition period, the position of the second virtual camera and the position of real camera 112 are the same.
以上のように、第1実施形態によれば、第1の仮想カメラによる仮想視点映像から実カメラ112による実カメラ映像へ切り替える際に、時刻t2~時刻t7の移行期間が設けられる。そして、この移行期間において、第1の仮想カメラの位置から実カメラ112の位置へ移動する第2の仮想カメラの情報が、当該移行期間における第1の仮想カメラの情報と実カメラの情報に基づいて生成される。したがって、第1の仮想カメラの映像から実カメラ112の映像へ切り替える際に、第1の仮想カメラと実カメラの位置が離れていても、移行期間においてその間を補間する仮想カメラの情報を自動的に生成することができる。結果、仮想カメラの映像から実カメラの映像への切り替えにおいて違和感のない映像を提供することが可能である。なお、仮想カメラ映像から実カメラ映像へ切り替える処理を説明したが、実カメラ映像から仮想カメラ映像への映像へ切り替える場合も上記と同様の処理を適用できる。なお、その場合、移行期間の最初の時刻における第2の仮想カメラの位置は、実カメラ112と同一の位置とし、第2の仮想カメラの位置を徐々に第1の仮想カメラの位置へ近づけていくことになる。 As described above, according to the first embodiment, a transition period from time t2 to time t7 is provided when switching from the virtual viewpoint image captured by the first virtual camera to the real camera image captured by real camera 112. During this transition period, information about the second virtual camera, which moves from the position of the first virtual camera to the position of real camera 112, is generated based on the information about the first virtual camera and the information about the real camera during the transition period. Therefore, when switching from the image captured by the first virtual camera to the image captured by real camera 112, even if the positions of the first virtual camera and the real camera are far apart, virtual camera information that interpolates between them can be automatically generated during the transition period. As a result, it is possible to provide a natural image when switching from the image captured by the virtual camera to the image captured by the real camera. While the process of switching from the virtual camera image to the real camera image has been described, the same process can also be applied when switching from the real camera image to the virtual camera image. In this case, the position of the second virtual camera at the first time of the transition period will be the same as that of the real camera 112, and the position of the second virtual camera will gradually approach the position of the first virtual camera.
なお、図4A~4Cでは、移行期間における第2の仮想カメラの位置は、移行期間の開始時以外は第1の仮想カメラの位置に依存せずに、実カメラの位置に徐々に近づいていくようにしたが、これに限られるものではない。例えば、図5に示すような手法を用いて第2の仮想カメラ情報402が自動生成されてもよい。 Note that in Figures 4A to 4C, the position of the second virtual camera during the transition period is set to gradually approach the position of the real camera, independent of the position of the first virtual camera, except at the start of the transition period, but this is not limited to this. For example, the second virtual camera information 402 may be automatically generated using a method such as that shown in Figure 5.
図5は、第1実施形態における仮想視点映像の仮想カメラパス生成手法の他の例を示す。図4A~4Cと同様、図5は、第1の仮想カメラ、第2の仮想カメラ、実カメラ112の時刻t0からt10の間の時刻ごとの位置を示している。本例では、第2の仮想カメラ情報402を生成するために、第1の仮想カメラと実カメラ112の同時刻の情報を用いて第2の仮想カメラの情報を生成する手法を説明する。図4A~4Cで説明した方法と同様に、時刻t2では、第1の仮想カメラの位置と第2の仮想カメラの位置は同じである。 Figure 5 shows another example of a method for generating a virtual camera path for a virtual viewpoint video in the first embodiment. Similar to Figures 4A to 4C, Figure 5 shows the positions of the first virtual camera, the second virtual camera, and the real camera 112 at each time between times t0 and t10. In this example, a method is described for generating second virtual camera information 402 using information from the first virtual camera and the real camera 112 at the same time. Similar to the method described in Figures 4A to 4C, at time t2, the positions of the first virtual camera and the second virtual camera are the same.
第2の仮想カメラの時刻t3の位置は、第1の仮想カメラと実カメラ112の時刻t3における位置を結ぶ線分上を、(t3-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方向へ進んだ位置である。同様に、第2の仮想カメラの時刻t4の位置は、第1の仮想カメラと実カメラ112の時刻t4における位置を結ぶ線分上を、(t4-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方向へ進んだ位置である。同様に、第2の仮想カメラの時刻t5の位置は、第1の仮想カメラと実カメラ112の時刻t5における位置を結ぶ線分上を、(t5-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方向へ進んだ位置である。同様に、第1の仮想カメラの時刻t6の位置は、第1の仮想カメラと実カメラ112の時刻t6における位置を結ぶ線分上を、(t6-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方向へ進んだ位置である。同様に、第2の仮想カメラの時刻t7における位置は、第1の仮想カメラと実カメラ112の時刻t7における位置を結ぶ線分上を、(t7-t2)/(t7-t2)の割合だけ第1の仮想カメラから実カメラ112の方向へ進んだ位置である。図4C(4f)で説明したように、移行期間の終了時刻である時刻t7において、第2の仮想カメラの位置と実カメラ112の位置は同じになる。 The position of the second virtual camera at time t3 is a position on the line segment connecting the positions of the first virtual camera and real camera 112 at time t3, moved from the first virtual camera toward real camera 112 by a ratio of (t3 - t2) / (t7 - t2). Similarly, the position of the second virtual camera at time t4 is a position on the line segment connecting the positions of the first virtual camera and real camera 112 at time t4, moved from the first virtual camera toward real camera 112 by a ratio of (t4 - t2) / (t7 - t2). Similarly, the position of the second virtual camera at time t5 is a position on the line segment connecting the positions of the first virtual camera and real camera 112 at time t5, moved from the first virtual camera toward real camera 112 by a ratio of (t5 - t2) / (t7 - t2). Similarly, the position of the first virtual camera at time t6 is a position on the line segment connecting the positions of the first virtual camera and real camera 112 at time t6, moved from the first virtual camera toward real camera 112 by a ratio of (t6 - t2) / (t7 - t2). Similarly, the position of the second virtual camera at time t7 is a position on the line segment connecting the positions of the first virtual camera and real camera 112 at time t7, moved from the first virtual camera toward real camera 112 by a ratio of (t7 - t2) / (t7 - t2). As explained in Figure 4C (4f), at time t7, which is the end time of the transition period, the position of the second virtual camera and the position of real camera 112 are the same.
以上のように、図5に示される手法では、第1の仮想カメラによる仮想視点映像から実カメラ112による実カメラ映像に切り替わるときの仮想カメラ位置が、第1の仮想カメラと実カメラ112の同一時刻における位置を基に算出される。この手法によれば、仮想カメラ映像から実カメラ映像へ、または実カメラ映像から仮想カメラ映像への映像へ切り替える場合に、常に、第1の仮想カメラと実カメラ112の同一時刻の位置から第2の仮想カメラの位置が算出される。そのため、第2の仮想カメラが第1の仮想カメラの位置から実カメラ112の位置へ移動している途中で実カメラ位置から仮想カメラ位置1へ向かうよう方向転換を行っても違和感なく、違和感なく切り替えることが可能である。 As described above, with the method shown in FIG. 5, the virtual camera position when switching from the virtual viewpoint image captured by the first virtual camera to the real camera image captured by real camera 112 is calculated based on the positions of the first virtual camera and real camera 112 at the same time. With this method, when switching from virtual camera image to real camera image, or from real camera image to virtual camera image, the position of the second virtual camera is always calculated from the positions of the first virtual camera and real camera 112 at the same time. Therefore, even if the second virtual camera changes direction from the real camera position to virtual camera position 1 while moving from the position of the first virtual camera to the position of real camera 112, the switching can be performed without any sense of incongruity.
また、上記2つの仮想カメラ情報を自動生成する手法では、映像を切り替える開始時刻と終了時刻を指定したが、それに限るものではなく、切り替える開始時刻と切り替えに要する時間(移行期間の長さ)を指定してもよい。これにより、切り替えに要する時間をあらかじめ指定したり、同一の映像を生成する場合の切り替え時間を統一したりすることが容易になる。 Furthermore, in the above method for automatically generating the two pieces of virtual camera information, the start and end times for switching between images are specified, but this is not limited to this; the start time for switching and the time required for switching (length of transition period) may also be specified. This makes it easy to specify the time required for switching in advance and to standardize switching times when generating the same images.
また、上記2つの仮想カメラ情報を自動生成する手法では、映像を切り替える際の第2の仮想カメラの移動を、経過時間と移動期間の比率に基づいて決定したがこれに限るものではない。例えば、上述した経過時間と移動期間の比率に代えて、ユーザ操作により指定される比率(以下、遷移比率という)が移行期間における各時刻で用いられるようにしてもよい。例えば、映像決定部114に切り替え前の映像と、切り替え後の映像を指定し、遷移比率を指定することができるフェーダーを有する入力部を設け、入力部へのユーザ操作に応じて第2の仮想視点の位置を生成するようにしてもよい。 Furthermore, in the method for automatically generating the two pieces of virtual camera information described above, the movement of the second virtual camera when switching between images is determined based on the ratio between the elapsed time and the movement period, but this is not limited to this. For example, instead of the ratio between the elapsed time and the movement period described above, a ratio specified by user operation (hereinafter referred to as the transition ratio) may be used at each time during the transition period. For example, the image determination unit 114 may be provided with an input unit having a fader that can specify the image before switching and the image after switching and specify the transition ratio, and the position of the second virtual viewpoint may be generated in response to user operation on the input unit.
図6に遷移比率を指定できる入力部600の例を示す。入力部600によるユーザ操作は、映像決定部114に出力される。入力部600は、切替前ボタンスイッチ601と切替後ボタンスイッチ602を有し、それぞれのチャンネル1からチャンネル4までのボタンスイッチが備えられている。切替前ボタンスイッチ601と切替後ボタンスイッチ602の間をまたぐようにフェーダー603が設けられている。フェーダー603は、ユーザ操作に応じて移動し、その位置に従って映像を切り替える際の遷移比率を指示する。本実施形態では、第1の仮想カメラによる仮想視点映像がチャンネル1に、実カメラ112による実カメラ映像がチャンネル2に割り当てられている。 Figure 6 shows an example of an input unit 600 that can specify a transition ratio. User operations via the input unit 600 are output to the video determination unit 114. The input unit 600 has a pre-switching button switch 601 and a post-switching button switch 602, each equipped with button switches for channels 1 to 4. A fader 603 is provided across the pre-switching button switch 601 and the post-switching button switch 602. The fader 603 moves in response to user operations, and indicates the transition ratio when switching videos according to its position. In this embodiment, the virtual viewpoint video from the first virtual camera is assigned to channel 1, and the real camera video from the real camera 112 is assigned to channel 2.
図6(a)では、フェーダー603は最上段の位置にあり、この場合、切替前ボタンスイッチ601により指定されるチャンネルの映像が出力される。チャンネル1の切替前ボタンスイッチ601が点灯しており、チャンネル1の映像(第1の仮想視点映像301)が映像切替部115から出力される映像として選択されていることを示している。一方、切替後ボタンスイッチ602においてチャンネル2が選択されており、チャンネル2が点灯している。これは、切り替え後に出力される映像としてチャンネル2(実カメラ映像302)が選択されていることを示している。フェーダー603を最上段から下段方向に移動させると出力映像が第1の仮想カメラによる仮想視点映像から第2の仮想カメラによる仮想視点映像2に切り替わる。そして、第2の仮想カメラの位置は、フェーダー603の位置に応じた遷移比率に基づいて、図4A~図4Cまたは図5により上述した方法で生成される。なお、遷移比率は、例えば、フェーダー603の最上段の位置から最下段の位置までの距離と、フェーダー603の最上段の位置から現在の位置までの距離に基づいて設定され得る。 In Figure 6(a), the fader 603 is in the top position, and in this case, the video of the channel specified by the pre-switching button switch 601 is output. The pre-switching button switch 601 for channel 1 is lit, indicating that the video of channel 1 (first virtual viewpoint video 301) has been selected as the video to be output from the video switching unit 115. Meanwhile, channel 2 has been selected by the post-switching button switch 602, and channel 2 is lit. This indicates that channel 2 (real camera video 302) has been selected as the video to be output after switching. When the fader 603 is moved from the top to the bottom, the output video switches from the virtual viewpoint video captured by the first virtual camera to virtual viewpoint video 2 captured by the second virtual camera. The position of the second virtual camera is generated by the method described above with reference to Figures 4A to 4C or 5, based on a transition ratio corresponding to the position of the fader 603. The transition ratio can be set, for example, based on the distance from the top to bottom position of the fader 603 and the distance from the top to the current position of the fader 603.
図6(b)の例では、フェーダー603が、最上段から最下段までの間の2/5の位置にある。この場合、その時刻における第1の仮想カメラの位置と実カメラ112の位置を結ぶ線分上を、当該線分の2/5だけ第1の仮想カメラから実カメラ112の方へ進んだ位置が第2の仮想カメラの位置となる(図4Bの4cと同様)。なお、図6(a)の状態からフェーダー603の移動が開始された時刻が、上述した移行期間の開始時刻となり、図6(c)に示されるようにフェーダー603が最下段に到達した時刻が移行期間の終了時刻となる。すなわち、フェーダー603が最下段に到達すると、第2の仮想カメラの映像から実カメラ112の映像に切り替わり、映像の切り替えが完了する。 In the example of Figure 6(b), fader 603 is located 2/5 of the way from the top to the bottom. In this case, the position of the second virtual camera is 2/5 of the way along the line segment connecting the position of the first virtual camera and the position of real camera 112 at that time, moving from the first virtual camera toward real camera 112 (similar to 4c in Figure 4B). Note that the time when fader 603 starts moving from the state in Figure 6(a) is the start time of the transition period described above, and the time when fader 603 reaches the bottom, as shown in Figure 6(c), is the end time of the transition period. In other words, when fader 603 reaches the bottom, the image from the second virtual camera switches to the image from real camera 112, completing the image switch.
以上のように、フェーダー603の操作によって、映像の切替時に仮想カメラ情報自動生成部117が仮想カメラ情報を生成するのに用いる遷移比率を指定することが可能となる。そのため、切替時刻と仮想カメラが実カメラの状態に近づいていくスピードを容易に操作することができる。 As described above, by operating the fader 603, it is possible to specify the transition ratio used by the virtual camera information automatic generation unit 117 to generate virtual camera information when switching videos. This makes it easy to control the switching time and the speed at which the virtual camera approaches the state of the real camera.
以上、仮想視点映像から実カメラ映像への切り替えを説明したが、これに限るものではなく、実カメラ映像から仮想視点映像への切り替えにも上記処理を適用できる。すなわち、切り替え前の映像を得るための第1の視点と切り替え後の映像を得るための第2の視点の一方は、仮想視点映像を生成するための仮想的な撮像装置の視点であり、他方は、映像を撮影する物理的な撮像装置の視点であればよい。その場合、実カメラ映像から、第2の仮想カメラによる仮想視点映像に切り替わり、さらに第1の仮想カメラによる仮想視点映像に切り替わる。仮想視点映像は、仮想視点カメラ情報2から仮想視点カメラ情報1へ切り替わったように生成される。また、2つの仮想視点による2つの仮想視点映像間の切り替え、2つの実カメラによる2つの自カメラ映像間の切り替えにおいても、仮想カメラ情報自動生成部117により生成された第2の仮想カメラからの仮想視点映像を用いることができる。 The above describes switching from virtual viewpoint video to real camera video, but this is not limiting; the above processing can also be applied to switching from real camera video to virtual viewpoint video. That is, one of the first viewpoint for obtaining the video before switching and the second viewpoint for obtaining the video after switching can be the viewpoint of a virtual imaging device for generating the virtual viewpoint video, and the other can be the viewpoint of a physical imaging device that captures the video. In this case, switching occurs from the real camera video to a virtual viewpoint video from the second virtual camera, and then to a virtual viewpoint video from the first virtual camera. The virtual viewpoint video is generated as if switching had occurred from virtual viewpoint camera information 2 to virtual viewpoint camera information 1. Furthermore, when switching between two virtual viewpoint videos from two virtual viewpoints, or when switching between two own-camera videos from two real cameras, the virtual viewpoint video from the second virtual camera generated by the virtual camera information automatic generation unit 117 can be used.
以上のように、第1実施形態によれば、第1の視点により得られる第1の映像から第2の視点により得られる第2の映像への切り替えにおいて、第1の視点と第2の視点の間を補完するように新たな仮想カメラが生成される。そして、新たな仮想視点による仮想視点映像を、第1の映像と第2の映像の間に用いることで、第1の映像と切り替え後の第2の映像とがあたかも1つの視点(カメラ)により撮影されたかのような切り替えを実現できる。また、仮想視点映像と実カメラの映像と滑らかに切り替えることにより、実カメラでは撮影できないよりダイナミックな映像表現が可能となる。 As described above, according to the first embodiment, when switching from a first image obtained from a first viewpoint to a second image obtained from a second viewpoint, a new virtual camera is generated to complement the transition between the first and second viewpoints. Then, by using a virtual viewpoint image from the new virtual viewpoint between the first and second images, it is possible to achieve a transition between the first image and the second image obtained after the switch, as if they were captured from a single viewpoint (camera). Furthermore, smoothly switching between the virtual viewpoint image and the image from the real camera enables more dynamic visual expression that cannot be captured with a real camera.
<第2実施形態>
第1実施形態では、第1の仮想カメラの情報と実カメラの情報に基づいて仮想視点(第2の仮想カメラ)の情報を生成する処理を説明した。仮想視点の情報には、位置、姿勢(視線の方向)、焦点距離(ズーム値)などが含まれるが、第1実施形態の処理ではこれらを特に区別することなく、同等の処理により生成した。第2実施形態では、仮想視点の情報のうち、位置情報と姿勢情報を独立した処理により生成する。なお、第1実施形態と同等の構成には同一の参照番号を付し、その詳細な説明を省略する。
Second Embodiment
In the first embodiment, a process for generating information about a virtual viewpoint (second virtual camera) based on information about a first virtual camera and information about a real camera was described. Information about the virtual viewpoint includes position, orientation (direction of line of sight), focal length (zoom value), and the like, but in the process of the first embodiment, these are generated by the same process without any particular distinction. In the second embodiment, position information and orientation information of the virtual viewpoint are generated by independent processes. Note that the same reference numerals are used for components equivalent to those in the first embodiment, and detailed descriptions thereof will be omitted.
上述のように、第1実施形態では、第2の仮想カメラの位置情報は第1の仮想カメラの位置情報と実カメラ112の位置情報からそれらの間を移動するよう生成し、第2の仮想カメラの姿勢も同等の手法で生成することができるとした。しかしながら、第1実施形態の方法では、第2の仮想カメラの姿勢や焦点距離によっては、撮影したい被写体が第2の仮想カメラの撮影範囲に含まれなくなる可能性があるという課題がある。第2の実施形態では、そのような課題を解決するため、第2の仮想カメラの位置と、第2の仮想カメラの姿勢、焦点距離の情報を独立に制御する。 As described above, in the first embodiment, the position information of the second virtual camera is generated from the position information of the first virtual camera and the position information of the real camera 112 so as to move between them, and the attitude of the second virtual camera can be generated using a similar method. However, the method of the first embodiment has the problem that, depending on the attitude and focal length of the second virtual camera, the subject to be photographed may not be included in the shooting range of the second virtual camera. In the second embodiment, to solve this problem, the position of the second virtual camera and the attitude and focal length information of the second virtual camera are controlled independently.
図7は、第2実施形態による画像処理システムの構成例を示すブロック図である。第1実施形態(図1)の構成に、被写体識別部701が加わった構成となっている。被写体識別部701は、仮想カメラまたは実カメラ112で撮影している被写体を識別する。すなわち、被写体識別部701は、仮想カメラ情報生成部110、実カメラ情報取得部113、仮想カメラ情報自動生成部117からのカメラ情報と、3Dモデル記憶部109からの情報を基に、仮想カメラや実カメラ112の映像に移っている被写体を識別する。また、画像取得部104は、カメラ制御部102から取得した映像を映像切替部115にも提供する。これにより、映像切替部115は、仮想視点映像に用いるために使用されるカメラ群101の映像を映像出力としても用いることが可能となる。 Figure 7 is a block diagram showing an example configuration of an image processing system according to the second embodiment. This configuration adds an object identification unit 701 to the configuration of the first embodiment (Figure 1). The object identification unit 701 identifies the object captured by the virtual camera or real camera 112. That is, the object identification unit 701 identifies the object captured in the image captured by the virtual camera or real camera 112 based on camera information from the virtual camera information generation unit 110, real camera information acquisition unit 113, and automatic virtual camera information generation unit 117, as well as information from the 3D model storage unit 109. The image acquisition unit 104 also provides the image acquired from the camera control unit 102 to the image switching unit 115. This enables the image switching unit 115 to use the image captured by the camera group 101 used for the virtual viewpoint image as image output.
図8は、第2実施形態による出力映像決定処理を示すフローチャートである。第1実施形態(図2)の処理と同等の処理には同一のステップ番号を付してある。ステップS801で、仮想カメラ情報自動生成部117は、切替情報を参照し、第1の仮想視点映像301から実カメラ映像302への移行期間において、第2の仮想カメラの位置と姿勢の遷移比率が異なるか否かを判断する。遷移比率が異なっていないと判断された場合(ステップS801でNO)、処理はステップS211に進む。一方、遷移比率が異なると判断された場合(ステップS801でYES)、処理はステップS802に進む。 Figure 8 is a flowchart showing the output video determination process according to the second embodiment. Processes equivalent to those in the first embodiment (Figure 2) are assigned the same step numbers. In step S801, the automatic virtual camera information generation unit 117 references the switching information and determines whether the transition ratio of the position and orientation of the second virtual camera is different during the transition period from the first virtual viewpoint video 301 to the real camera video 302. If it is determined that the transition ratio is not different (NO in step S801), the process proceeds to step S211. On the other hand, if it is determined that the transition ratio is different (YES in step S801), the process proceeds to step S802.
ステップS802において、仮想カメラ情報自動生成部117は、第1の仮想カメラの情報、実カメラ112の情報、切替条件に基づいて、仮想カメラ映像から実カメラ映像へ切り替える際の第2の仮想カメラの位置、姿勢、画角の情報を生成する。仮想カメラ情報自動生成部117は、切替条件に含まれる第1の仮想カメラの位置から実カメラ112の位置へ切り替えるための位置の移行期間と、第1の仮想カメラの姿勢から実カメラ112の姿勢に切り替えるための姿勢の移行期間を取得する。切替条件においては、例えば、位置の移行期間および姿勢の移行期間は互いに独立して設定されており、それぞれ開始時刻と終了時刻により示される。仮想カメラ情報自動生成部117は、それぞれの時刻における第2の仮想カメラの位置と姿勢を計算する。なお、第1実施形態と同様に、切替比率を指定するためのフェーダー603を備えた入力部600が用いられてもよい。その場合、独立に制御したい条件ごとに個別にフェーダー603が設けられる。 In step S802, the automatic virtual camera information generation unit 117 generates information about the position, attitude, and angle of view of the second virtual camera when switching from virtual camera footage to real camera footage, based on information about the first virtual camera, information about the real camera 112, and the switching conditions. The automatic virtual camera information generation unit 117 acquires the position transition period for switching from the position of the first virtual camera to the position of the real camera 112, and the attitude transition period for switching from the attitude of the first virtual camera to the attitude of the real camera 112, which are included in the switching conditions. In the switching conditions, for example, the position transition period and the attitude transition period are set independently of each other and are indicated by start and end times, respectively. The automatic virtual camera information generation unit 117 calculates the position and attitude of the second virtual camera at each time. Note that, as in the first embodiment, an input unit 600 equipped with a fader 603 for specifying the switching ratio may be used. In this case, a separate fader 603 is provided for each condition that needs to be controlled independently.
また、第2の仮想カメラの姿勢が、切り替え後の出力映像に含まれる被写体を優先的に映し出すように、位置の遷移比率とは異なる遷移比率で計算されてもよい。図9A~9Bは、ステップS802において、切り替え後の出力映像に含まれる被写体を優先的に映し出すように仮想カメラの情報を生成する処理の例を示す。各時刻における第1の仮想カメラ、第2の仮想カメラ、実カメラ112のそれぞれの位置と姿勢は、図4Aで示したとおりである。なお、第1の仮想カメラでは、主に撮影されている被写体として被写体901がその撮影範囲に存在しており、実カメラ112では、主に撮影されている被写体として被写体902がその撮影範囲に存在している。位置の移行期間(時刻t2からt7)において、第2の仮想カメラの位置は第1実施形態と同様に第1の仮想カメラの位置から実カメラ112の位置へ遷移する。一方、第2の仮想カメラの姿勢および焦点距離(ズーム値)は、姿勢の移行期間である時刻t2から時刻t4の間に実カメラ112と同等画角となるように急峻に変更される。その後、時刻t4から時刻t7の間は実カメラ112と同等画角となるよう第2の仮想カメラの姿勢と焦点距離を設定する。なお、同等画角とは、それぞれの視点から得られる映像において同一の被写体がほぼ同じ位置に映るように設定された姿勢と画角を言う。或いは、それぞれの視点から得られる映像において、同一の被写体がほぼ同じ大きさで映るように設定された姿勢と画角を言う。或いは、それぞれの視点から得られる映像において、同一の被写体の映る位置と大きさがほぼ同じになるように設定された姿勢と画角を言う。 The orientation of the second virtual camera may be calculated using a transition ratio different from the position transition ratio so as to prioritize displaying the subject included in the output image after switching. Figures 9A and 9B show an example of the process of generating virtual camera information in step S802 so as to prioritize displaying the subject included in the output image after switching. The positions and orientations of the first virtual camera, second virtual camera, and real camera 112 at each time are as shown in Figure 4A. Note that, in the first virtual camera, subject 901 is present within its shooting range as the subject primarily being photographed, and in the real camera 112, subject 902 is present within its shooting range as the subject primarily being photographed. During the position transition period (times t2 to t7), the position of the second virtual camera transitions from the position of the first virtual camera to the position of real camera 112, as in the first embodiment. Meanwhile, the attitude and focal length (zoom value) of the second virtual camera are abruptly changed during the attitude transition period from time t2 to time t4 so that the angle of view is equivalent to that of real camera 112. Thereafter, the attitude and focal length of the second virtual camera are set so that the angle of view is equivalent to that of real camera 112 from time t4 to time t7. Note that equivalent angle of view refers to an attitude and angle of view set so that the same subject appears in approximately the same position in the images obtained from each viewpoint. Alternatively, it refers to an attitude and angle of view set so that the same subject appears at approximately the same size in the images obtained from each viewpoint. Alternatively, it refers to an attitude and angle of view set so that the same subject appears in approximately the same position and size in the images obtained from each viewpoint.
被写体識別部701によって仮想カメラ情報生成部110からの第1の仮想カメラの位置、姿勢、焦点距離の情報と、3Dモデル記憶部109からの前景の位置に基づいて、第1の仮想カメラで取得される仮想視点映像のどの位置に前景が存在するかが確認できる。同様に、実カメラ112の位置、姿勢、焦点距離の情報と3Dモデル記憶部109からの前景の位置から、実カメラ112が撮影する実カメラ映像のどの位置に前景が存在するかが確認できる。本実施形態の仮想カメラ情報自動生成部117は、第2の仮想カメラによる仮想視点映像を出力している移行期間において、切替後の映像、すなわち実カメラ112の映像と同等画角となるような映像を第2の仮想カメラから撮影するかのごとく第2の仮想カメラの姿勢を計算する。 The subject identification unit 701 can determine the position of the foreground in the virtual viewpoint image captured by the first virtual camera based on the information on the position, orientation, and focal length of the first virtual camera from the virtual camera information generation unit 110 and the position of the foreground from the 3D model storage unit 109. Similarly, the position of the foreground in the real camera image captured by the real camera 112 can be determined based on the information on the position, orientation, and focal length of the real camera 112 and the position of the foreground from the 3D model storage unit 109. During the transition period in which the virtual viewpoint image from the second virtual camera is being output, the automatic virtual camera information generation unit 117 of this embodiment calculates the orientation of the second virtual camera as if the second virtual camera were capturing the post-switching image, i.e., the image with the same angle of view as the image from the real camera 112.
図9Aにおいて、9aは、第1の仮想カメラの時刻t2における位置911と姿勢912、実カメラ112の時刻t2における位置931と姿勢932を示す。時刻t2の時点では、第2の仮想カメラの位置および姿勢は、第1の仮想カメラの位置931および姿勢932と同じである。図9Aの9bは、時刻t3における第1の仮想カメラの位置913と姿勢914、実カメラ112の位置933と姿勢934、第2の仮想カメラの位置951と姿勢954を示す。時刻t3における第2の仮想カメラの姿勢954は、第1の仮想カメラの時刻t2の姿勢912(姿勢952)と、第2の仮想カメラが時刻t3の実カメラ112と同等画角を得ることができる姿勢953とに基づいて決定される。すなわち、第2の仮想カメラの時刻t3の姿勢954は、姿勢952と姿勢954の間で、(t3-t2)/(t4-t2)の割合だけ姿勢952から姿勢953へ傾いた姿勢である。 In Figure 9A, 9a shows the position 911 and orientation 912 of the first virtual camera at time t2, and the position 931 and orientation 932 of the real camera 112 at time t2. At time t2, the position and orientation of the second virtual camera are the same as the position 931 and orientation 932 of the first virtual camera. 9b in Figure 9A shows the position 913 and orientation 914 of the first virtual camera, the position 933 and orientation 934 of the real camera 112, and the position 951 and orientation 954 of the second virtual camera at time t3. The orientation 954 of the second virtual camera at time t3 is determined based on the orientation 912 (orientation 952) of the first virtual camera at time t2 and the orientation 953 that enables the second virtual camera to obtain an angle of view equivalent to that of the real camera 112 at time t3. In other words, the orientation 954 of the second virtual camera at time t3 is an orientation that is tilted from orientation 952 to orientation 953 by a ratio of (t3 - t2) / (t4 - t2) between orientation 952 and orientation 954.
図9Bにおいて、9cは時刻t4における第1の仮想カメラの位置915と姿勢916、実カメラ112の位置935と姿勢936、第2の仮想カメラの位置955と姿勢956を示す。時刻t3の場合と同様に、時刻t4における第2の仮想カメラの姿勢956は、第1の仮想カメラの時刻t2の姿勢912と、第2の仮想カメラが時刻t4の実カメラ112と同等画角を得ることができる姿勢とに基づいて決定される。しかし、時刻t4では、(t4-t2)/(t4-t2)=1となるため、実カメラ112と同等画角を得ることができる姿勢956が、第2の仮想カメラの時刻t4における姿勢に決定される。 In Figure 9B, 9c shows the position 915 and orientation 916 of the first virtual camera, the position 935 and orientation 936 of the real camera 112, and the position 955 and orientation 956 of the second virtual camera at time t4. As with time t3, the orientation 956 of the second virtual camera at time t4 is determined based on the orientation 912 of the first virtual camera at time t2 and the orientation that allows the second virtual camera to obtain an angle of view equivalent to that of the real camera 112 at time t4. However, at time t4, (t4 - t2) / (t4 - t2) = 1, and therefore the orientation 956 that allows the second virtual camera to obtain an angle of view equivalent to that of the real camera 112 is determined as the orientation of the second virtual camera at time t4.
図9Bの9dは、時刻t5における第1の仮想カメラの位置917と姿勢918、実カメラ112の位置937と姿勢938、第2の仮想カメラの位置957と姿勢958を示す。第2の仮想カメラの時刻t5の姿勢958は、時刻t5における実カメラ112と同等画角が得られるように決定されている。同様に、図9Cの9eは、時刻t6における第1の仮想カメラの位置919と姿勢920、実カメラ112の位置939と姿勢940、第2の仮想カメラの位置959と姿勢960を示す。第2の仮想カメラの時刻t6の姿勢960は、時刻t6における実カメラ112と同等画角が得られるように決定されている。図9Cの9fは時刻t7における第1の仮想カメラの位置921と姿勢922、実カメラ112の位置941と姿勢942を示す。時刻t7では、第2の仮想カメラの位置および姿勢は、実カメラ112の位置941および姿勢942と同じである。 9d in Figure 9B shows the position 917 and orientation 918 of the first virtual camera, the position 937 and orientation 938 of the real camera 112, and the position 957 and orientation 958 of the second virtual camera at time t5. The orientation 958 of the second virtual camera at time t5 is determined so as to obtain the same angle of view as the real camera 112 at time t5. Similarly, 9e in Figure 9C shows the position 919 and orientation 920 of the first virtual camera, the position 939 and orientation 940 of the real camera 112, and the position 959 and orientation 960 of the second virtual camera at time t6. The orientation 960 of the second virtual camera at time t6 is determined so as to obtain the same angle of view as the real camera 112 at time t6. 9f in Figure 9C shows the position 921 and orientation 922 of the first virtual camera and the position 941 and orientation 942 of the real camera 112 at time t7. At time t7, the position and orientation of the second virtual camera are the same as the position 941 and orientation 942 of the real camera 112.
<他の実施形態>
なお、上記各実施形態では、実カメラ112は仮想視点映像を生成するカメラ群101とは異なる、仮想視点映像の撮影範囲周辺に持ち込んだカメラとして説明したが、これに限られるものではない。例えば、第2実施形態のようにカメラ群101の一部またはすべてのカメラの映像が映像切替部115へ送られ、出力映像として選択可能であれば、実カメラ112はカメラ群101のうちのいずれか1つであってもよい。これにより、仮想視点映像から、仮想視点映像を生成するためのカメラ群101のうちの1つの実カメラによる実カメラ映像へ切り替える場合であっても、それら映像の切り替えの移行期間のための新たな仮想視点映像を容易に生成することが可能となる。
<Other Embodiments>
In the above embodiments, the real camera 112 has been described as a camera that is different from the group of cameras 101 that generate the virtual viewpoint video and is brought in around the shooting range of the virtual viewpoint video, but this is not limited to this. For example, as in the second embodiment, if the images from some or all of the cameras in the group of cameras 101 are sent to the image switching unit 115 and can be selected as output images, the real camera 112 may be any one of the group of cameras 101. This makes it possible to easily generate a new virtual viewpoint video for the transition period between the images, even when switching from the virtual viewpoint video to real camera image from one of the real cameras in the group of cameras 101 that generate the virtual viewpoint video.
また、移行期間における仮想視点の生成は、移行期間における実カメラ112の撮影フレームごと(あるいは第1の仮想視点による仮想視点映像のフレームごと)に行われてもよいし、所定の時間間隔(例えば、0.5秒ごとなど)で行われてもよい。 Furthermore, the virtual viewpoint during the transition period may be generated for each frame captured by the real camera 112 during the transition period (or for each frame of the virtual viewpoint image captured by the first virtual viewpoint), or at a predetermined time interval (e.g., every 0.5 seconds).
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。 The present invention can also be realized by supplying a program that realizes one or more of the functions of the above-described embodiments to a system or device via a network or storage medium, and having one or more processors in the computer of that system or device read and execute the program. It can also be realized by a circuit (e.g., an ASIC) that realizes one or more functions.
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。 The invention is not limited to the above-described embodiments, and various modifications and variations are possible without departing from the spirit and scope of the invention. Therefore, the following claims are appended to clarify the scope of the invention.
101:カメラ群、102:カメラ制御部、103:画像処理装置、104:画像取得部、105:背景画像記憶部、106:分離部、107:前景画像記憶部、108:3Dモデル生成部、109:3Dモデル記憶部、110:仮想カメラ情報生成部、111:仮想視点映像生成部、112:実カメラ、113:実カメラ情報取得部、114:映像決定部、115:映像切替部、116:映像出力部、117:仮想カメラ情報自動生成部 101: Camera group, 102: Camera control unit, 103: Image processing device, 104: Image acquisition unit, 105: Background image storage unit, 106: Separation unit, 107: Foreground image storage unit, 108: 3D model generation unit, 109: 3D model storage unit, 110: Virtual camera information generation unit, 111: Virtual viewpoint image generation unit, 112: Real camera, 113: Real camera information acquisition unit, 114: Image determination unit, 115: Image switching unit, 116: Image output unit, 117: Automatic virtual camera information generation unit
Claims (15)
出力される映像を前記第1の映像から前記第2の映像に切り替える際に、前記第1の映像の出力の終了から前記第2の映像の出力の開始までの期間を設定する設定手段と、
前記期間における前記第1の視点の情報と前記期間における前記第2の視点の情報とに基づいて、前記期間における仮想視点の情報を生成する第1生成手段と、
前記期間における仮想視点の情報に基づいて前記期間の仮想視点映像を生成する第2生成手段と、
前記第1の映像、前記期間の仮想視点映像、前記第2の映像の順に切り替えて出力する出力手段と、
を有し、
前記第1生成手段は、前記第1の視点の情報、前記第2の視点の情報、前記期間の開始からの経過時間と前記期間の全体の時間との比率に基づいて前記期間の仮想視点を生成する
ことを特徴とする画像処理装置。 an acquisition means for acquiring information relating to a first image and a second image, at least one of which is an image captured by an imaging device, the acquisition means acquiring information about a first viewpoint for acquiring the first image and information about a second viewpoint for acquiring the second image at a time corresponding to the time of the first image;
a setting means for setting a period from the end of output of the first video to the start of output of the second video when switching the video to be output from the first video to the second video;
a first generating means for generating virtual viewpoint information for the period based on the first viewpoint information for the period and the second viewpoint information for the period;
a second generating means for generating a virtual viewpoint video for the period based on information about a virtual viewpoint for the period;
an output means for switching between and outputting the first video, the virtual viewpoint video for the period, and the second video in that order;
and
The first generating means generates a virtual viewpoint for the period based on information about the first viewpoint, information about the second viewpoint, and a ratio between an elapsed time from the start of the period and an entire time of the period.
1. An image processing device comprising:
ことを特徴とする請求項1に記載の画像処理装置。 2. The image processing device according to claim 1, wherein the first generating means generates virtual viewpoint information for the period based only on information about the first viewpoint at the start time of the period.
出力される映像を前記第1の映像から前記第2の映像に切り替える際に、前記第1の映像の出力の終了から前記第2の映像の出力の開始までの期間を設定する設定手段と、
前記期間における前記第1の視点の情報と前記期間における前記第2の視点の情報とに基づいて、前記期間における仮想視点の情報を生成する第1生成手段と、
前記期間における仮想視点の情報に基づいて前記期間の仮想視点映像を生成する第2生成手段と、
前記第1の映像、前記期間の仮想視点映像、前記第2の映像の順に切り替えて出力する出力手段と、
前記期間に受け付けたユーザ操作に応じて比率を設定する設定手段と、
を有し、
前記第1生成手段は、前記第1の視点の情報、前記第2の視点の情報、前記設定手段により設定された比率に基づいて前記期間の仮想視点を生成する
ことを特徴とする画像処理装置。 an acquisition means for acquiring information relating to a first image and a second image, at least one of which is an image captured by an imaging device, the acquisition means acquiring information about a first viewpoint for acquiring the first image and information about a second viewpoint for acquiring the second image at a time corresponding to the time of the first image;
a setting means for setting a period from the end of output of the first video to the start of output of the second video when switching the video to be output from the first video to the second video;
a first generating means for generating virtual viewpoint information for the period based on the first viewpoint information for the period and the second viewpoint information for the period;
a second generating means for generating a virtual viewpoint video for the period based on information about a virtual viewpoint for the period;
an output means for switching between and outputting the first video, the virtual viewpoint video for the period, and the second video in that order;
a setting means for setting a ratio in accordance with a user operation received during the period ;
and
The image processing device according to claim 1, wherein the first generating means generates a virtual viewpoint for the period based on the information of the first viewpoint, the information of the second viewpoint, and the ratio set by the setting means.
ことを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。 4. The image processing device according to claim 1, wherein the first generating means generates a virtual viewpoint for the period by taking a weighted average of the information of the first viewpoint and the information of the second viewpoint based on the ratio.
ことを特徴とする請求項1乃至4のいずれか1項に記載の画像処理装置。 5. The image processing device according to claim 1, wherein the first generation means generates a virtual viewpoint at each time during the period based on information about the first viewpoint at the start time of the period and information about the second viewpoint at each time.
出力される映像を前記第1の映像から前記第2の映像に切り替える際に、前記第1の映像の出力の終了から前記第2の映像の出力の開始までの期間を設定する設定手段と、
前記期間における前記第1の視点の情報と前記期間における前記第2の視点の情報とに基づいて、前記期間における仮想視点の情報を生成する第1生成手段と、
前記期間における仮想視点の情報に基づいて前記期間の仮想視点映像を生成する第2生成手段と、
前記第1の映像、前記期間の仮想視点映像、前記第2の映像の順に切り替えて出力する出力手段と、
を有し、
前記第1生成手段は、前記期間における各時刻の仮想視点を、前記各時刻における前記第1の視点の情報と、前記各時刻における前記第2の視点の情報とに基づいて生成する
ことを特徴とする画像処理装置。 an acquisition means for acquiring information relating to a first image and a second image, at least one of which is an image captured by an imaging device, the acquisition means acquiring information about a first viewpoint for acquiring the first image and information about a second viewpoint for acquiring the second image at a time corresponding to the time of the first image;
a setting means for setting a period from the end of output of the first video to the start of output of the second video when switching the video to be output from the first video to the second video;
a first generating means for generating virtual viewpoint information for the period based on the first viewpoint information for the period and the second viewpoint information for the period;
a second generating means for generating a virtual viewpoint video for the period based on information about a virtual viewpoint for the period;
an output means for switching between and outputting the first video, the virtual viewpoint video for the period, and the second video in that order;
and
The image processing device is characterized in that the first generation means generates a virtual viewpoint at each time during the period based on information about the first viewpoint at each time and information about the second viewpoint at each time.
前記第1生成手段は、前記識別手段により識別された被写体の位置に基づいて前記期間の仮想視点の情報に含まれる視線の方向の情報を生成する
ことを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。 further comprising an identification means for identifying a subject from the image captured from the second viewpoint,
7. The image processing device according to claim 1, wherein the first generating means generates information about the direction of the line of sight included in the information about the virtual viewpoint for the period based on the position of the subject identified by the identifying means.
ことを特徴とする請求項7に記載の画像処理装置。 The image processing device described in claim 7, characterized in that the first generation means generates gaze direction information included in the virtual viewpoint information for the period based on the gaze direction of the virtual viewpoint to obtain an image of a shooting range in which the position of the subject shown in the virtual viewpoint image is the same as the position of the subject shown in the image obtained from the second viewpoint of the subject, and the gaze direction of the first viewpoint at the start of the period.
ことを特徴とする請求項7または8に記載の画像処理装置。 The image processing device described in claim 7 or 8, characterized in that the first generation means generates information about the focal length of the virtual viewpoint for the period based on the focal length of the line of sight of the virtual viewpoint for obtaining an image of a shooting range in which the size of the subject shown in the virtual viewpoint image is the same as the size of the subject shown in the image obtained from the second viewpoint of the subject, and the focal length of the line of sight of the first viewpoint at the start of the period .
ことを特徴とする請求項1乃至9のいずれか1項に記載の画像処理装置。 10. The image processing device according to claim 1, wherein one of the first image and the second image is a virtual viewpoint image generated based on a plurality of images captured by a plurality of imaging devices and a virtual viewpoint.
前記仮想視点映像は、前記複数の画像に基づいて生成される
ことを特徴とする請求項10に記載の画像処理装置。 the second generating means further includes a connection means for connecting to a plurality of imaging devices for obtaining a plurality of images for generating a virtual viewpoint video;
The image processing device according to claim 10 , wherein the virtual viewpoint video is generated based on the plurality of images.
出力される映像を前記第1の映像から前記第2の映像に切り替える際に、前記第1の映像の出力の終了から前記第2の映像の出力の開始までの期間を設定する設定工程と、
前記期間における前記第1の視点の情報と前記期間における前記第2の視点の情報とに基づいて、前記期間における仮想視点の情報を生成する第1生成工程と、
前記期間における仮想視点の情報に基づいて前記期間の仮想視点映像を生成する第2生成工程と、
前記第1の映像、前記期間の仮想視点映像、前記第2の映像の順に切り替えて出力する出力工程と、
を有し、
前記第1生成工程では、前記第1の視点の情報、前記第2の視点の情報、前記期間の開始からの経過時間と前記期間の全体の時間との比率に基づいて前記期間の仮想視点を生成する
ことを特徴とする画像処理装置の制御方法。 an acquisition step of acquiring information relating to a first image and a second image, at least one of which is an image captured by an imaging device, the acquisition step acquiring information about a first viewpoint for capturing the first image and information about a second viewpoint for capturing the second image at a time corresponding to the time of the first image;
a setting step of setting a period from the end of output of the first video to the start of output of the second video when switching the video to be output from the first video to the second video;
a first generation step of generating virtual viewpoint information for the period based on the first viewpoint information for the period and the second viewpoint information for the period;
a second generation step of generating a virtual viewpoint video for the period based on information about a virtual viewpoint for the period;
an output step of switching and outputting the first video, the virtual viewpoint video for the period, and the second video in that order;
and
In the first generation step, a virtual viewpoint for the period is generated based on information about the first viewpoint, information about the second viewpoint, and a ratio between the elapsed time from the start of the period and the total time of the period.
2. A method for controlling an image processing apparatus comprising:
出力される映像を前記第1の映像から前記第2の映像に切り替える際に、前記第1の映像の出力の終了から前記第2の映像の出力の開始までの期間を設定する設定工程と、a setting step of setting a period from the end of output of the first video to the start of output of the second video when switching the video to be output from the first video to the second video;
前記期間における前記第1の視点の情報と前記期間における前記第2の視点の情報とに基づいて、前記期間における仮想視点の情報を生成する第1生成工程と、a first generation step of generating virtual viewpoint information for the period based on the first viewpoint information for the period and the second viewpoint information for the period;
前記期間における仮想視点の情報に基づいて前記期間の仮想視点映像を生成する第2生成工程と、a second generation step of generating a virtual viewpoint video for the period based on information about a virtual viewpoint for the period;
前記第1の映像、前記期間の仮想視点映像、前記第2の映像の順に切り替えて出力する出力工程と、an output step of switching and outputting the first video, the virtual viewpoint video for the period, and the second video in that order;
前記期間に受け付けたユーザ操作に応じて比率を設定する設定工程と、a setting step of setting a ratio in accordance with a user operation received during the period;
を有し、and
前記第1生成工程では、前記第1の視点の情報、前記第2の視点の情報、前記設定工程により設定された比率に基づいて前記期間の仮想視点を生成するIn the first generating step, a virtual viewpoint for the period is generated based on the information on the first viewpoint, the information on the second viewpoint, and the ratio set in the setting step.
ことを特徴とする画像処理装置の制御方法。2. A method for controlling an image processing apparatus comprising:
出力される映像を前記第1の映像から前記第2の映像に切り替える際に、前記第1の映像の出力の終了から前記第2の映像の出力の開始までの期間を設定する設定工程と、a setting step of setting a period from the end of output of the first video to the start of output of the second video when switching the video to be output from the first video to the second video;
前記期間における前記第1の視点の情報と前記期間における前記第2の視点の情報とに基づいて、前記期間における仮想視点の情報を生成する第1生成工程と、a first generation step of generating virtual viewpoint information for the period based on the first viewpoint information for the period and the second viewpoint information for the period;
前記期間における仮想視点の情報に基づいて前記期間の仮想視点映像を生成する第2生成工程と、a second generation step of generating a virtual viewpoint video for the period based on information about a virtual viewpoint for the period;
前記第1の映像、前記期間の仮想視点映像、前記第2の映像の順に切り替えて出力する出力工程と、an output step of switching and outputting the first video, the virtual viewpoint video for the period, and the second video in that order;
を有し、and
前記第1生成工程では、前記期間における各時刻の仮想視点を、前記各時刻における前記第1の視点の情報と、前記各時刻における前記第2の視点の情報とに基づいて生成するIn the first generation step, a virtual viewpoint at each time in the period is generated based on information about the first viewpoint at each time and information about the second viewpoint at each time.
ことを特徴とする画像処理装置の制御方法。2. A method for controlling an image processing apparatus comprising:
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021089463A JP7716232B2 (en) | 2021-05-27 | 2021-05-27 | Image processing device, control method thereof, and program |
| US17/750,456 US20220385876A1 (en) | 2021-05-27 | 2022-05-23 | Image processing apparatus, control method thereof, and storage medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021089463A JP7716232B2 (en) | 2021-05-27 | 2021-05-27 | Image processing device, control method thereof, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022182119A JP2022182119A (en) | 2022-12-08 |
| JP7716232B2 true JP7716232B2 (en) | 2025-07-31 |
Family
ID=84194514
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021089463A Active JP7716232B2 (en) | 2021-05-27 | 2021-05-27 | Image processing device, control method thereof, and program |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US20220385876A1 (en) |
| JP (1) | JP7716232B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11995854B2 (en) * | 2018-12-19 | 2024-05-28 | Nvidia Corporation | Mesh reconstruction using data-driven priors |
| EP4443273A1 (en) * | 2023-03-31 | 2024-10-09 | Canon Kabushiki Kaisha | Display control apparatus, display control method, and program |
| CN116260956B (en) * | 2023-05-15 | 2023-07-18 | 四川中绳矩阵技术发展有限公司 | Virtual reality shooting method and system |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012015788A (en) | 2010-06-30 | 2012-01-19 | Canon Inc | Video receiver and control method thereof |
| JP2020042665A (en) | 2018-09-12 | 2020-03-19 | キヤノン株式会社 | Information processing apparatus, control method thereof, and program |
| JP2020150417A (en) | 2019-03-13 | 2020-09-17 | ソニー株式会社 | Information processing equipment, methods, and recording media |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6522325B1 (en) * | 1998-04-02 | 2003-02-18 | Kewazinga Corp. | Navigable telepresence method and system utilizing an array of cameras |
| GB2515926B (en) * | 2010-07-19 | 2015-02-11 | Ipsotek Ltd | Apparatus, system and method |
| EP4567734A3 (en) * | 2016-04-12 | 2025-07-30 | Quidient, LLC | Quotidian scene reconstruction engine |
| JP6849430B2 (en) * | 2016-12-27 | 2021-03-24 | キヤノン株式会社 | Image processing equipment, image processing methods, and programs |
| WO2018147329A1 (en) * | 2017-02-10 | 2018-08-16 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Free-viewpoint image generation method and free-viewpoint image generation system |
| JP6922369B2 (en) * | 2017-04-14 | 2021-08-18 | 富士通株式会社 | Viewpoint selection support program, viewpoint selection support method and viewpoint selection support device |
| JP6924079B2 (en) * | 2017-06-12 | 2021-08-25 | キヤノン株式会社 | Information processing equipment and methods and programs |
| JP2019003320A (en) * | 2017-06-13 | 2019-01-10 | キヤノン株式会社 | Image generating apparatus, image generating method, and program |
| KR102351542B1 (en) * | 2017-06-23 | 2022-01-17 | 삼성전자주식회사 | Application Processor including function of compensation of disparity, and digital photographing apparatus using the same |
| JP7080613B2 (en) * | 2017-09-27 | 2022-06-06 | キヤノン株式会社 | Image processing equipment, image processing methods and programs |
| JP2020010300A (en) * | 2018-07-12 | 2020-01-16 | キヤノン株式会社 | Video generation apparatus, control method of video generation apparatus, and program |
| JP7301507B2 (en) * | 2018-08-08 | 2023-07-03 | キヤノン株式会社 | Information processing device, information processing method, and program |
| JP7330683B2 (en) * | 2018-11-06 | 2023-08-22 | キヤノン株式会社 | Information processing device, information processing method and program |
| MX2021014250A (en) * | 2019-05-20 | 2022-03-11 | Massachusetts Inst Technology | Forensic video exploitation and analysis tools. |
-
2021
- 2021-05-27 JP JP2021089463A patent/JP7716232B2/en active Active
-
2022
- 2022-05-23 US US17/750,456 patent/US20220385876A1/en not_active Abandoned
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012015788A (en) | 2010-06-30 | 2012-01-19 | Canon Inc | Video receiver and control method thereof |
| JP2020042665A (en) | 2018-09-12 | 2020-03-19 | キヤノン株式会社 | Information processing apparatus, control method thereof, and program |
| JP2020150417A (en) | 2019-03-13 | 2020-09-17 | ソニー株式会社 | Information processing equipment, methods, and recording media |
Also Published As
| Publication number | Publication date |
|---|---|
| US20220385876A1 (en) | 2022-12-01 |
| JP2022182119A (en) | 2022-12-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109565580B (en) | Information processing apparatus, image generation method, control method, and program | |
| JP7716232B2 (en) | Image processing device, control method thereof, and program | |
| JP7179515B2 (en) | Apparatus, control method and program | |
| US11317073B2 (en) | Information processing apparatus, method of controlling information processing apparatus, and storage medium | |
| KR101961015B1 (en) | Smart augmented reality service system and method based on virtual studio | |
| CN113938579A (en) | Information processing apparatus, control method thereof, and computer-readable storage medium | |
| JP7725652B2 (en) | Information processing device, information processing system, and program | |
| US20180089842A1 (en) | Image processing apparatus, image processing method, and storage medium | |
| US20200402281A1 (en) | Image processing apparatus, image processing method, and storage medium | |
| US20140176669A1 (en) | Image processing apparatus that combines a plurality of images | |
| JP2020140285A (en) | Information processing device, control method of information processing device, and program | |
| JP2020102687A (en) | Information processing apparatus, image processing apparatus, image processing method, and program | |
| WO2020012748A1 (en) | Information processing device, information processing method, and program | |
| WO2023189079A1 (en) | Image processing device, image processing method, and program | |
| JP2024124469A (en) | Image processing device, image processing method, and computer program | |
| JP7775140B2 (en) | Image processing device, image processing method and program | |
| US12095964B2 (en) | Information processing apparatus, information processing method, and storage medium | |
| JP7844196B2 (en) | Information processing device, control method for information processing device, program, recording medium, and system | |
| KR101645427B1 (en) | Operation method of camera apparatus through user interface | |
| US12526392B2 (en) | Information processing apparatus and method, and storage medium for generating arbitrary viewpoint images | |
| JP2006115298A (en) | Multi-view camera video expression system, apparatus and program | |
| JP7767355B2 (en) | Information processing device control method and program | |
| JP2021179800A (en) | Information processing apparatus, information processing method, and program | |
| JP2023001850A (en) | Information processing device, information processing method, and program | |
| JP2022032491A (en) | Video processing apparatus, video processing method, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240521 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250306 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250310 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250423 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250620 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250718 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7716232 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |