JP7056576B2 - Transmitter, transmit method, receiver and receive method - Google Patents
Transmitter, transmit method, receiver and receive method Download PDFInfo
- Publication number
- JP7056576B2 JP7056576B2 JP2018551582A JP2018551582A JP7056576B2 JP 7056576 B2 JP7056576 B2 JP 7056576B2 JP 2018551582 A JP2018551582 A JP 2018551582A JP 2018551582 A JP2018551582 A JP 2018551582A JP 7056576 B2 JP7056576 B2 JP 7056576B2
- Authority
- JP
- Japan
- Prior art keywords
- image data
- information
- composite
- view
- views
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/597—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/21805—Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
- H04N21/2365—Multiplexing of several video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/434—Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
- H04N21/4347—Demultiplexing of several video streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8146—Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
- H04N21/8153—Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics comprising still images, e.g. texture, background image
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/845—Structuring of content, e.g. decomposing content into time segments
- H04N21/8451—Structuring of content, e.g. decomposing content into time segments using Advanced Video Coding [AVC]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Graphics (AREA)
- Databases & Information Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Image Processing (AREA)
Description
本技術は、送信装置、送信方法、受信装置および受信方法に関し、詳しくは、合成可能な複数のビューの符号化画像データからなる符号化ストリームを送信する送信装置等に関する。 The present art relates to a transmitting device, a transmitting method, a receiving device, and a receiving method, and more particularly to a transmitting device for transmitting a coded stream composed of coded image data of a plurality of views that can be synthesized.
例えば、特許文献1には、複数の画像を繋ぎ合わせて合成し、広い視野を再現するパノラマ画像を得ることが記載されている。合成可能な複数のビューの符号化画像データからなる符号化ストリームが送られてくる場合、受信側では、合成画像の表示を行うためには、複数のビューの画像データを高精度につなぎ合わせるアルゴリズムが必要になる。ここで、合成位置の決定は、1ピクセルずつ移動させながら、それぞれの場合での画素相関値を取って比較を行うことで行われる。このように、複数のビューの画像データを高精度につなぎ合わせる処理は、合成位置の決定処理が伴うことから処理負荷の重いものとなる。
For example,
本技術の目的は、受信側における画像合成処理の処理負荷を低減可能とすることにある。 An object of this technique is to make it possible to reduce the processing load of image composition processing on the receiving side.
本技術の概念は、
合成可能な複数のビューの符号化画像データからなる符号化ストリームを送信する送信部と、
上記各ビューの符号化画像データに合成点の情報を挿入する情報挿入部を備える
送信装置にある。The concept of this technology is
A transmitter that sends a coded stream consisting of coded image data from multiple views that can be combined, and a transmitter.
It is in a transmission device including an information insertion unit that inserts information of a synthesis point into the coded image data of each of the above views.
本技術において、送信部により、合成可能な複数のビューの符号化画像データからなる符号化ストリームが送信される。情報挿入部により、各ビューの符号化画像データに合成点の情報が挿入される。例えば、合成点には、合成時の基準点と非基準点が含まれる、ようにされてもよい。また、例えば、合成点の情報は、画像のトップレフトを原点とするx座標およびy座標からなる、ようにされてもよい。 In the present technique, the transmission unit transmits a coded stream composed of coded image data of a plurality of views that can be synthesized. The information insertion unit inserts information on the composite point into the coded image data of each view. For example, the composite point may include a reference point and a non-reference point at the time of synthesis. Further, for example, the information of the composite point may be composed of x-coordinates and y-coordinates having the top left of the image as the origin.
このように本技術においては、各ビューの符号化画像データに合成点の情報を挿入して送信するものである。そのため、受信側では、合成点の情報に基づいて合成処理を行うことが可能となり、処理負荷の低減が可能となる。 As described above, in the present technique, the information of the synthesis point is inserted into the coded image data of each view and transmitted. Therefore, on the receiving side, it is possible to perform the synthesis processing based on the information of the synthesis point, and it is possible to reduce the processing load.
なお、本技術において、例えば、各ビューの符号化画像データに挿入される合成点の情報のそれぞれには、ビューを識別する情報が付加される、ようにされてもよい。これにより、受信側では、各ビューの識別を容易に行うことができる。 In the present technique, for example, information for identifying the view may be added to each of the information of the synthesis point inserted in the coded image data of each view. As a result, the receiving side can easily identify each view.
また、本技術において、例えば、各ビューの符号化画像データに挿入される合成点の情報のそれぞれには、代表ビューであるか否かを示す情報が付加される、ようにされてもよい。これにより、受信側では、合成画像のうちデフォルト表示すべき一部領域として代表ビューに対応した領域を選択することが可能となる。 Further, in the present technique, for example, information indicating whether or not the view is a representative view may be added to each of the information of the composite point inserted in the coded image data of each view. This makes it possible for the receiving side to select an area corresponding to the representative view as a part of the composite image to be displayed by default.
また、本技術において、例えば、各ビューの符号化画像データに挿入される合成点の情報のそれぞれには、合成ビューの組を示す情報が付加される、ようにされてもよい。これにより、受信側では、合成ビューの組を指定して所望の合成画像を得ることが可能となる。 Further, in the present technique, for example, information indicating a set of composite views may be added to each of the composite point information inserted in the coded image data of each view. This makes it possible for the receiving side to specify a set of composite views and obtain a desired composite image.
また、本技術の他の概念は、
合成可能な複数のビューの符号化画像データからなる符号化ストリームを受信する受信部を備え、
上記各ビューの符号化画像データには、合成点の情報が挿入されており、
上記複数のビューから選択された所定数のビューの画像データを、上記合成点の情報に基づいて合成して合成画像データを得る合成部をさらに備える
受信装置にある。In addition, other concepts of this technology
It has a receiver that receives a coded stream consisting of coded image data of multiple views that can be synthesized.
Information on the composition point is inserted in the coded image data of each of the above views.
The receiving device further includes a compositing unit that synthesizes image data of a predetermined number of views selected from the plurality of views based on the information of the compositing points to obtain composite image data.
本技術において、受信部により、合成可能な複数のビューの符号化画像データからなる符号化ストリームが受信される。各ビューの符号化画像データには、合成点の情報が挿入されている。合成部により、複数のビューから選択された所定数のビューの画像データが、合成点の情報に基づいて合成されて合成画像データが得られる。 In the present technique, the receiving unit receives a coded stream composed of coded image data of a plurality of views that can be synthesized. Information on the composition point is inserted in the coded image data of each view. The compositing unit combines image data of a predetermined number of views selected from a plurality of views based on the information of the compositing points to obtain composite image data.
このように本技術においては、複数のビューから選択された所定数のビューの画像データを、各ビューの符号化画像データに挿入されて送られてくる合成点の情報に基づいて合成するものである。そのため、処理負荷の低減が可能となる。 As described above, in the present technique, the image data of a predetermined number of views selected from a plurality of views is synthesized based on the information of the synthesis point inserted into the coded image data of each view and sent. be. Therefore, the processing load can be reduced.
なお、本技術において、例えば、各ビューの符号化画像データに挿入される合成点の情報のそれぞれには、合成ビューの組を示す情報が付加されており、合成部は、合成ビューの組の指定情報で指定された組に属するビューの画像データを合成する、ようにされてもよい。これにより、合成ビューの組を指定して所望の合成画像を得ることが可能となる。 In the present technique, for example, information indicating a set of composite views is added to each of the information of the composite points inserted in the coded image data of each view, and the composite unit is the set of composite views. The image data of the views belonging to the set specified by the specified information may be combined. This makes it possible to specify a set of composite views and obtain a desired composite image.
また、本技術において、例えば、合成画像データから一部の領域の画像データを選択的に取り出して表示用画像データを得る表示処理部をさらに備える、ようにされてもよい。これにより、合成画像の一部領域の画像を選択的に表示することが可能となる。 Further, in the present technique, for example, a display processing unit for selectively extracting image data of a part of a region from the composite image data to obtain display image data may be further provided. This makes it possible to selectively display an image in a part of the composite image.
この場合、例えば、一部の領域をユーザが操作する操作部をさらに備える、ようにされてもよい。これにより、ユーザは、合成画像内の表示領域を任意に調整することが可能となる。そして、この場合、例えば、表示用画像データに、取り出された一部領域の合成画像内の位置を示すための表示データを重畳する、ようにされてもよい。これにより、ユーザは、合成画像内の表示領域の位置を容易に認識できる。 In this case, for example, an operation unit in which a user operates a part of the area may be further provided. This allows the user to arbitrarily adjust the display area in the composite image. Then, in this case, for example, the display data for indicating the position in the composite image of the extracted partial region may be superimposed on the display image data. This allows the user to easily recognize the position of the display area in the composite image.
また、本技術において、例えば、各ビューの符号化画像データに挿入される合成点の情報のそれぞれには、代表ビューであるか否かを示す情報が付加されており、表示処理部は、デフォルトでは、合成画像データから代表ビューの領域の画像データを取り出して表示用画像データを得る、ようにされてもよい。これにより、デフォルトでは、合成画像のうち代表ビューの画像を表示することが可能となる。 Further, in the present technology, for example, information indicating whether or not the view is a representative view is added to each of the information of the composite point inserted in the coded image data of each view, and the display processing unit defaults. Then, the image data of the area of the representative view may be taken out from the composite image data to obtain the image data for display. As a result, by default, it is possible to display the representative view image among the composite images.
本技術によれば、受信側における画像合成処理の処理負荷を低減することが可能となる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。 According to this technique, it is possible to reduce the processing load of the image composition processing on the receiving side. The effects described herein are not necessarily limited, and may be any of the effects described in the present disclosure.
以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明は以下の順序で行う。
1.実施の形態
2.変形例Hereinafter, embodiments for carrying out the invention (hereinafter referred to as “embodiments”) will be described. The explanation will be given in the following order.
1. 1.
<1.実施の形態>
[送受信システム]
図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、送信装置100と、受信装置200とを有する構成となっている。<1. Embodiment>
[Transmission / reception system]
FIG. 1 shows a configuration example of a transmission /
送信装置100は、コンテナとしてのトランスポートストリームTSを放送波に載せて送信する。このトランスポートストリームTSには、合成可能な複数のビューの符号化画像データからなる符号化ストリーム(ビデオストリーム)が含まれる。この場合、符号化ストリームは、1本で構成されていてもよく、あるいは複数本で構成されていてもよい。
The
各ビューの符号化画像データには、合成点の情報が挿入される。このように各ビューの符号化画像データに合成点の情報を挿入されることで、受信側では、その合成点の情報に基づいて合成処理を行うことが可能となり、処理負荷の低減が可能となる。 Information on the composition point is inserted into the coded image data of each view. By inserting the information of the composition point into the coded image data of each view in this way, the receiving side can perform the composition processing based on the information of the composition point, and it is possible to reduce the processing load. Become.
各ビューの画像には2点以上の合成点が存在する。この合成点には、合成時に基準となる基準点とそれ以外の非基準点が含まれる。以下、適宜、基準点を「マスターポイント」と呼び、非基準点を「ターゲットポイント」と呼ぶ。ここで、合成点の情報は、例えば、画像のトップレフト(top-left)を原点とするx座標「x_coordinate」およびy座標「y_coordinate」からなる。 There are two or more composite points in the image of each view. This composite point includes a reference point that serves as a reference at the time of synthesis and other non-reference points. Hereinafter, the reference point is appropriately referred to as a “master point”, and the non-reference point is referred to as a “target point”. Here, the information of the composite point is composed of, for example, the x-coordinate "x_coordinate" and the y-coordinate "y_coordinate" with the top-left of the image as the origin.
各ビューの符号化画像データに挿入される合成点の情報のそれぞれには、ビューを識別する情報「view_id」が付加される。このようにビューを識別する情報が付加されることで、受信側では、各ビューの識別が容易に可能となる。 Information "view_id" that identifies the view is added to each of the information of the composite point inserted in the coded image data of each view. By adding the information for identifying the views in this way, the receiving side can easily identify each view.
また、各ビューの符号化画像データに挿入される合成点の情報のそれぞれには、代表ビューであるか否かを示す情報「masterview_flag」が付加される。このように代表ビューであるか否かを示す情報が付加されることで、受信側では、合成画像のうちデフォルト表示すべき一部領域として代表ビューに対応した領域を選択することが可能となる。 Further, information "masterview_flag" indicating whether or not the view is a representative view is added to each of the information of the composite point inserted in the coded image data of each view. By adding information indicating whether or not the view is a representative view in this way, the receiving side can select an area corresponding to the representative view as a part of the composite image to be displayed by default. ..
また、各ビューの符号化画像データに挿入される合成点の情報のそれぞれには、合成ビューの組を示す情報「tier」が付加される。このように合成ビューの組を示す情報が付加されることで、受信側では、合成ビューの組を指定して所望の合成画像を得ることが可能となる。 Further, information "tier" indicating a set of composite views is added to each of the composite point information inserted in the coded image data of each view. By adding the information indicating the set of composite views in this way, the receiving side can specify the set of composite views and obtain a desired composite image.
受信装置200は、送信装置100から放送波に載せて送られてくる上述のトランスポートストリームTSを受信する。このトランスポートストリームTSには、上述したように、合成可能な複数のビューの符号化画像データからなる符号化ストリーム(ビデオストリーム)が含まれている。そして、各ビューの符号化画像データには、合成点の情報が挿入されている。
The receiving
受信装置200は、複数のビューから選択された所定数のビューの画像データを、合成点の情報に基づいて合成して合成画像データを得る。例えば、受信装置200は、合成ビューの組の指定情報で指定された組に属するビューの画像データを合成する。合成ビューの組の指定は、例えば、ユーザの操作により行われる。
The receiving
受信装置200は、例えば、合成画像データから一部の領域、例えば1つのビューの画像サイズ分の画像データを選択的に取り出して表示用画像データを得る。これにより、合成画像の一部領域の画像が選択的に表示される。例えば、デフォルトでは、代表ビューの情報に基づいて、代表ビューの領域の画像データが取り出されて、代表ビューの画像表示がなされる。この一部の領域の調整は、例えば、ユーザの操作により行われる。そして、この場合、受信装置200は、例えば、取り出された一部領域の合成画像内の位置を表示画像上に表示し、ユーザの便に供する。
The receiving
「送信装置の構成」
図2は、送信装置100の構成例を示している。この送信装置100は、制御部101と、ユーザ操作部102aと、表示部102bと、非圧縮データバッファ(dpb:decoded picture buffer)103と、ビデオエンコーダ104と、圧縮データバッファ(cpb:coded picture buffer)105と、TSフォーマッタ106と、送信部107を有している。"Configuration of transmitter"
FIG. 2 shows a configuration example of the
制御部101は、CPU(Central Processing Unit)を備えており、送信装置100の各部の動作を制御する。この制御部101には、ユーザインタフェースを構成するユーザ操作部102aおよび表示部102bが接続されている。ユーザは、ユーザ操作部102aにより種々の入力操作を行うことができる。例えば、ユーザ操作部102aから、スティッチ合成情報の設定操作を行うことができる。このスティッチ合成情報には、合成点(マスターポイント、ターゲットポイント)の情報、ビュー識別情報、代表ビュー情報、合成ビュー組情報などが含まれる。
The
ビデオエンコーダ104は、非圧縮データバッファ103を通じて、合成可能な複数の、ここではN個のビューの動画像データVD1、VD2,・・・,VDNを入力し、AVCあるいはHEVCなどで符号化し、各ビューの符号化画像データからなる符号化ストリーム(ビデオストリーム)を得る。この場合、符号化ストリームは、1本あるいは複数本で構成される。
The
この際、ビデオエンコーダ104は、各ビューの符号化画像データに、スティッチ合成情報を挿入する。具体的には、ピクチャ毎の符号化画像データを持つ各アクセスユニット(AU)の“SEIs”の部分に、スティッチ合成情報を持つ新規定義するスティッチング・データ・SEIメッセージ(Stitching_data SEI message)を挿入する。
At this time, the
図3は、スティッチング・データ・SEIメッセージの構造例(Syntax)を示している。図4は、その構造例における主要な情報の内容(Semantics)を示している。「byte_length」の8ビットフィールドは、このSEIメッセージの以降のサイズをバイト数で示す。「number_of_stitching_sets」の16ビットフィールドは、スティッチ合成情報の数を示す。この数の分だけ、以下のフィールドが繰り返し存在する。 FIG. 3 shows a structural example (Syntax) of a stitching data SEI message. FIG. 4 shows the contents (Semantics) of the main information in the structural example. The 8-bit field of "byte_length" indicates the subsequent size of this SEI message in bytes. The 16-bit field of "number_of_stitching_sets" indicates the number of stitch composition information. The following fields exist repeatedly for this number.
「stp_id」の16ビットフィールドは、スティッチ合成するための点(合成点)の識別情報を示す。「view_id」の16ビットフィールドは、スティッチ合成点が含まれるビューの識別情報を示す。 The 16-bit field of "stp_id" indicates the identification information of the point (combination point) for stitch synthesis. The 16-bit field of "view_id" indicates the identification information of the view including the stitch composition point.
「master_point_x_coordinate」の16ビットフィールドは、画像のトップレフト(top-left)を原点としたマスターポイントのx座標を示す。「master_point_y_coordinate」の16ビットフィールドは、画像のトップレフトを原点としたマスターポイントのy座標を示す。「target_point_x_coordinate」の16ビットフィールドは、画像のトップレフトを原点としたターゲットポイントのx座標を示す。「target_point_y_coordinate」の16ビットフィールドは、画像のトップレフトを原点としたターゲットポイントのy座標を示す。 The 16-bit field of "master_point_x_coordinate" indicates the x-coordinate of the master point with the top-left of the image as the origin. The 16-bit field of "master_point_y_coordinate" indicates the y-coordinate of the master point with the top left of the image as the origin. The 16-bit field of "target_point_x_coordinate" indicates the x-coordinate of the target point with the top left of the image as the origin. The 16-bit field of "target_point_y_coordinate" indicates the y-coordinate of the target point with the top left of the image as the origin.
「tier」の4ビットフィールドは、合成ビューの組を示す。「masterview_flag」の1ビットフィールドは、スティッチ合成点が含まれるビューが代表ビューであるか否かを示す。例えば、“1”は代表ビューであることを示し、“0”は代表ビューでないことを示す。 The 4-bit field of "tier" indicates a set of composite views. The 1-bit field of "masterview_flag" indicates whether or not the view including the stitch composition point is a representative view. For example, "1" indicates that it is a representative view, and "0" indicates that it is not a representative view.
図5は、N個のビューの符号化画像データのシーケンスの一例を示している。各ピクチャの符号化画像データ(アクセスユニット)にそれぞれ上述のスティッチング・データ・SEIメッセージが挿入される。図示の例においては、1番目のピクチャと2番目のピクチャに関しては、ビュー1(View1)の符号化画像データに挿入されるスティッチ合成情報において「Masterview = 1」とされ、ビュー1が代表ビューに設定されている。
FIG. 5 shows an example of a sequence of coded image data of N views. The stitching data SEI message described above is inserted into the coded image data (access unit) of each picture. In the illustrated example, regarding the first picture and the second picture, "Masterview = 1" is set in the stitch composition information inserted in the coded image data of
また、3番目以降のピクチャに関しては、ビュー2(View2)の符号化画像データに挿入されるスティッチ合成情報において「Masterview = 1」とされ、ビュー2が代表ビューに設定されている。代表ビューは、後述するように、合成画像の一部領域を選択的に表示する場合に、デフォルトで、優先表示される。
Further, regarding the third and subsequent pictures, "Masterview = 1" is set in the stitch composition information inserted in the coded image data of the
図2に戻って、圧縮データバッファ(cpb)105は、ビデオエンコーダ104で生成された符号化ストリームを、一時的に蓄積する。TSフォーマッタ106は、圧縮データバッファ104に蓄積されている符号化ストリームを読み出し、PESパケット化し、さらにトランスポートパケット化して多重し、多重化ストリームとしてのトランスポートストリームTSを得る。送信部107は、TSフォーマッタ106で得られたトランスポートストリームTSを、放送波あるいはネットのパケットに載せて、受信装置200に送信する。
Returning to FIG. 2, the compressed data buffer (cpb) 105 temporarily stores the coded stream generated by the
図2に示す送信装置100の動作を簡単に説明する。合成可能なN個のビューの動画像データVD1、VD2,・・・,VDNは、非圧縮データバッファ(dpb)103を介して、ビデオエンコーダ104に供給される。ビデオエンコーダ104では、動画像データVD1、VD2,・・・,VDNのそれぞれがAVCあるいはHEVCなどで符号化されて、符号化ストリーム(ビデオストリーム)が得られる。
The operation of the
また、ビデオエンコーダ104では、各ビューの符号化画像データに、合成点(マスターポイント、ターゲットポイント)の情報、ビュー識別情報、代表ビュー情報、合成ビュー組情報などが含まれるスティッチ合成情報が挿入される。具体的には、ビデオエンコーダ104では、アクセスユニット(AU)の“SEIs”の部分に、スティッチ合成情報を持つスティッチング・データ・SEIメッセージ(図3参照)が挿入される。
Further, in the
ビデオエンコーダ104で生成された符号化ストリームは、圧縮データバッファ(cpb)105に一時的に蓄積される。TSフォーマッタ106では、圧縮データバッファ105に蓄積されている符号化ストリームが読み出され、PESパケット化され、さらにトランスポートパケット化されて多重され、多重化ストリームとしてのトランスポートストリームTSが得られる。
The coded stream generated by the
TSフォーマッタ106で得られたトランスポートストリームTSは、送信部107に送られる。送信部107では、TSフォーマッタ106で得られたトランスポートストリームTSが、放送波あるいはネットのパケットに載せて、受信装置200に送信される。
The transport stream TS obtained by the
「受信装置の構成」
図6は、受信装置200の構成例を示している。この受信装置200は、制御部(Central Processing Unit)201と、ユーザ操作部201aと、受信部202と、TS解析部203と、圧縮データバッファ(cpb:coded picture buffer)204と、ビデオデコーダ205と、非圧縮データバッファ(dpb:decoded picture buffer)206と、画像合成/表示選択部207と、合成部208と、表示部209を有している。"Receiver configuration"
FIG. 6 shows a configuration example of the receiving
制御部201は、CPU(Central Processing Unit)を備えており、受信装置200の各部の動作を制御する。この制御部201には、ユーザインタフェースを構成するユーザ操作部201aが接続されている。ユーザは、ユーザ操作部201aにより種々の入力操作を行うことができる。例えば、受信機側で合成画像のうち表示すべき一部領域の選択が可能な場合には、ユーザ操作部201aから選択操作を行うことできる。
The
受信部202は、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSを受信する。TS解析部203は、トランスポートストリームTSから、それに含まれる符号化ストリーム(各ビューの符号化画像データ)を取り出して圧縮データバッファ(cpb)204に送る。
The receiving
ビデオデコーダ205は、受信装置200のデコード能力に応じて、全てのビュー、あるいはユーザ操作部201aからユーザにより指定された合成ビューの組に属する各ビューの符号化画像データをデコードする。合成ビューの組の指定は、情報「tier」の値を所定の値に設定することで行われる。この場合、指定された合成ビューの組に属するビューであるかは、設定された情報「tier」の値に関連付けられた合成点を持つか否かで識別される。
The
図7は、情報「tier」の値による合成ビューの組の識別例を示している。なお、この例は、合成点(マスターポイント、ターゲットポイント)の情報に基づいて、各ビューの画像が既に合成されている状態を示している。例えば、合成ビューの組の指定が情報「tier」の値を「tier1」に設定することで行われる場合、ビュー1(view1)、ビュー2(view2)、ビュー3(view3)の各ビューが「tier1」に関連付けられた合成点を持っていることから、指定された合成ビューの組に属するビューとなる。また、例えば、合成ビューの組の指定が情報「tier」の値を「tier2」に設定することで行われる場合、ビュー1(view1)、ビュー4(view4)、ビュー5(view5)の各ビューが「tier2」に関連付けられた合成点を持っていることから、指定された合成ビューの組に属するビューとなる。
FIG. 7 shows an example of identifying a set of composite views by the value of the information “tier”. Note that this example shows a state in which the images of each view have already been combined based on the information of the composite points (master point, target point). For example, when the composition view set is specified by setting the value of the information "tier" to "tier1", each view of view 1 (view1), view 2 (view2), and view 3 (view3) is "view3". Since it has a composite point associated with "
ビデオデコーダ205は、圧縮データバッファ204に蓄積されている各ビューにおける各ピクチャの符号化画像データを、それぞれ、そのピクチャのDTS(Decoding Time stamp)で与えられるデコードタイミングで読み出してデコードする。デコードして得られた各ビューの各ピクチャの画像データは非圧縮データバッファ206に一時的に蓄積される。この非圧縮データバッファ206から各ピクチャの画像データがそのピクチャのPTS(Presentation Time Stamp)で与えられるタイミングで読み出されて、各ビューの動画像データVDが得られ、画像合成/表示選択部207に送られる。
The
また、ビデオデコーダ205は、ビデオストリームに挿入されているパラメータセットやSEIメッセージを抽出し、制御部201に送る。この抽出情報には、上述した各ビューの符号化画像データのアクセスユニットに挿入されているスティッチング・データ・SEIメッセージ(図3参照)も含まれる。これにより、制御部201は、各ビューのスティッチ合成情報を認識する。上述したように、スティッチ合成情報には、合成点(マスターポイント、ターゲットポイント)の情報、ビュー識別情報、代表ビュー情報、合成ビュー組情報などが含まれている。
Further, the
画像合成/表示選択部207は、非圧縮データバッファ206で得られた各ビューの画像データに合成処理を施して合成画像データを得る。合成処理では、同じ識別情報「stp_id」を持つ合成点を重ね合わせることで画像データを合成する。この場合、基準となるマスタ―ポイントを起点に、ターゲットポイント同士が重なるように、必要に応じて、回転やスケーリングを行って合成する。
The image composition /
図8は、上述の図7において、「tier1」で指定された合成ビューの組に属するビュー1(view1)、ビュー2(view2)、ビュー3(view3)の画像の一例を示している。ビュー1のスティッチ合成情報には、「stp_id1」で識別される合成点に係る各種情報が含まれている。ここでは、「view_id1」により、この合成点はビュー1に含まれること示されている。また、マスターポイントの座標が(x11,y11)であることが示されている。また、ターゲットポイントの座標が(x12,y12)であることが示されている。
FIG. 8 shows an example of images of
ビュー2のスティッチ合成情報には、「stp_id1」で識別される合成点に係る各種情報が含まれている。ここでは、「view_id2」により、この合成点はビュー2に含まれること示されている。また、マスターポイントの座標が(x21,y21)であることが示されている。また、ターゲットポイントの座標が(x22,y22)であることが示されている。
The stitch composition information of the
また、ビュー2のスティッチ合成情報には、「stp_id2」で識別される合成点に係る各種情報が含まれている。ここでは、「view_id2」により、この合成点はビュー2に含まれること示されている。また、マスターポイントの座標が(x23,y23)であることが示されている。また、ターゲットポイントの座標が(x24,y24)であることが示されている。
Further, the stitch composition information of the
ビュー3のスティッチ合成情報には、「stp_id2」で識別される合成点に係る各種情報が含まれている。ここでは、「view_id3」により、この合成点はビュー3に含まれること示されている。また、マスターポイントの座標が(x31,y31)であることが示されている。また、ターゲットポイントの座標が(x32,y32)であることが示されている。
The stitch composition information of the
ビュー1とビュー2の合成処理では、「stp_id1」で識別される合成点(マスターポイント、ターゲットポイント)を重ね合わせることで画像データを合成する。また、ビュー2とビュー3の合成処理では、「stp_id2」で識別される合成点(マスターポイント、ターゲットポイント)を重ね合わせることで画像データを合成する。これにより、ビュー1、ビュー2およびビュー3の画像データを合成した合成画像データが得られる。図9は、合成処理の結果の例を示している。
In the composition process of
合成処理の手順について説明する。ここでは、ビュー1とビュー2の合成処理を例にとって説明する。この場合、ビュー1とビュー2に含まれる「stp_id1」で識別される合成点(マスターポイント、ターゲットポイント)を用いて合成処理が行われる。
The procedure of the synthesis process will be described. Here, the composition process of
図10(a)は、ビュー1に含まれる合成点であるマスターポイントM1とターゲットポイントT1の位置関係の一例を示している。マスターポイントM1の座標は(x11,y11)であり、ターゲットポイントT1の座標は(x12、y12)である。マスターポイントM1を基点として、ターゲットポイントT1は、垂直軸からθ1だけ回転した位置にある。また、マスターポイントM1とターゲットポイントT1の間の距離はr1である。
FIG. 10A shows an example of the positional relationship between the master point M1 and the target point T1, which are synthetic points included in the
図10(b)は、ビュー2に含まれる合成点であるマスターポイントM2とターゲットポイントT2の位置関係の一例を示している。マスターポイントM2の座標は(x21,y21)であり、ターゲットポイントT2の座標は(x22、y22)である。マスターポイントM2を基点として、ターゲットポイントT2は、垂直軸からθ2だけ回転した位置にある。また、マスターポイントM2とターゲットポイントT2の間の距離はr2である。なお、ここでは、θ2<θ1、r2>r1であるとする。
FIG. 10B shows an example of the positional relationship between the master point M2 and the target point T2, which are composite points included in the
ステップ1では、図11(a)に示すように、ビュー1のマスターポイントM1とビュー2のマスターポイントM2の座標が重なるように、2つのビュー(画像)の位置設定の処理をする。このように位置設定をした場合、マスターポイントM1,M2の座標が重なるが、上述したようにθ2<θ1、r2>r1であるので、ビュー1のターゲットポイントT1とビュー2のターゲットポイントT2の座標は重ならない。
In
以降のステップでは、ターゲットポイントT1,T2の座標が重なるように位置設定の処理をさらに進めていく。なお、θ2=θ1、r2=r1である場合には、このステップ1の処理で、ターゲットポイントT1,T2の座標も重なることから、2つのビュー(画像)の位置設定の処理が終了することになる。
In the subsequent steps, the position setting process is further advanced so that the coordinates of the target points T1 and T2 overlap. When θ2 = θ1 and r2 = r1, the coordinates of the target points T1 and T2 also overlap in the process of this
ステップ2では、図11(b)に示すように、ビュー1のターゲットポイントT1とビュー2のターゲットポイントT2の座標を重ねるための第1段階として、ビュー2を、マスターポイントM2を支点として、(θ1-θ2)だけ回転する。これにより、ビュー2のターゲットポイントT2は、マスターポイントM1,M2とビュー1のターゲットポイントT1とを結ぶ線の延長上に位置した状態となる。なお、この場合、逆に、ビュー1を、マスターポイントM1を支点として、-(θ1-θ2)だけ回転することも考えられる。
In
ステップ3では、図11(c)に示すように、ビュー1のターゲットポイントT1とビュー2のターゲットポイントT2の座標を重ねるための第2段階として、ビュー2のターゲットポイントT2がビュー1のターゲットポイントT1に重なるように、マスターポイントM1ないしM2を起点にスケーリングする。この場合、ビュー2のマスターポイントM2とターゲットポイントT2の間の距離は、ビュー1のマスターポイントM1とターゲットポイントT1の間の距離r1と等しくなる。なお、この場合、逆に、ビュー1のターゲットポイントT1がビュー2のターゲットポイントT2に重なるようにスケーリングすることも考えられる。
In
ステップ4では、ビュー1とビュー2の画質(輝度、色など)が一致するように調整する。この場合、例えば、輝度調整の場合は、図12(a)に示すように、上述したようにマスターポイント同士、ターゲットポイント同士が重なった状態で、マスターポイントとターゲットポイントで規制される長方形領域を設定する。そして、この長方形領域におけるビュー1、ビュー2のそれぞれの輝度ヒストグラムをとり、それが同じになるように調整する。図12(b)は、輝度調整された後の状態を示している。詳細説明は省略するが、色調整の場合も同様である。なお、輝度調整および色調整の双方を行う場合他、いずれか一方のみを行うことも考えられる。
In
図13は、画像合成/表示選択部207における合成処理のフローを示している。ステップST1において、処理を開始する。次に、ステップST2において、同じ「stp_id」の値を持つ2つのビュー(画像)のマスターポイント(Master Point)同士が同一の座標に重なるように位置設定をする(図11(a)参照)。
FIG. 13 shows the flow of the compositing process in the image compositing /
次に、ステップST3において、マスターポイント同士が同一の座標に重なっても2つのターゲットポイント(Target Pint)が座標上で重ならない場合であってθ2とθ1が異なるときは、マスターポイントを中心として、θ2がθ1と等しくなるように、あるいはθ1がθ2に等しくなるように、いずれかのビューを回転する(図11(b)参照)。 Next, in step ST3, when the two target points (Target Pint) do not overlap on the coordinates even if the master points overlap on the same coordinates, and θ2 and θ1 are different, the master point is set as the center. Rotate either view so that θ2 is equal to θ1 or θ1 is equal to θ2 (see FIG. 11 (b)).
次に、ステップST4において、θ2がθ1と等しくなっても2つのターゲットポイントが座標上で重ならない場合は、2つのターゲットポイントが重なるように、一方のビューを縮小または拡大するスケーリングをする(図11(c)参照)。次に、ステップST5において、マスターポイントとターゲットポイントが形成する長方形領域で輝度および/または色に関するヒストグラムが同じになるように、2つのビューの画質調整をする(図12参照)。 Next, in step ST4, if the two target points do not overlap on the coordinates even if θ2 becomes equal to θ1, scaling is performed to reduce or enlarge one view so that the two target points overlap (Fig.). 11 (c)). Next, in step ST5, the image quality of the two views is adjusted so that the histograms regarding brightness and / or color are the same in the rectangular region formed by the master point and the target point (see FIG. 12).
他に合成すべきビューが存在すれば、その分だけ上述のステップST2からステップST5までを繰り返し、全てのビューの合成が終了したとき、ステップST6において、合成処理を終了する。 If there is another view to be combined, the above steps ST2 to ST5 are repeated by that amount, and when the composition of all the views is completed, the composition process is completed in step ST6.
図6に戻って、画像合成/表示選択部207は、表示部209の表示画枠サイズやユーザ操作部201aからのユーザの選択操作に応じて、合成画像データからその全領域あるいは一部領域の画像データを取り出して表示用画像データとして出力する。例えば、表示部209の表示画枠サイズが合成画像の全体表示が可能であるサイズの場合には、画像合成/表示選択部207は、合成画像データからその全領域の画像データを取り出して表示用画像データとして出力する。
Returning to FIG. 6, the image composition /
また、例えば、表示部209の表示画枠サイズが合成画像の一部の表示、例えば1つのビュー分だけの表示が可能であるサイズの場合には、画像合成/表示選択部207は、合成画像データからその一部領域の画像データを取り出して表示用画像データとして出力する。この際、画像合成/表示選択部207は、デフォルトでは、代表ビューの領域の画像データを取り出して表示用画像データとして出力する。
Further, for example, when the display frame size of the
また、このように画像合成/表示選択部207が合成画像データからその一部領域の画像データを取り出して表示用画像データとして出力する場合、ユーザ操作部201aからのユーザの選択操作に応じて画像データを取り出す一部領域を変更し、その変更後の一部領域の画像データを取り出して表示用画像データとして出力する。これにより、ユーザのスクロール操作に応じたスクロール表示も可能となる。なお、スクロール操作ではなく、各ビューの領域を表示領域として順次選択することも考えられる。
Further, when the image composition /
制御部201は、合成画像内のどの位置の画像データが取り出されている状態にあるかを示すためのUI表示データを生成する。この場合、合成画像データからその全領域の画像データが取り出されている場合には、このUI表示データによりその旨が表示され、スクロール成分がないことが示される。一方、合成画像データからその一部領域の画像データが取り出されている場合には、このUI表示データによりその取り出し位置が表示され、スクロール成分があることが示される。
The
合成部208は、画像合成/表示選択部207で生成された表示用画像データおよび制御部201で発生されるUI表示データを合成して、表示部209に送る。表示部209は、例えば、LCD(Liquid Crystal Display)、有機EL(Organic Electro-Luminescence)パネル等で構成されている。なお、この表示部209は、受信装置200に接続される外部機器であってもよい。
The
図14は、表示部209に、合成画像(合成ビュー)の全体を表示する場合の表示の一例を示している。表示画面には、合成画像の他に、UI表示データにより、合成画像の全体表示であり、スクロール成分がないことが示されている。図15は、成画像(合成ビュー)の一部領域を表示する場合であって、ユーザインタラクションによる合成画像の表示の一例を示している。この場合、ユーザのスクロール操作により、表示領域がスクロールしていく。表示画面には、一部領域の画像の他に、UI表示データにより、合成画像の一部表示であることがその位置と共に示され、さらにスクロール成分があることが方向を示す矢印を伴って示されている。
FIG. 14 shows an example of display when the entire composite image (composite view) is displayed on the
図15(a)は、合成画像のうち左端の代表ビューの領域の表示領域となっている場合のUI画面の一例を示している。この場合、右向きの矢印により、表示画像位置が左端にあり、右側へのスクロールのみが可能であることが示されている。図15(b)は、右側にP1だけ表示領域をスクロールした場合のUI画面の一例を示している。この場合、縦棒で合成画像の全体に対する表示領域の相対位置が示され、さらに右左の両方に向いた矢印により、右左の両方へのスクロールが可能であることが示されている。 FIG. 15A shows an example of the UI screen when the display area is the leftmost representative view area of the composite image. In this case, the arrow pointing to the right indicates that the display image position is at the left end and only scrolling to the right is possible. FIG. 15B shows an example of the UI screen when the display area is scrolled by P1 on the right side. In this case, the vertical bar indicates the relative position of the display area with respect to the entire composite image, and the arrows pointing to both the right and left indicate that scrolling to both the right and left is possible.
図15(c)は、さらに右側にP2だけ表示領域をスクロールした場合のUI画面の一例を示している。この場合、縦棒で合成画像の全体に対する表示領域の相対位置が示され、さらに右左の両方に向いた矢印により、右左の両方へのスクロールが可能であることが示されている。図15(d)は、さらに右側にP3だけ表示領域をスクロールした場合のUI画面の一例を示している。この場合、左向きの矢印により、表示画像位置が右端にあり、左側へのスクロールのみが可能であることが示されている。 FIG. 15C shows an example of the UI screen when the display area is further scrolled to the right by P2. In this case, the vertical bar indicates the relative position of the display area with respect to the entire composite image, and the arrows pointing to both the right and left indicate that scrolling to both the right and left is possible. FIG. 15D shows an example of the UI screen when the display area is further scrolled to the right by P3. In this case, the left-pointing arrow indicates that the display image position is at the right end and only scrolling to the left is possible.
図6に示す受信装置200の動作を簡単に説明する。受信部202では、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSが受信される。このトランスポートストリームTSは、TS解析部203に供給される。TS解析部203では、トランスポートストリームTSから、それに含まれる符号化ストリーム(各ビューの符号化画像データ)を取り出され、圧縮データバッファ204に送られる。
The operation of the receiving
ビデオデコーダ205では、受信装置200のデコード能力に応じて、全てのビュー、あるいはユーザ操作部201aからユーザにより指定された合成ビューの組に属する各ビューの符号化画像データがデコードされる。合成ビューの組の指定は、情報「tier」の値を所定の値に設定することで行われる。この場合、ビデオデコーダ205では、圧縮データバッファ204に蓄積されている各ビューにおける各ピクチャの符号化画像データが、それぞれ、そのピクチャのDTS(Decoding Time stamp)で与えられるデコードタイミングで読み出されてデコードされる。
In the
ビデオデコーダ205で得られた各ビューの各ピクチャの画像データは、非圧縮データバッファ206に一時的に蓄積される。この非圧縮データバッファ206から各ピクチャの画像データがそのピクチャのPTS(Presentation Time Stamp)で与えられるタイミングで読み出されて、各ビューの動画像データVDが得られ、画像合成/表示選択部207に送られる。
The image data of each picture of each view obtained by the
また、ビデオデコーダ205では、ビデオストリームに挿入されているパラメータセットやSEIメッセージが抽出され、制御部201に送られる。この抽出情報には、各ビューの符号化画像データのアクセスユニットに挿入されているスティッチング・データ・SEIメッセージ(図3参照)も含まれる。これにより、制御部201では、各ビューのスティッチ合成情報が認識される。このスティッチ合成情報には、合成点(マスターポイント、ターゲットポイント)の情報、ビュー識別情報、代表ビュー情報、合成ビュー組情報などが含まれている。
Further, the
画像合成/表示選択部207では、制御部201の制御の下、非圧縮データバッファ206で得られた各ビューの画像データに合成処理が施されて合成画像データが得られる。合成処理では、同じ識別情報「stp_id」を持つ合成点が重ね合わせられることで画像データが合成される。この場合、基準となるマスタ―ポイントを起点に、ターゲットポイント同士が重なるように、必要に応じて、回転やスケーリングが行われて合成される。
In the image composition /
また、画像合成/表示選択部207では、表示部209の表示画枠サイズやユーザ操作部201aからのユーザの選択操作に応じて、合成画像データからその全領域あるいは一部領域の画像データが取り出されて表示用画像データとして出力される。この表示用画像データは、合成部208を介して表示部209に供給され、表示部209には、表示用画像データによる画像が表示される。このように、表示部209の表示画枠サイズに応じて、スケーラブルな表示が行なわれる。
Further, in the image composition /
例えば、表示部209の表示画枠サイズが合成画像の全体表示が可能であるサイズの場合には、画像合成/表示選択部207では、合成画像データからその全領域の画像データが取り出されて表示用画像データとして出力される。そのため、この場合には、表示部209には、合成画像の全体が表示される。
For example, when the display frame size of the
また、例えば、表示部209の表示画枠サイズが合成画像の一部の表示、例えば1つのビュー分だけの表示が可能であるサイズの場合には、画像合成/表示選択部207では、合成画像データからその一部領域の画像データが取り出されて表示用画像データとして出力される。そのため、この場合には、表示部209には、合成画像の一部領域が表示される。この際、画像合成/表示選択部207では、デフォルトにあっては、代表ビューの領域の画像データが取り出されるため、表示部209には代表ビューの画像が表示される。
Further, for example, when the display frame size of the
また、この際、ユーザ操作部201aからのユーザの選択操作に応じて画像データを取り出す一部領域が変更されるとき、画像合成/表示選択部207では、その変更後の一部領域の画像データが取り出されて表示用画像データとして出力される。そのため、ユーザのスクロール操作に応じたスクロール表示も行われる。
Further, at this time, when the partial area for extracting the image data is changed according to the user's selection operation from the
また、制御部201では、合成画像内のどの位置の画像データが取り出されている状態にあるかを示すためのUI表示データが生成される。このUI表示データは、合成部208において、表示用画像データに合成される。この場合、合成画像データからその全領域の画像データが取り出されているときは、このUI表示データによりその旨が表示され、スクロール成分がないことが示される。一方、合成画像データからその一部領域の画像データが取り出されているときは、このUI表示データによりその取り出し位置が表示され、スクロール成分があることが示される。ユーザは、このUI表示データにより、スクロール操作を容易に行い得る。
Further, the
以上説明したように、図1に示す送受信システム10において、送信装置100では、各ビューの符号化画像データに合成点(マスターポイント、ターゲットポイント)の情報を挿入して送信するものである。そのため、受信側では、合成点の情報に基づいて各ビューの合成処理を行うことが可能となり、処理負荷の低減が可能となる。
As described above, in the transmission /
また、図1に示す送受信システム10において、送信装置100では、各ビューの符号化画像データに挿入される合成点の情報のそれぞれには、ビューを識別する情報を付加するものである。そのため、受信側では、各ビューの識別を容易に行うことができる。
Further, in the transmission /
また、図1に示す送受信システム10において、送信装置100では、各ビューの符号化画像データに挿入される合成点の情報のそれぞれに、代表ビューであるか否かを示す情報が付加するものである。そのため、受信側では、合成画像のうちデフォルト表示すべき一部領域として代表ビューに対応した領域を選択することが可能となる。
Further, in the transmission /
また、図1に示す送受信システム10において、送信装置100では、各ビューの符号化画像データに挿入される合成点の情報のそれぞれに、合成ビューの組を示す情報を付加するものである。そのため、受信側では、合成ビューの組を指定して所望の合成画像を得ることが可能となる。
Further, in the transmission /
また、図1に示す送受信システム10において、受信装置200では、合成画像内で表示すべき一部の領域をユーザが操作する操作部が備えられる。そのため、ユーザは、合成画像内の表示領域を任意に調整することが可能となる。そして、この場合、受信装置200では、表示用画像データに、取り出された一部領域の合成画像内の位置を示すための表示データが重畳される。そのため、ユーザは、合成画像内の表示領域の位置を容易に認識でき、スクロール操作をスムーズに行うことができる。
Further, in the transmission /
<2.変形例>
なお、上述実施の形態においては、合成点のセットを1つのマスターポイントと1つのターゲットポイントで構成する例を示した。しかし、合成点のセットを1つのマスターポイントと2つ以上のターゲットポイントで構成することも考えられる。その場合、合成処理では、基準となるマスタ―ポイントを起点に、2つ以上のターゲットポイント同士が重なるように、必要に応じて回転やスケーリング(非線形な回転やスケーリングも含まれる)が行われる。<2. Modification example>
In the above-described embodiment, an example is shown in which a set of synthesis points is composed of one master point and one target point. However, it is also conceivable to configure a set of composite points with one master point and two or more target points. In that case, in the synthesis process, rotation or scaling (including non-linear rotation and scaling) is performed as necessary so that two or more target points overlap each other starting from the reference master point.
また、上述実施の形態においては、送信装置100と受信装置200からなる送受信システム10を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、受信装置200の部分が、例えば、(HDMI(High-Definition Multimedia Interface)などのデジタルインタフェースで接続されたセットトップボックスおよびモニタの構成などであってもよい。なお、「HDMI」は、登録商標である。
Further, in the above-described embodiment, the transmission /
また、上述実施の形態においては、コンテナがトランスポートストリーム(MPEG-2 TS)である例を示した。しかし、本技術は、インターネット等のネットワークを利用して受信端末に配信される構成のシステムにも同様に適用できる。インターネットの配信では、ISOBMFF(あるいはMP4)やそれ以外のフォーマットのコンテナで配信されることが多い。つまり、コンテナとしては、デジタル放送規格で採用されているトランスポートストリーム(MPEG-2 TS)、インターネット配信で使用されているISOBMFF(あるいはMP4)などの種々のフォーマットのコンテナが該当する。 Further, in the above-described embodiment, an example in which the container is a transport stream (MPEG-2 TS) is shown. However, this technique can be similarly applied to a system configured to be delivered to a receiving terminal using a network such as the Internet. In Internet distribution, it is often distributed in containers of ISOBMFF (or MP4) or other formats. That is, the container corresponds to a container of various formats such as the transport stream (MPEG-2 TS) adopted in the digital broadcasting standard and ISOBMFF (or MP4) used in the Internet distribution.
また、本技術は、以下のような構成を取ることもできる。
(1)合成可能な複数のビューの符号化画像データからなる符号化ストリームを送信する送信部と、
上記各ビューの符号化画像データに合成点の情報を挿入する情報挿入部を備える
送信装置。
(2)上記合成点には、合成時の基準点と非基準点が含まれる
前記(1)に記載の送信装置。
(3)上記合成点の情報は、画像のトップレフトを原点とするx座標およびy座標からなる
前記(1)または(2)に記載の送信装置。
(4)上記各ビューの符号化画像データに挿入される上記合成点の情報のそれぞれには、ビューを識別する情報が付加される
前記(1)から(3)のいずれかに記載の送信装置。
(5)上記各ビューの符号化画像データに挿入される上記合成点の情報のそれぞれには、代表ビューであるか否かを示す情報が付加される
前記(1)から(4)のいずれかに記載の送信装置。
(6)上記各ビューの符号化画像データに挿入される上記合成点の情報のそれぞれには、合成ビューの組を示す情報が付加される
前記(1)から(5)のいずれかに記載の送信装置。
(7)送信部が、合成可能な複数のビューの符号化画像データからなる符号化ストリームを送信する送信ステップと、
情報挿入部が、上記各ビューの符号化画像データに合成点の情報を挿入する情報挿入ステップを有する
送信方法。
(8)合成可能な複数のビューの符号化画像データからなる符号化ストリームを受信する受信部を備え、
上記各ビューの符号化画像データには、合成点の情報が挿入されており、
上記複数のビューから選択された所定数のビューの画像データを、上記合成点の情報に基づいて合成して合成画像データを得る合成部をさらに備える
受信装置。
(9)上記各ビューの符号化画像データに挿入される上記合成点の情報のそれぞれには、合成ビューの組を示す情報が付加されており、
上記合成部は、上記合成ビューの組の指定情報で指定された組に属するビューの画像データを合成する
前記(8)に記載の受信装置。
(10)上記合成画像データから一部の領域の画像データを選択的に取り出して表示用画像データを得る表示処理部をさらに備える
前記(8)または(9)に記載の受信装置。
(11)上記各ビューの符号化画像データに挿入される上記合成点の情報のそれぞれには、代表ビューであるか否かを示す情報が付加されており、
上記表示処理部は、デフォルトでは、上記合成画像データから上記代表ビューの領域の画像データを取り出して表示用画像データを得る
前記(10)に記載の受信装置。
(12)上記一部の領域をユーザが操作する操作部をさらに備える
前記(10)または(11)に記載の受信装置。
(13)上記表示処理部は、上記表示用画像データに、上記取り出された一部領域の合成画像内の位置を示すため表示データを重畳する
前記(12)に記載の受信装置。
(14)受信部が、合成可能な複数のビューの符号化画像データからなる符号化ストリームを受信する受信ステップを有し、
上記各ビューの符号化画像データには、合成点の情報が挿入されており、
合成部が、上記複数のビューから選択された所定数のビューの画像データを、上記合成点の情報に基づいて合成する合成ステップをさらに有する
受信方法。In addition, the present technology can also have the following configurations.
(1) A transmitter for transmitting a coded stream composed of coded image data of a plurality of views that can be synthesized, and a transmission unit.
A transmission device including an information insertion unit that inserts information of a synthesis point into the coded image data of each of the above views.
(2) The transmission device according to (1) above, wherein the composite point includes a reference point and a non-reference point at the time of synthesis.
(3) The transmission device according to (1) or (2) above, wherein the information of the composite point is composed of x-coordinates and y-coordinates whose origin is the top left of the image.
(4) The transmission device according to any one of (1) to (3) above, wherein information for identifying the view is added to each of the information of the synthesis point inserted in the coded image data of each view. ..
(5) Any of the above (1) to (4), in which information indicating whether or not the view is a representative view is added to each of the information of the composite points inserted in the coded image data of each of the views. The transmitter described in.
(6) The description according to any one of (1) to (5) above, wherein information indicating a set of composite views is added to each of the information of the composite points inserted in the coded image data of each view. Transmitter.
(7) A transmission step in which the transmission unit transmits a coded stream composed of coded image data of a plurality of views that can be synthesized.
A transmission method in which the information insertion unit includes an information insertion step for inserting information of a synthesis point into the coded image data of each of the above views.
(8) A receiver for receiving a coded stream composed of coded image data of a plurality of views that can be synthesized is provided.
Information on the composition point is inserted in the coded image data of each of the above views.
A receiving device further comprising a compositing unit for synthesizing image data of a predetermined number of views selected from the plurality of views based on the information of the compositing points to obtain composite image data.
(9) Information indicating a set of composite views is added to each of the information of the composite points inserted in the coded image data of each view.
The receiving device according to (8) above, wherein the compositing unit synthesizes image data of a view belonging to the set specified by the designated information of the set of the composite view.
(10) The receiving device according to (8) or (9) above, further comprising a display processing unit that selectively extracts image data of a part of the area from the composite image data to obtain display image data.
(11) Information indicating whether or not the view is a representative view is added to each of the information of the composite points inserted in the coded image data of each of the views.
By default, the display processing unit extracts image data in a region of the representative view from the composite image data to obtain display image data. The receiving device according to (10).
(12) The receiving device according to (10) or (11), further comprising an operation unit in which a user operates a part of the above area.
(13) The receiving device according to (12), wherein the display processing unit superimposes display data on the display image data in order to indicate a position in the composite image of the extracted partial region.
(14) The receiving unit has a receiving step of receiving a coded stream composed of coded image data of a plurality of views that can be synthesized.
Information on the composition point is inserted in the coded image data of each of the above views.
A receiving method in which the compositing unit further includes a compositing step of composing image data of a predetermined number of views selected from the plurality of views based on the information of the compositing points.
本技術の主な特徴は、各ビューの符号化画像データに合成点(マスターポイント、ターゲットポイント)の情報を挿入して送信することで、受信側では、合成点の情報に基づいて各ビューの合成処理を行うことを可能とし、処理負荷の低減を可能としたことである(図2、図3参照)。 The main feature of this technique is that the information of the composite point (master point, target point) is inserted into the coded image data of each view and transmitted, and the receiving side receives the information of each view based on the information of the composite point. It is possible to perform the synthesis processing and reduce the processing load (see FIGS. 2 and 3).
10・・・送受信システム
100・・・送信装置
101・・・制御部
102a・・・ユーザ操作部
102b・・・表示部
103・・・非圧縮データバッファ
104・・・ビデオエンコーダ
105・・・圧縮データバッファ
106・・・TSフォーマッタ
107・・・送信部
200・・・受信装置
201・・・制御部
201a・・・ユーザ操作部
202・・・受信部
203・・・TS解析部
204・・・圧縮データバッファ
205・・・ビデオデコーダ
206・・・非圧縮データバッファ
207・・・画像合成/表示選択部
208・・・合成部
209・・・表示部10 ... Transmission /
Claims (13)
上記各ビューの符号化画像データに、合成時の基準点と非基準点の2つの点の情報を含む合成点の情報を、合成点の識別情報を付加して、挿入する情報挿入部を備える
送信装置。 A transmitter that sends a coded stream consisting of coded image data from multiple views that can be combined, and a transmitter.
It is provided with an information insertion unit for inserting information on a composite point including information on two points, a reference point and a non-reference point at the time of synthesis, into the coded image data of each of the above views by adding identification information of the composite point. Transmitter.
請求項1に記載の送信装置。 The transmission device according to claim 1, wherein the information of the synthesis point is composed of x-coordinates and y-coordinates whose origin is the top left of the image.
請求項1に記載の送信装置。 The transmission device according to claim 1, wherein information for identifying the view is added to each of the information of the synthesis point inserted in the coded image data of each view.
請求項1に記載の送信装置。 The transmission device according to claim 1, wherein information indicating whether or not the view is a representative view is added to each of the information of the composite points inserted in the coded image data of each of the views.
請求項1に記載の送信装置。 The transmission device according to claim 1, wherein information indicating a set of composite views is added to each of the information of the composite points inserted in the coded image data of each of the views.
情報挿入部が、上記各ビューの符号化画像データに、合成時の基準点と非基準点の2つの点の情報を含む合成点の情報を、合成点の識別情報を付加して、挿入する情報挿入ステップを有する
送信方法。 A transmission step in which the transmitter transmits a coded stream consisting of coded image data of a plurality of views that can be synthesized.
The information insertion unit inserts the information of the composite point including the information of the two points of the reference point and the non-reference point at the time of synthesis into the coded image data of each of the above views by adding the identification information of the composite point. A transmission method with an information insertion step.
上記各ビューの符号化画像データには、合成時の基準点と非基準点の2つの点の情報を含む合成点の情報が、合成点の識別情報が付加されて、挿入されており、
上記複数のビューから選択された所定数のビューの画像データを、上記合成点の情報に基づいて合成して合成画像データを得る合成部をさらに備える
受信装置。 It has a receiver that receives a coded stream consisting of coded image data of multiple views that can be synthesized.
In the coded image data of each of the above views, the information of the composite point including the information of the two points of the reference point and the non-reference point at the time of synthesis is inserted with the identification information of the composite point added .
A receiving device further comprising a compositing unit for synthesizing image data of a predetermined number of views selected from the plurality of views based on the information of the compositing points to obtain composite image data.
上記合成部は、上記合成ビューの組の指定情報で指定された組に属するビューの画像データを合成する
請求項7に記載の受信装置。 Information indicating a set of composite views is added to each of the information of the composite points inserted in the coded image data of each of the views.
The receiving device according to claim 7 , wherein the compositing unit synthesizes image data of a view belonging to the set designated by the designated information of the set of the composite view.
請求項7に記載の受信装置。 The receiving device according to claim 7 , further comprising a display processing unit for selectively extracting image data of a part of the area from the composite image data to obtain image data for display.
上記表示処理部は、デフォルトでは、上記合成画像データから上記代表ビューの領域の画像データを取り出して表示用画像データを得る
請求項9に記載の受信装置。 Information indicating whether or not the view is a representative view is added to each of the information of the composite points inserted in the coded image data of each of the views.
The receiving device according to claim 9 , wherein the display processing unit extracts image data in a region of the representative view from the composite image data to obtain image data for display by default.
請求項9に記載の受信装置。 The receiving device according to claim 9 , further comprising an operation unit in which the user operates a part of the above area.
請求項11に記載の受信装置。 The receiving device according to claim 11 , wherein the display processing unit superimposes display data on the display image data in order to indicate a position in the composite image of the extracted partial region.
上記各ビューの符号化画像データには、合成時の基準点と非基準点の2つの点の情報を含む合成点の情報が、合成点の識別情報が付加されて、挿入されており、
合成部が、上記複数のビューから選択された所定数のビューの画像データを、上記合成点の情報に基づいて合成する合成ステップをさらに有する
受信方法。 The receiver has a receive step of receiving a coded stream consisting of coded image data of a plurality of views that can be synthesized.
In the coded image data of each of the above views, the information of the composite point including the information of the two points of the reference point and the non-reference point at the time of synthesis is inserted with the identification information of the composite point added .
A receiving method in which the compositing unit further includes a compositing step of composing image data of a predetermined number of views selected from the plurality of views based on the information of the compositing points.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016222060 | 2016-11-15 | ||
| JP2016222060 | 2016-11-15 | ||
| PCT/JP2017/040150 WO2018092642A1 (en) | 2016-11-15 | 2017-11-07 | Transmission device, transmission method, reception device, and reception method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2018092642A1 JPWO2018092642A1 (en) | 2019-10-17 |
| JP7056576B2 true JP7056576B2 (en) | 2022-04-19 |
Family
ID=62146401
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018551582A Expired - Fee Related JP7056576B2 (en) | 2016-11-15 | 2017-11-07 | Transmitter, transmit method, receiver and receive method |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP3544304A1 (en) |
| JP (1) | JP7056576B2 (en) |
| WO (1) | WO2018092642A1 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117396914A (en) * | 2021-05-26 | 2024-01-12 | Oppo广东移动通信有限公司 | Panoramic view reconstruction using feature panoramas |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000299804A (en) | 1999-04-12 | 2000-10-24 | Casio Comput Co Ltd | Panoramic imaging method and imaging apparatus |
| JP2007221769A (en) | 2006-01-23 | 2007-08-30 | Canon Inc | Image processing apparatus, image processing method, program, and storage medium |
| JP2011188349A (en) | 2010-03-10 | 2011-09-22 | Nikon Corp | Device, program and system for control of display |
| JP2012501496A (en) | 2008-08-29 | 2012-01-19 | マイクロソフト コーポレーション | Activate internal scrolling and cursor decoration |
| JP2012516114A (en) | 2009-01-26 | 2012-07-12 | トムソン ライセンシング | Frame packing for video encoding |
| JP2016015036A (en) | 2014-07-02 | 2016-01-28 | ソニー株式会社 | Image processing device, and image processing method |
| JP2016039390A (en) | 2014-08-05 | 2016-03-22 | 株式会社日立製作所 | Image generation method and apparatus |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5982951A (en) * | 1996-05-28 | 1999-11-09 | Canon Kabushiki Kaisha | Apparatus and method for combining a plurality of images |
| JPH09321972A (en) * | 1996-05-28 | 1997-12-12 | Canon Inc | Image synthesizing apparatus and method |
| US10750153B2 (en) * | 2014-09-22 | 2020-08-18 | Samsung Electronics Company, Ltd. | Camera system for three-dimensional video |
-
2017
- 2017-11-07 JP JP2018551582A patent/JP7056576B2/en not_active Expired - Fee Related
- 2017-11-07 WO PCT/JP2017/040150 patent/WO2018092642A1/en not_active Ceased
- 2017-11-07 EP EP17872092.6A patent/EP3544304A1/en not_active Withdrawn
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000299804A (en) | 1999-04-12 | 2000-10-24 | Casio Comput Co Ltd | Panoramic imaging method and imaging apparatus |
| JP2007221769A (en) | 2006-01-23 | 2007-08-30 | Canon Inc | Image processing apparatus, image processing method, program, and storage medium |
| JP2012501496A (en) | 2008-08-29 | 2012-01-19 | マイクロソフト コーポレーション | Activate internal scrolling and cursor decoration |
| JP2012516114A (en) | 2009-01-26 | 2012-07-12 | トムソン ライセンシング | Frame packing for video encoding |
| JP2016105631A (en) | 2009-01-26 | 2016-06-09 | トムソン ライセンシングThomson Licensing | Frame packing for video coding |
| JP2011188349A (en) | 2010-03-10 | 2011-09-22 | Nikon Corp | Device, program and system for control of display |
| JP2016015036A (en) | 2014-07-02 | 2016-01-28 | ソニー株式会社 | Image processing device, and image processing method |
| JP2016039390A (en) | 2014-08-05 | 2016-03-22 | 株式会社日立製作所 | Image generation method and apparatus |
Also Published As
| Publication number | Publication date |
|---|---|
| JPWO2018092642A1 (en) | 2019-10-17 |
| EP3544304A4 (en) | 2019-09-25 |
| WO2018092642A1 (en) | 2018-05-24 |
| EP3544304A1 (en) | 2019-09-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP3226241B1 (en) | Transmission device, transmission method, reception device, and reception method | |
| US20200004408A1 (en) | Multiple-Mode System and Method for Providing User Selectable Video Content | |
| US20110141232A1 (en) | Image data transmitting apparatus, control method, and program | |
| US8620147B2 (en) | Method and apparatus for transmitting compressed data using digital data interface, and method and apparatus for receiving compressed data using digital data interface | |
| JP2023076613A (en) | Transmission method and transmission device | |
| US20250240383A1 (en) | Method for processing media data, client, and server | |
| US10575062B2 (en) | Reception apparatus, reception method, transmission apparatus, and transmission method | |
| JPWO2020137766A1 (en) | Transmission device, transmission method, coding device, coding method, receiving device and receiving method | |
| JP2026015579A (en) | Transmitting device, transmitting method, receiving device and receiving method | |
| KR20180003608A (en) | Method for rendering audio-video content, decoder implementing the method, and rendering device for rendering audio-video content | |
| JP7056576B2 (en) | Transmitter, transmit method, receiver and receive method | |
| US10862941B2 (en) | Transmission apparatus, transmission method, reception apparatus, and reception method | |
| JP6969572B2 (en) | Transmitter, transmitter, receiver and receiver | |
| JP2024116702A (en) | Scene description editing device and program | |
| JP2024165003A (en) | Scene description editing device and program | |
| WO2020039973A1 (en) | Receiving apparatus, receiving method, transmitting apparatus, and transmitting method | |
| WO2018079389A1 (en) | Transmission apparatus, transmission method, reception apparatus, and reception method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201007 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220104 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220208 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220321 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 7056576 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
| LAPS | Cancellation because of no payment of annual fees |