JP7310148B2 - Media encoding method and apparatus - Google Patents
Media encoding method and apparatus Download PDFInfo
- Publication number
- JP7310148B2 JP7310148B2 JP2019007878A JP2019007878A JP7310148B2 JP 7310148 B2 JP7310148 B2 JP 7310148B2 JP 2019007878 A JP2019007878 A JP 2019007878A JP 2019007878 A JP2019007878 A JP 2019007878A JP 7310148 B2 JP7310148 B2 JP 7310148B2
- Authority
- JP
- Japan
- Prior art keywords
- encoding
- parameter set
- media
- analysis
- media data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 33
- 238000004458 analytical method Methods 0.000 claims description 321
- 238000004891 communication Methods 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 description 84
- 230000006870 function Effects 0.000 description 37
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 240000001973 Ficus microcarpa Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Closed-Circuit Television Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本発明はメディアデータの解析機能を有する通信システムに係り、特に符号化されたメディアデータを受信した受信側での解析精度の向上を企図したメディア符号化方法および装置に関する。 The present invention relates to a communication system having a media data analysis function, and more particularly to a media encoding method and apparatus intended to improve analysis accuracy on a receiving side that receives encoded media data.
近年、画像、映像、音声等のメディアデータを解析する技術の進歩が著しい。メディア解析技術は、防犯・防災のための監視システムだけでなく、車両の運転支援や自動運転等のさまざまな分野への適用が進められている。特にメディアデータがネットワークを通して伝送される場合、データ量を圧縮する符号化技術は不可欠である。その際、受信側で十分高いメディア解析精度を得るには、復号されたメディアデータのメディア品質を高くする必要がある。 In recent years, there have been remarkable advances in techniques for analyzing media data such as images, videos, and sounds. Media analysis technology is being applied not only to monitoring systems for crime prevention and disaster prevention, but also to various fields such as vehicle driving support and autonomous driving. Especially when media data is transmitted over a network, an encoding technique for compressing the amount of data is indispensable. At that time, in order to obtain sufficiently high media analysis accuracy on the receiving side, it is necessary to increase the media quality of the decoded media data.
受信側のメディア解析精度を確保する技術としては、受信機からの通知に応じて、送信機が符号化パラメータを適応的に変更する方法が提案されている。たとえば、特許文献1に開示された方法によれば、受信側は、車両の走行状態に応じて画像認識処理を切り替え、切替後の画像認識処理に対応する符号化制御情報を送信側へ通知する。送信側は、通知された符号化制御情報に従ってエンコーダの符号化パラメータを変更する。これにより、受信側は、走行状態に適した画像認識を可能にする符号化データを受信することができ、画像認識率を高めることができる。
As a technique for ensuring media analysis accuracy on the receiving side, a method has been proposed in which a transmitter adaptively changes encoding parameters in accordance with a notification from a receiver. For example, according to the method disclosed in
また、符号化技術の近年の代表例としては、スケーラブル符号化(階層符号化)が知られている。今日のネットワーク環境は、光ファイバ等の高速通信路や携帯端末等の比較的低速の無線通信路が混在している。スケーラブル符号化は、このようなネットワーク環境において、受信側の性能に応じた効率的な符号化を可能とする。このようなスケーラブル符号化を用いた映像配信システムの一例が特許文献2に記載されている。特許文献2では、スケーラブル符号化を制御することで、画面全体の最低画質を一定に維持しつつユーザが所望する領域を高画質圧縮する方法が開示されている。
Also, scalable coding (hierarchical coding) is known as a recent representative example of coding technology. In today's network environment, high-speed communication paths such as optical fibers and relatively low-speed wireless communication paths such as mobile terminals are mixed. Scalable coding enables efficient coding according to the performance of the receiving side in such a network environment. An example of a video distribution system using such scalable coding is described in
上述した特許文献1に記載された方法は、送信側の符号化パラメータを受信側からの通知に応じて適応的に変更する。この場合、ネットワーク環境の劣化により、受信側の画像認識精度が大幅に低下するという問題が生じうる。たとえば、受信側からの通知に従って所定の符号化パラメータで符号化したときに、その符号化映像ストリームのビットレートがネットワーク帯域を上回る場合がありうる。この場合、映像データの部分的なロスが発生し、その結果、受信側で画像認識を行う映像にブロックノイズ等の乱れが生じて認識精度が大きく低下してしまう。
The method described in
また、特許文献2に記載された符号化通信システムでは、効率的な階層符号化方法が提案されているが、ネットワーク環境の劣化による受信側の解析精度の劣化対策については検討されていない。
In addition, in the encoding communication system described in
本発明の目的は、ネットワーク環境を考慮し、できる限り高いメディア解析精度が得られるようにメディアデータを符号化するメディア符号化方法および装置を提供することにある。 SUMMARY OF THE INVENTION An object of the present invention is to provide a media encoding method and apparatus for encoding media data so as to obtain the highest possible media analysis accuracy in consideration of the network environment.
本発明の一態様によれば、ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化装置が、メディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力する符号化器と、前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力する入力部と、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成し、前記複数の符号化パラメータセット候補ごとに解析精度を算出し、前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する符号化パラメータセット決定部と、を有する。
本発明の他の態様によれば、ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化方法において、符号化器がメディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力し、符号化パラメータ決定部が、前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力し、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成し、前記複数の符号化パラメータセット候補ごとに解析精度を算出し、前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する。
本発明の更に別の態様によれば、ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化装置としてコンピュータを機能させるプログラムが、メディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力する機能と、前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力し、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成する機能と、前記複数の符号化パラメータセット候補ごとに解析精度を算出する機能と、前記算出された解析精度がより高い符号化パラメータセット候補を前記符号化パラメータセットとして決定する機能と、を前記コンピュータに実現する。
According to one aspect of the present invention, a media encoding device in a communication system that transmits encoded media data over a network includes an encoder that encodes media data according to a set of encoding parameters and outputs the encoded media data. an input unit for inputting an upper limit value of the encoding bit rate of the media data and information on an analysis method of the media data; and a plurality of encoding parameters under the conditions of the analysis method and the upper limit value of the encoding bit rate. generating set candidates, calculating analysis accuracy for each of the plurality of encoding parameter set candidates, and providing the encoding parameter set candidate with the higher calculated analysis accuracy as the encoding parameter set to the encoder; and a coding parameter set determination unit for determining.
According to another aspect of the present invention, there is provided a media encoding method in a communication system for transmitting encoded media data over a network, wherein an encoder encodes media data according to a set of encoding parameters and outputs the encoded media data. Then, the encoding parameter determination unit inputs the upper limit value of the encoding bit rate of the media data and information about the analysis method of the media data, and under the conditions of the analysis method and the upper limit value of the encoding bit rate generating a plurality of coding parameter set candidates, calculating analysis accuracy for each of the plurality of coding parameter set candidates, and providing a coding parameter set candidate with a higher calculated analysis accuracy to the encoder; Decide as a coding parameter set.
According to still another aspect of the present invention, a program causing a computer to function as a media encoding device in a communication system for transmitting encoded media data over a network encodes media data according to an encoding parameter set, A function to output data, an upper limit value of the encoding bit rate of the media data, and information on an analysis method of the media data are input, and a plurality of a function of generating a coding parameter set candidate; a function of calculating analysis accuracy for each of the plurality of coding parameter set candidates; and a determining function are realized in the computer.
本発明によれば、使用する解析方法と与えられたビットレート上限の中で、解析精度がより高くなる符号化パラメータセットを選択することができるので、ネットワーク環境を考慮し、できる限り高いメディア解析精度を得ることができる。 According to the present invention, it is possible to select an encoding parameter set with higher analysis accuracy within the analysis method to be used and the given upper limit of bit rate. Accuracy can be obtained.
<実施形態の概要>
本発明の実施形態によれば、使用する解析方法と与えられたビットレート上限の中で、解析精度が最も高くなる符号化パラメータセットを選択する。これによりビットレート上限が低い場合であっても、制限されたビットレートの範囲内で高い精度のメディア解析が可能となる。以下、本発明の実施形態について図面を参照しながら詳細に説明する。
<Overview of Embodiment>
According to an embodiment of the present invention, the coding parameter set that gives the highest analysis accuracy is selected for the analysis method used and given bit rate upper bound. As a result, even if the bit rate upper limit is low, highly accurate media analysis is possible within the limited bit rate range. BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
1.第1実施形態
1.1)構成
図1に例示するように、本発明の第1実施形態によるメディア符号化装置10は、メディアデータ入力部101と、符号化部102と、出力部103と、符号化パラメータ算出部104と、解析精度算出部105と、解析方法入力部106と、ビットレート入力部107から構成される。メディア符号化装置10において、符号化パラメータ算出部104および解析精度算出部105は、後述するように、本実施形態における符号化パラメータセット決定部を構成する。
1. First Embodiment 1.1) Configuration As illustrated in FIG. 1, a
メディアデータ入力部101は、例えばカメラやマイク等の入力装置やストレージ装置などに接続され、映像や音声といったメディアデータを入力する。
A media
符号化部102は、メディアデータ入力部101により入力されたメディアデータを、符号化パラメータ算出部104で算出したパラメータを用いて符号化する。例えばメディアデータが映像の場合には、H.264、H.265、モーションJPEG(Joint Photographic Experts Group)といった映像符号化方式を用いて符号化する。メディアデータが音声の場合には、G.711、AMR(Adaptive Multi-Rate)、AAC(Advanced Audio Coding)といった音声符号化方式を用いて符号化する。
The
出力部103は符号化されたメディアデータを出力するためのインタフェースである。例えば、出力部103は、有線LAN(Local Area Network)、無線LAN、LTE(Long Term Evolution)等のセルラネットワークの通信インタフェースであってもよい。あるいは、出力部103はメディア符号化装置10のスロットあるいはUSB(Universal Serial Bus)等のインタフェースであってもよい。すなわち、スロットに記憶装置を装着してもよいし、あるいはUSB等のインタフェースに外部記憶装置を着脱可能に接続してもよい。
The
符号化パラメータ算出部104は、解析方法入力部106およびビットレート入力部107から入力された条件に基づいて符号化パラメータセット候補を生成し解析精度算出部105へ出力する。解析精度算出部105から各候補に対する解析精度を入力すると、符号化パラメータ算出部104は、そのなかで解析精度が最も高くなる符号化パラメータセットを決定して符号化部102へ指示する。符号化パラメータ算出部104の符号化パラメータセット決定機能は、メディア符号化装置10のプロセッサ(CPU(Central Processing Unit)等)上で、図示しないメモリに格納されたプログラムを実行することにより実現することも可能である。
Coding
解析精度算出部105は、符号化パラメータ算出部104から符号化パラメータセット候補を入力し、各セット候補に対する解析精度(あるいはその予測値)を算出して符号化パラメータ算出部104へ返す。解析精度算出部105には、解析方法に対応する解析精度計算式が予め用意されていてもよいし、あるいは、符号化パラメータセット候補に対する解析精度の予測値が学習により生成され、保持されていてもよい。解析精度算出部105の機能は、メディア符号化装置10のプロセッサ上で、図示しないメモリに格納されたプログラムを実行することにより実現することも可能である。
Analysis
解析方法入力部106は、受信側で採用されるメディア解析方法あるいは実際に使用する解析エンジン等を識別する情報を入力する。入力方法としては、メディア符号化装置10あるいはそれを搭載した情報処理装置が有するタッチパネル等の入出力デバイス(図示せず)を用いる方法や、出力部103が通信インタフェースであれば、受信側からメッセージを受け取る方法などが考えられる。メディアデータが映像の場合、解析方法は、たとえば顔認識、物体認識、物体の動き認識等を示す。メディアデータが音声であれば、解析方法は、音声認識、話者認識等を示す。これらの解析方法の場合、解析精度算出部105が算出する解析精度は、例えば正しく認識できる割合(認識率)あるいはその予測値である。
The analysis
ビットレート入力部107は、メディアデータの符号化ビットレートの上限値の入力を受け付ける。入力方法は解析方法入力部106の場合と同様である。符号化ビットレートの上限値は、出力部103が接続しているネットワークの物理帯域、受信装置(図示せず)との間で過去に計測した通信速度から算出するか、あるいは統計データに基づく未来の通信速度の予測値として算出してもよい。また、他のアプリケーションの使用分を考慮して、これらの値に対して0以上1以下の規定値を掛けた値や、規定値を引いた値としてもよい。ビットレート上限値は、数百ミリ秒から数十秒程度の周期で、あるいは、ネットワーク状態の変動を検知したタイミングで、変更してもよい。メディア符号化装置10に接続された外部記憶装置に出力する場合には、外部記憶装置の容量または残容量、保存するデータ長(時間)をもとに算出してもよい。例えば、外部記憶装置の容量が1GB (Gigabyte)、保存すべきデータ長が1時間であれば、ビットレート上限値は、1 [GB] × 1,000 [MB(Megabyte)/GB] × 8 [bit/byte] / 3,600 [second] = 2.222 [Mbps (Migabit per second)] になる。
The bit
以下、図2~図4を参照しながら、本実施形態によるメディア符号化装置10の動作について説明する。
The operation of the
1.2)動作
<メディア符号化>
図2に例示するように、メディアデータ入力部101からメディアデータが入力されると(動作S201)、符号化パラメータ算出部104は、解析方法入力部106およびビットレート入力部107から解析方法およびビットレートをそれぞれ読み込む(動作S202、S203)。続いて、符号化パラメータ算出部104は、後述する手順で符号化パラメータセットを決定し、符号化部102へ指示する(動作S204)。
1.2) Operation <Media encoding>
As illustrated in FIG. 2, when media data is input from the media data input unit 101 (operation S201), the encoding
符号化部102は、符号化パラメータ算出部104により指示された符号化パラメータセットを用いて、メディアデータ入力部101から受け取ったメディアデータを符号化し(動作S205)、出力部103へ渡す。出力部103は、符号化部102から受け取った符号化されたメディアデータを出力する(動作S206)。メディア符号化装置10の動作が停止される(動作S207のYES)まで、上記動作S201~S206が繰り返される(動作S207のNO)。
The
なお、解析方法およびビットレートが変更されない場合には、直前の符号化パラメータセットをそのまま使用することができる。したがって、解析方法あるいはビットレートの入力値が変更された場合のみ、動作S202~S204を実行するように制御することもできる。 Note that if the analysis method and bit rate are not changed, the previous encoding parameter set can be used as is. Therefore, it is also possible to control the operations S202 to S204 to be executed only when the input value of the analysis method or bit rate is changed.
<符号化パラメータセット決定>
次に、上述した符号化パラメータセット決定動作S204のより詳細な動作を図3および図4を参照しながら説明する。
<Encoding parameter set determination>
Next, a more detailed operation of the encoding parameter set determination operation S204 described above will be described with reference to FIGS. 3 and 4. FIG.
図3に例示するように、符号化パラメータ算出部104は、解析方法およびビットレートをそれぞれ入力すると(図2の動作S202、S203)、入力した解析方法およびビットレートに基づいて、後述するように符号化パラメータセットの候補を生成する(動作S301)。続いて、生成した符号化パラメータセット候補の各々を解析精度算出部105へ出力することで、各候補に対する解析精度の推定値を得る(動作S302、S303)。すべての符号化パラメータセットに対する解析精度を取得すると、符号化パラメータ算出部104は、解析精度が最も高くなる符号化パラメータセットを決定し、符号化部102へ出力する(動作S304)。
As exemplified in FIG. 3, when the analysis method and bit rate are input (operations S202 and S203 in FIG. 2), the encoding
解析精度算出部105には、解析精度を算出するための関数fが予め定義されていてもよい。あるいは、ディープラーニング等を用いて、符号化パラメータセット候補と解析精度aとの対応を予め学習しておき、入力された値に対する解析精度aの予測値を出力してもよい。
A function f for calculating the analysis accuracy may be defined in advance in the analysis
以下、メディアデータが映像の場合を一例として、符号化パラメータセット決定方法を示す。この例では、ビットレート入力部107から入力されたビットレートの上限が1.5Mbpsであり、変更可能な符号化パラメータが映像のビットレートとフレームレートであるものとする。一般に映像のビットレートが高くなるほど画質が向上し、解析精度も向上するため、ビットレートは入力された上限値である1.5Mbpsに固定する。また、フレームレートは1~30の間の値とする。1~30の間のすべての整数を候補としてもよいが、特にフレームレートの高い領域では、少しの違いであれば画質への影響は小さいため、すべてのフレームレートを候補とせずに、代表的な値をサンプリングしてもよい。これにより、演算量の低減が可能となり、処理能力の低い端末でも利用可能となる。図4に示す例では、符号化パラメータセットの候補が11種類のビットレート・フレームレートの組からなるものとする。
A coding parameter set determination method will be described below using a case where media data is video as an example. In this example, the upper limit of the bit rate input from the bit
図4に例示するように、解析精度算出部105は、11種類の符号化パラメータセット候補の各々に対して解析精度(の予測値)を生成する。たとえば、解析精度を計算式で算出できる場合には、解析精度算出部105に解析精度を算出する関数fを定義することができる。関数fは、解析方法(解析エンジンの種類)をk、ビットレートをrb、フレームレートをrf、解析精度をaとしたとき、
a = f(k, rb, rf)
で定義される。したがって、解析精度算出部105は、解析方法kと符号化パラメータセット候補(rb、rf)とが与えられると、上記式を用いて解析精度(の予測値)aを算出することができる。計算式ではなくディープラーニング等を用いて、符号化パラメータセット候補(rb、rf)と解析精度aとの対応を予め学習し、解析精度テーブルとして保持しても良い。与えられた符号化パラメータセット候補(rb、rf)に従って解析精度テーブルをサーチすることで対応する解析精度の予測値aを出力することができる。
As illustrated in FIG. 4, the analysis
a = f(k, rb, rf)
defined by Therefore, when analysis method k and coding parameter set candidates (rb, rf) are given, analysis
こうして得られた各候補に対する解析精度を比較することで、最も精度が高くなる符号パラメータを決定することができる。図4に示す例では、解析精度a=90%が最も高くなるので、7番目の符号化パラメータセット(1.5Mbps/10fps(frame per second))が決定される。 By comparing the analysis accuracy for each candidate thus obtained, the code parameter with the highest accuracy can be determined. In the example shown in FIG. 4, the analysis accuracy a=90% is the highest, so the seventh coding parameter set (1.5 Mbps/10 fps (frame per second)) is determined.
なお、H.264とモーションJPEGといった複数の符号化方法が利用できる場合には、符号化方法eを解析精度算出部105の関数fのパラメータに追加し、関数fを
a = f(k, rb, rf, e)
と定義してもよい。この場合、eを変更したケースも符号化パラメータセットの候補に追加される。あるいは、上述したように、符号化方法eを変更した符号化パラメータセット候補と解析精度aとの対応を予め解析精度テーブルに格納して解析精度aを算出してもよい。
It should be noted that H. H.264 and motion JPEG can be used, the encoding method e is added to the parameter of the function f of the analysis
a = f(k, rb, rf, e)
may be defined as In this case, the case where e is changed is also added to the coding parameter set candidates. Alternatively, as described above, the analysis accuracy a may be calculated by storing in advance the correspondence between the encoding parameter set candidate for which the encoding method e is changed and the analysis accuracy a.
1.3)効果
上述したように、本発明の第1実施形態によれば、使用する解析エンジンにおいて、与えられたビットレート上限で、変更可能な符号化パラメータ毎に符号化パラメータセット候補を生成する。そして、符号化パラメータセット候補毎に解析精度を算出し、その中で最も高い解析精度を示す符号化パラメータセットを符号化に用いるパラメータセットとして決定する。そのため、ビットレート上限が低い場合であっても、制限されたビットレートの範囲内で最も高い精度のメディア解析が可能となる。
1.3) Effect As described above, according to the first embodiment of the present invention, the analysis engine used generates coding parameter set candidates for each changeable coding parameter at a given bit rate upper limit. do. Then, the analysis accuracy is calculated for each encoding parameter set candidate, and the encoding parameter set exhibiting the highest analysis accuracy is determined as the parameter set to be used for encoding. Therefore, even if the bit rate upper limit is low, media analysis with the highest accuracy is possible within the limited bit rate range.
2.第2実施形態
本発明の第2実施形態によれば、複数種類の解析エンジンを同時に使用する点で第1実施形態と異なる。従って、本実施形態によるメディア符号化装置10Aは、第1実施形態によるメディア符号化装置10と基本的な構成は同様であるが、符号化パラメータセット決定部の機能が異なる。以下、同一機能を有するブロックには同一参照番号を付して説明は簡略化し、第1実施形態と異なる構成および機能について主に説明する。
2. Second Embodiment A second embodiment of the present invention differs from the first embodiment in that a plurality of types of analysis engines are used simultaneously. Therefore, the media encoding device 10A according to this embodiment has the same basic configuration as the
2.1)構成
図5に例示するように、本実施形態によるメディア符号化装置10Aは、メディアデータ入力部101と、符号化部102と、出力部103と、符号化パラメータ算出部104Aと、解析精度算出部105Aと、解析方法入力部106と、ビットレート入力部107から構成される。メディア符号化装置10Aにおいて、符号化パラメータ算出部104Aおよび解析精度算出部105Aは、後述するように、本実施形態における符号化パラメータセット決定部を構成する。
2.1) Configuration As illustrated in FIG. 5, a media encoding device 10A according to the present embodiment includes a media
本実施形態では、解析方法入力部106から複数(n個)の解析エンジンの種類k(1)~k(n)と、それぞれの解析エンジンの重みw(1)~w(n)が入力される(nは2以上の整数)。解析精度算出部105Aには、それぞれの解析エンジンの種類k(i)に対応する解析精度算出のための関数fiが予め用意されているものとする。
In this embodiment, a plurality (n) of analysis engine types k(1) to k(n) and weights w(1) to w(n) of the respective analysis engines are input from the analysis
2.2)動作
メディア符号化装置10Aの全体的動作は図2に示す通りである。以下、本実施形態による符号化パラメータセット決定動作(図2のS204に対応する動作)を図6および図7を参照しながら説明する。
2.2) Operation The overall operation of the media encoding device 10A is as shown in FIG. The encoding parameter set determination operation (operation corresponding to S204 in FIG. 2) according to the present embodiment will be described below with reference to FIGS. 6 and 7. FIG.
図6に例示するように、符号化パラメータ算出部104Aは、入力した解析方法k(i)およびビットレートrbに基づいて、上述したように符号化パラメータセットの候補を生成する(動作S301)。なお、iは1以上n以下の任意の整数である。続いて、符号化パラメータ算出部104Aは、解析方法k(i)と生成した符号化パラメータセット候補の各々とを解析精度算出部105Aへ出力し、各候補に対する解析精度の推定値a(i)を得る(動作S302A、S303A)。
As illustrated in FIG. 6, the
各解析方法k(i)での各符号化パラメータセットに対する解析精度a(i)を取得すると、符号化パラメータ算出部104Aは、各解析精度a(i)に当該解析エンジンの重みw(i)を乗じた値の重み付き和を計算し、当該重荷付け和を解析精度aとする。符号化パラメータ算出部104Aは、当該解析精度aが最も高くなる符号化パラメータセットを決定し、それを符号化部102へ出力する(動作S304A)。各解析エンジンk(i)に対応する重みw(i)を相対的に変更することで、符号化するメディアデータの用途に応じた解析精度に設定可能である。
After acquiring the analysis accuracy a(i) for each encoding parameter set in each analysis method k(i), the encoding
以下、メディアデータが映像の場合を一例として、本実施形態による符号化パラメータセット決定方法を示す。この例では、上述した第1実施形態と同様に、ビットレート入力部107から入力されたビットレートの上限が1.5Mbpsであり、変更可能な符号化パラメータが映像のビットレートとフレームレートであるものとする。また、図7に示す例では、符号化パラメータセットの候補が11種類のビットレート・フレームレートの組からなるものとする。
The encoding parameter set determination method according to the present embodiment will be described below, taking the case where the media data is video as an example. In this example, as in the first embodiment described above, the upper limit of the bit rate input from the bit
説明の煩雑化を避けるために、一例として、解析エンジンをk(1)、k(2)の2種類(n=2)とし、それぞれの重みw(1)=0.6、w(2)=0.4とする。また、それぞれの解析エンジンに対応した解析精度a1およびa2を算出するための関数f1、f2が以下のように定義されているものとする。
a1 = f1(k1, rb, rf)
a2 = f2(k2, rb, rf)
To avoid complicating the explanation, as an example, two types of analysis engines, k(1) and k(2) (n=2), are weighted w(1)=0.6 and w(2). = 0.4. It is also assumed that functions f1 and f2 for calculating analysis accuracies a1 and a2 corresponding to the respective analysis engines are defined as follows.
a1 = f1(k1, rb, rf)
a2 = f2(k2, rb, rf)
解析精度算出部105Aは、符号化パラメータ算出部104Aから解析エンジンの種類を示す値k(i)、ビットレートrb、フレームレートrfを与えられると、上記関数f1およびf2を用いて、それぞれの解析精度a1およびa2を算出する。これらの解析精度a1およびa2は、それぞれ対応する重みw(1)=0.6およびw(2)=0.4が乗算され、その結果が加算されることで、解析精度aを得る:
a = 0.6 a1 + 0.4 a2。
When the analysis
a = 0.6a1 + 0.4a2.
こうして符号化パラメータセットの各々に対して解析精度aが得られると、これらの解析精度aのうち最も高い解析精度を示すパラメータセットを符号化器102へ与える符号化パラメータセットとして決定する。なお、上記関数f1、f2を定義する代わりに、第1実施形態で述べたように解析精度テーブルを用意して解析精度a1およびa2を算出してもよい。
When the analysis accuracy a is obtained for each of the encoding parameter sets in this way, the parameter set showing the highest analysis accuracy among these analysis accuracy a is determined as the encoding parameter set to be given to the
図7に示す例において、解析エンジン1は、フレームレートが上昇するに従って解析精度が向上するが、フレームレートを上げ過ぎると1フレームあたりの情報量が低下し解析精度が低下する特性を有する。このような解析エンジン1としては、例えば物体の動き認識エンジンがある。解析エンジン2はフレームレートが低くフレーム当たりの情報量が大きいほど解析精度が向上する特性があり、例えば顔認識エンジンである。
In the example shown in FIG. 7, the
こうして得られた各候補に対する解析精度aを比較することで、最も精度が高くなる符号パラメータセットを決定することができる。図7に示す例では、解析精度a=76%が最も高くなるので、5番目の符号化パラメータセット(1.5Mbps/5fps)が決定される。 By comparing the analysis accuracy a for each candidate thus obtained, a code parameter set with the highest accuracy can be determined. In the example shown in FIG. 7, the analysis accuracy a=76% is the highest, so the fifth coding parameter set (1.5 Mbps/5 fps) is determined.
本実施形態では、解析エンジンを2種類(n=2)としたが、3種類以上の解析エンジンを用いる場合であっても、同様の方法で最適なパラメータセットを選択できる。 In this embodiment, there are two types of analysis engines (n=2), but even when three or more types of analysis engines are used, the optimum parameter set can be selected in a similar manner.
2.3)効果
上述したように、本発明の第2実施形態によれば、複数の解析エンジンの各々について推定された解析精度の重み付き和が最大になるようにパラメータセットを選択する。これにより、単一のメディアデータに対して複数の解析エンジンを適用する場合の解析精度を向上させることができる。特に、各解析エンジンk(i)の重みw(i)を変更することで、用途に応じたパラメータセットの選択が可能になるという利点がある。
2.3) Effect As described above, according to the second embodiment of the present invention, a parameter set is selected such that the weighted sum of the analysis accuracies estimated for each of the plurality of analysis engines is maximized. As a result, it is possible to improve analysis accuracy when applying a plurality of analysis engines to single media data. In particular, by changing the weight w(i) of each analysis engine k(i), there is an advantage that a parameter set can be selected according to the application.
3.第3実施形態
本発明の第3実施形態によるメディア符号化装置は、基本的な構成および動作に関しては、上述した第2実施形態と同様であるが、階層符号化技術を用いてメディアデータを符号化し、階層符号化のパラメータセットを決定する点で異なる。以下、同一機能を有するブロックには同一参照番号を付して説明は簡略化し、第2実施形態と異なる構成および機能について主に説明する。
3. Third Embodiment A media encoding apparatus according to a third embodiment of the present invention is similar in basic configuration and operation to the above-described second embodiment, but encodes media data using hierarchical encoding technology. It differs in that it converts and determines the parameter set for hierarchical coding. Hereinafter, blocks having the same functions are denoted by the same reference numerals to simplify the description, and mainly the configurations and functions different from those of the second embodiment will be described.
3.1)構成
図8に例示するように、本実施形態によるメディア符号化装置10Bは、メディアデータ入力部101と、階層符号化部102Bと、出力部103と、符号化パラメータ算出部104Bと、解析精度算出部105Bと、解析方法入力部106と、ビットレート入力部107から構成される。階層符号化部102Bは、次に述べるように、メディアデータを基本階層およびL階層(Lは1以上n以下の整数)の拡張階層に符号化する。
3.1) Configuration As illustrated in FIG. 8, a media encoding device 10B according to the present embodiment includes a media
図9に模式的に示すように、階層符号化では、入力されたメディアデータを基本階層0と拡張階層1~Lとに符号化する。拡張階層は基本階層の品質を向上させるための差分データであり、使用する拡張階層数を増やすほどデータ量(ビットレート)が増大するがメディア品質は向上する。映像の階層符号化の場合、H.264の拡張規格であるH.264/SVC、H.265(HEVC: High Efficiency Video Coding)の拡張規格であるSHVC(Scalable HEVC)などが階層映像符号化規格として定められている。音声の場合、AACの拡張規格であるAAC-SSR(Scalable Sampling Rate)などが階層音声符号化規格として定められている。
As schematically shown in FIG. 9, in hierarchical encoding, input media data is encoded into basic layer 0 and
符号化パラメータ算出部104Bおよび解析精度算出部105Bは、本実施形態における符号化パラメータセット決定部を構成する。解析精度算出部105Bには、複数(n個)の解析エンジンk(1)~k(n)にそれぞれ対応した解析精度算出のための関数f1~fnが予め用意されているものとする。また、符号化パラメータ算出部104Bは、解析方法入力部106から複数の解析エンジンの種類を入力し、ビットレート入力部17からビットレートの上限値を入力する。
The encoding
<符号化パラメータセットの比較>
図10Aは、上述した第2実施形態で選択した符号化パラメータセットでの情報量を例示したものであり、図10Bは、本実施形態における階層符号化を使用した場合の符号化パラメータセットでの情報量を例示したものである。ビットレートはどちらも1.5Mbpsとする。
<Comparison of encoding parameter sets>
FIG. 10A illustrates the amount of information in the encoding parameter set selected in the second embodiment described above, and FIG. This is an example of the amount of information. Both bit rates are assumed to be 1.5 Mbps.
図10Aに示すように、本発明の第2実施形態において決定された符号化パラメータセット(1.5Mbps/5fps;図7参照)では、平均して1フレームあたり0.3Mbitの情報量となる。 As shown in FIG. 10A, the encoding parameter set (1.5 Mbps/5 fps; see FIG. 7) determined in the second embodiment of the present invention has an average information amount of 0.3 Mbit per frame.
これに対して、階層数2の階層符号化を使用する本実施形態によれば、図10Bに例示するように、基本階層が1.25Mbps/5fps、拡張階層1が0.25Mbps/1fpsの組み合わせであれば、先頭フレームの情報量は基本階層と拡張階層1とを合わせて0.5Mbitとなる。したがって、フレームレートが低いほど(すなわち、1フレームあたりの情報量が多いほど)解析精度の向上する解析エンジンが先頭フレームを解析することで、その解析精度が大きく向上するものと期待できる。先頭フレーム以外の情報量は若干減少するものの、この程度の低下では解析精度の大幅な低下はないと考えられるため、結果的に解析精度の重み付き和の向上が期待できる。
On the other hand, according to this embodiment using hierarchical coding with the number of
3.2)動作
メディア符号化装置10Bの全体的動作は図2に示す通りであり、本実施形態による符号化パラメータセット決定動作は図2の動作S204に対応する。本実施形態によれば、予め定めた条件に基づいて、符号化パラメータセットの候補を生成し、各候補に対して解析精度の重み付き和を算出し、最も高くなったパラメータセットを出力する。以下、本実施形態による符号化パラメータセット決定動作について、図11を参照しながら説明する。
3.2) Operation The overall operation of the media encoding device 10B is as shown in FIG. 2, and the encoding parameter set determination operation according to this embodiment corresponds to operation S204 in FIG. According to this embodiment, encoding parameter set candidates are generated based on predetermined conditions, a weighted sum of analysis accuracies is calculated for each candidate, and the highest parameter set is output. The encoding parameter set determination operation according to this embodiment will be described below with reference to FIG.
図11において、階層数jを最小値1から最大値L+1の間で順次設定する(動作S401)。ここで、L+1は1以上n以下の整数であり、nは解析エンジン数である。最大値を解析エンジン数nとすれば、階層数jを最小値1から最大値nまでの間で1ずつ増やしながら、以下の動作S402~S404を繰り返す。
In FIG. 11, the hierarchy number j is sequentially set between the
まず、階層数jにおける階層のビットレートの組み合わせ候補(以下、BR組合せ候補pという。)を順次選択する(動作S402)。例えば、階層数j=2でビットレート(BR)の上限値が1.5Mbpsの場合、所定のBR単位で複数のBR組合せ候補pを生成することができる。たとえば、0.25Mbps単位であれば、候補p=(基本階層0のBR,拡張階層1のBR)と表記して、
候補p1=(0.75Mbps,0.75Mbps)、
候補p2=(1.0Mbps,0.5Mbps)、
候補p3=(1.25Mbps,0.25Mbps)、
を生成できる。あるいは、基本階層0のビットレートを0.1Mbpsから0.1Mbps単位で増加させながら、複数のBR組合せ候補を生成してもよい。このように生成されたBR組合せ候補から一つの候補を順次選択する。
First, bit rate combination candidates (hereinafter referred to as BR combination candidates p) in the hierarchy number j are sequentially selected (operation S402). For example, when the number of hierarchies j=2 and the upper limit of the bit rate (BR) is 1.5 Mbps, a plurality of BR combination candidates p can be generated for each predetermined BR. For example, in units of 0.25 Mbps, candidate p = (BR of basic layer 0, BR of extended layer 1)
Candidate p1 = (0.75 Mbps, 0.75 Mbps),
Candidate p2 = (1.0 Mbps, 0.5 Mbps),
Candidate p3 = (1.25 Mbps, 0.25 Mbps),
can generate Alternatively, a plurality of BR combination candidates may be generated while increasing the bit rate of basic layer 0 from 0.1 Mbps by 0.1 Mbps. One candidate is sequentially selected from the BR combination candidates thus generated.
続いて、設定された階層数jと選択されたBR組合せ候補pの条件下で、各階層への解析エンジンの割当て候補(以下、E割当て候補qという。)を順次選択する(動作S403)。例えば、階層数j=2で解析エンジン数n=3の場合、どの階層にどの解析エンジンを割り当てるかで複数のE割当て候補qを生成しうる。1つの階層に複数の解析エンジンを割り当てるともできる。たとえば、基本階層0に解析エンジンE1およびE2を割り当て、拡張階層1に解析エンジンE3を割り当てることも可能である。各階層に少なくとも一つの解析エンジンを割り当てることで、すべての割当て候補を生成してもよい。
Subsequently, under the conditions of the set number of layers j and the selected BR combination candidate p, candidates for allocation of the analysis engine to each layer (hereinafter referred to as E allocation candidates q) are sequentially selected (operation S403). For example, when the number of hierarchies is j=2 and the number of analysis engines is n=3, a plurality of E assignment candidates q can be generated depending on which analysis engine is assigned to which hierarchy. Multiple analysis engines can be assigned to one hierarchy. For example, base tier 0 may be assigned analysis engines E1 and E2, and
上述したように、設定された階層数j、選択されたBR組合せ候補pおよびE割当て候補qの条件下で、解析精度が最も高くなるようにフレームレートFR(j,p,q)を決定する(動作S404)。フレームレートは、第1実施形態で述べたように、変更可能な範囲のすべての整数を候補としてもよいが、代表的な値を候補としてサンプリングしてもよい。なお、階層数jが2以上の場合、解析精度は、拡張階層以下のすべての階層を使用したものとして算出する(図9参照)。また、二つ以上の解析エンジンが割り当てられた階層については、第2実施形態と同様に、重み付き和が最大となるフレームレートを求める。 As described above, the frame rate FR (j, p, q) is determined so as to maximize the analysis accuracy under the conditions of the set number of layers j, the selected BR combination candidate p, and the E allocation candidate q. (Operation S404). For the frame rate, as described in the first embodiment, all integers within a changeable range may be used as candidates, but representative values may be sampled as candidates. When the number of layers j is 2 or more, the analysis accuracy is calculated assuming that all layers below the extended layer are used (see FIG. 9). Also, for a layer to which two or more analysis engines are assigned, the frame rate that maximizes the weighted sum is obtained as in the second embodiment.
以上述べたように、全てのE割当て候補qについて解析精度が最も高くなるフレームレートを決定すると(S403、S404)、次のBR組合せ候補pを選択して(動作S402)、動作S403およびS404を繰り返し、全てのBR組合せ候補pが完了すると、階層数jをインクリメントして(動作S401)、上記動作S402~S404を繰り返す。 As described above, when the frame rate with the highest analysis accuracy is determined for all E allocation candidates q (S403, S404), the next BR combination candidate p is selected (operation S402), and operations S403 and S404 are performed. Repeatedly, when all BR combination candidates p are completed, the hierarchy number j is incremented (operation S401), and the above operations S402 to S404 are repeated.
こうして、各候補に対するフレームレートFRが算出されると、上記第2実施形態で述べたように解析精度を算出し、各階層で得られた解析精度あるいは複数の解析エンジンを使用する場合はそれらの解析精度の重み付き和が最も高くなるパラメータセット(階層数j、各階層のビットレートBRおよびフレームレートFR、各階層に割り当てる解析エンジンE)を決定する(動作S405)。 Thus, when the frame rate FR for each candidate is calculated, the analysis accuracy is calculated as described in the second embodiment, and the analysis accuracy obtained in each layer or when using a plurality of analysis engines, A parameter set (layer number j, bit rate BR and frame rate FR of each layer, analysis engine E assigned to each layer) that gives the highest weighted sum of analysis accuracy is determined (operation S405).
3.3)効果
上述したように、本発明の第3実施形態によるメディア符号化装置10Bは、階層符号化技術を用いて符号化を行う場合にも、上記第2実施形態と同様に、各階層で得られた解析エンジンの解析精度あるいは複数の解析エンジンの各々について推定された解析精度の重み付き和が最大になるように階層符号化パラメータセットを選択する。これにより、階層符号化メディアに対して複数の解析エンジンを適用する場合の解析精度を向上させることができる。
3.3) Effect As described above, the media encoding device 10B according to the third embodiment of the present invention performs encoding using the layered encoding technique in the same manner as in the second embodiment. A hierarchical encoding parameter set is selected such that the analysis accuracy of the analysis engine obtained in the hierarchy or the weighted sum of the analysis accuracy estimated for each of the plurality of analysis engines is maximized. As a result, it is possible to improve analysis accuracy when applying a plurality of analysis engines to hierarchically encoded media.
4.第4実施形態
本発明の第4実施形態によるメディア符号化装置は、第1~第3実施形態によるメディア符号化装置と基本的な構成は同様であるが、メディア解析部を有する点で異なる。本実施形態によるメディア符号化装置は、メディア解析を行い、その結果を用いて符号化パラメータセット決定を行う。したがって、本実施形態は、メディア符号化装置の処理能力が比較的高い場合に適用することができる。以下、同一機能を有するブロックには同一参照番号を付して説明は簡略化し、第1~第3実施形態と異なる構成および機能について主に説明する。
4. Fourth Embodiment A media encoding device according to a fourth embodiment of the present invention has the same basic configuration as the media encoding devices according to the first to third embodiments, but differs in that it has a media analysis section. The media encoding device according to the present embodiment performs media analysis and uses the result to determine the encoding parameter set. Therefore, this embodiment can be applied when the processing capability of the media encoding device is relatively high. Hereinafter, blocks having the same functions are denoted by the same reference numerals to simplify the description, and mainly the configurations and functions different from those of the first to third embodiments will be described.
4.1)構成
図12に例示するように、本実施形態によるメディア符号化装置10Cは、メディアデータ入力部101と、符号化部102と、出力部103と、符号化パラメータ算出部104Cと、解析精度算出部105Cと、解析方法入力部106と、ビットレート入力部107と、メディア解析部108と、から構成される。メディア解析部108は、メディアデータ入力部101および符号化部102からそれぞれ入力されたメディアデータおよび符号化後のメディアデータを取得し、メディアデータの特徴量を符号化パラメータ算出部104Cへ出力する。メディア符号化装置10Cにおいて、符号化パラメータ算出部104C、解析精度算出部105Cおよびメディア解析部108は、後述するように、本実施形態における符号化パラメータセット決定部を構成する。
4.1) Configuration As illustrated in FIG. 12, a media encoding device 10C according to the present embodiment includes a media
4.2)動作
図13に例示するように、メディア符号化装置10Cは、図2に示す全体的動作をほぼ同じであるが、メディア解析部108によるメディアデータ解析動作(動作S501)を実行した後に、符号化パラメータセット決定動作(動作S502)を実行する点が異なっている。
4.2) Operation As illustrated in FIG. 13, the media encoding device 10C has almost the same overall operation as that shown in FIG. The difference is that the coding parameter set determination operation (operation S502) is executed later.
メディア解析部108は、メディアデータ入力部101からメディアデータを、符号化部102から符号化後のメディアデータをそれぞれ入力し、メディアデータの特徴量cを算出する。特徴量cは、画面の明るさ、動きの大きさなどである。画面の明るさは、入力されたメディアデータの各ピクセルの明度の平均値等を用いて算出することが可能である。また、動きの大きさは、メディアデータの時間差分あるいはフレーム間の差分情報に基づいて符号化されたデータから、動きベクトル情報を抽出することで算出可能である。算出された特徴量cは符号化パラメータ算出部104Cへ通知される。
The
符号化パラメータ算出部104Cは、メディア解析部108から受け取った特徴量を用いて符号化パラメータセットを決定する。以下、メディアデータが映像の場合を一例として、符号化パラメータセット決定動作について説明する。
The encoding
解析精度算出部105Cは、すでに述べたように、解析精度を計算式で算出できる場合には、解析精度を算出する関数fが定義されている。関数fは、解析方法(解析エンジンの種類)をk、ビットレートをrb、フレームレートをrf、映像の特徴量をc、解析精度をaとしたとき、
a = f(k, rb, rf, c)
で定義される。したがって、解析精度算出部105は、解析方法kと符号化パラメータセット候補(rb、rf)と特徴量cが与えられると、上記式を用いて解析精度(の予測値)aを算出することができる。
計算式ではなくディープラーニング等を用いて、符号化パラメータセット候補(rb、rf)と特徴量cと解析精度aとの対応を予め学習してテーブルに格納しておき、入力された値に対応する解析精度aの予測値を出力してもよい。
As already described, the analysis
a = f(k, rb, rf, c)
defined by Therefore, when the analysis method k, the coding parameter set candidate (rb, rf), and the feature amount c are given, the analysis
Using deep learning, etc., instead of formulas, learn in advance the correspondence between coding parameter set candidates (rb, rf), feature amount c, and analysis accuracy a, store it in a table, and correspond to the input value A predicted value of the analysis accuracy a may be output.
また、H.264とモーションJPEGといった複数の符号化方法が利用できる場合には、符号化方法eを解析精度算出部105の関数fのパラメータに追加し、関数fを
a = f(k, rb, rf, e, c)
と定義してもよい。この場合、eを変更したケースも符号化パラメータセットの候補に追加される。
Also, H.I. H.264 and motion JPEG can be used, the encoding method e is added to the parameter of the function f of the analysis
a = f(k, rb, rf, e, c)
may be defined as In this case, the case where e is changed is also added to the coding parameter set candidates.
<動作例>
本実施形態によるメディア符号化装置10Cの動作の一例として、解析エンジンk1が顔認識、解析エンジンk2が物体の動きトラッキングの場合を説明する。この場合、解析エンジンk1およびk2のそれぞれに対応した解析精度a1およびa2は、以下の解析精度関数f1、f2を用いて算出するものとする。
a1 = f1(k1, rb, rf, c)
a2 = f2(k2, rb, rf, c)
<Operation example>
As an example of the operation of the media encoding device 10C according to the present embodiment, a case where the analysis engine k1 performs face recognition and the analysis engine k2 performs motion tracking of an object will be described. In this case, the analysis accuracies a1 and a2 respectively corresponding to the analysis engines k1 and k2 are calculated using the following analysis accuracy functions f1 and f2.
a1 = f1(k1, rb, rf, c)
a2 = f2(k2, rb, rf, c)
解析エンジンk1(顔認識)に対応する関数f1は、特徴量cが顔を十分に認識できないほど明るい(白飛び)あるいは暗い(黒つぶれ)画像を示す場合(例えば逆光時)、有効な顔認識が行えないので、解析精度a1の値は、rbやrfの値が変化しても固定値、例えばゼロとなる。これに対して、解析エンジンk2(物体の動きトラッキング)に対応する関数f2は、同様の特徴量cに対しては解析精度a2の値に影響しない。このような解析エンジンk1およびk2を受信側で使用する場合、解析精度a1およびa2の重み付き和が最も高くなるパラメータセットを符号化パラメータセットとして決定する。これによって、解析エンジンk2による物体の動きトラッキングに適した符号化パラメータセットを設定することができる。 The function f1 corresponding to the analysis engine k1 (face recognition) is effective for face recognition when the feature value c indicates an image that is too bright (overexposed) or too dark (overexposed black) to recognize the face (for example, when backlighting). cannot be performed, the value of the analysis accuracy a1 is a fixed value, for example zero, even if the values of rb and rf change. On the other hand, the function f2 corresponding to the analysis engine k2 (object motion tracking) does not affect the value of the analysis accuracy a2 for the similar feature amount c. When such analysis engines k1 and k2 are used on the receiving side, the parameter set with the highest weighted sum of the analysis accuracies a1 and a2 is determined as the encoding parameter set. This makes it possible to set a coding parameter set suitable for object motion tracking by the analysis engine k2.
逆に、解析エンジンk2による物体の動きトラッキングは、動きが小さい映像では重要性が小さくなり、解析エンジンk1(顔認識)の方が、低いフレームレートでも有効に機能する。したがって、特徴量cが動きの小さい画像を示す場合、解析エンジンk2(物体の動きトラッキング)に対応する関数f2は、解析精度a2の値は、rbやrfの値が変化しても固定値、例えばゼロとなる。このような動きが小さい映像の場合には、解析精度a1およびa2の重み付き和が最も高くなる符号化パラメータセットを決定することで、解析エンジンk1による顔認識に適した符号化パラメータセットを設定することができる。 Conversely, object motion tracking by analysis engine k2 becomes less important for videos with small movements, and analysis engine k1 (face recognition) functions more effectively even at low frame rates. Therefore, when the feature value c indicates an image with small motion, the function f2 corresponding to the analysis engine k2 (movement tracking of the object) is a fixed value of the analysis accuracy a2 even if the values of rb and rf change. For example zero. In the case of such a video with small movements, an encoding parameter set suitable for face recognition by the analysis engine k1 is set by determining the encoding parameter set that maximizes the weighted sum of the analysis accuracies a1 and a2. can do.
なお、メディア解析部108の機能を解析精度算出部105Cに設けることもできる。すなわち、メディアデータ自体をパラメータとして、解析精度算出部105Cが特徴量を算出してもよい。
Note that the function of the
4.3)効果
本発明の第4実施形態によれば、メディアの特徴量を考慮することで、複数の解析エンジンの重み付き解析精度の和をさらに向上させることが可能となる。上述したように、ある解析エンジンが暗い映像ではビットレートを上げても解析精度が向上しない特性を有する場合、暗い映像でも有効に機能する解析エンジンに適した符号化パラメータセットとすることで解析精度の重み付き和が向上する。同様に、動きの小さい場合には、フレームレートが低くても高い解析精度となる解析エンジンに適した符号化パラメータセットとすることで解析精度の重み付き和が向上する。
4.3) Effect According to the fourth embodiment of the present invention, it is possible to further improve the sum of weighted analysis accuracies of a plurality of analysis engines by considering the feature amount of media. As mentioned above, if an analysis engine has the characteristic that the analysis accuracy does not improve even if the bit rate is increased for dark images, the analysis accuracy can be improved by using a coding parameter set suitable for an analysis engine that functions effectively even for dark images. improves the weighted sum of Similarly, when the motion is small, the weighted sum of the analysis accuracy is improved by using an encoding parameter set suitable for an analysis engine that provides high analysis accuracy even if the frame rate is low.
5.第5実施形態
上述した第1~第4実施形態によるメディア符号化装置(10、10A、10Bあるいは10C)は、Raspberry Pi(登録商標)などの小型コンピュータや、スマートフォン等の情報通信装置によって実現されうる。
5. Fifth Embodiment The media encoding devices (10, 10A, 10B or 10C) according to the first to fourth embodiments described above are realized by small computers such as Raspberry Pi (registered trademark) and information communication devices such as smartphones. sell.
図14に例示するように、情報通信装置600は、上記各実施形態の符号化パラメータセット決定部をプロセッサ109およびプログラムメモリ110により実装する。プロセッサ109はプログラムメモリ110から図2に示す全体的動作を制御するプログラムと、その中の符号化パラメータセット決定動作(S204)を制御するプログラムと、を読み出して実行する。符号化パラメータセット決定動作(S204)は、上述した第1~第4実施形態で説明した通りである。プロセッサ109は、情報通信装置600の動作を制御するプロセッサであってもよいし、メディア符号化装置の動作を制御するプロセッサであってもよい。また、符号化部(102、102B、102C)の機能もプロセッサがプログラムを実行することにより実現することができる。
As illustrated in FIG. 14 , information communication apparatus 600 implements the encoding parameter set determination unit of each of the above embodiments by
6.システム構成
図15に例示するように、情報通信装置601とサーバ602とがネットワーク603を通して接続された通信システムを考える。情報通信装置601は、上述した各実施形態によるメディア符号化装置604を有する。サーバ602はデータセンタ等に設置され、メディア復号装置605およびメディア解析装置606を有する。ネットワーク603は、例えば携帯電話網とインターネットとの組み合わせである。メディア解析装置606はサーバ602のプロセッサ上で映像解析プログラムを動作させることで実現できる。
6. System Configuration As illustrated in FIG. 15, consider a communication system in which an
メディア符号化装置604は、上述したように、メディア解析装置606のデータ解析に適した形にメディアデータを符号化して送信する。サーバ602では、メディア復号装置605が受信信号をメディアデータに復号し、それをメディア解析装置606が解析する。したがって、メディア符号化装置604の処理能力が低い場合でも精度を大きく下げることなくメディア解析が可能となる。
また、メディア符号化装置604の処理能力が比較的高い場合には、第4実施形態のようにメディア解析部108を設けることで、メディアの特徴量cを算出し、より適した符号化パラメータセットを決定することで、解析精度の更なる向上が可能となる。
Further, when the
7.付記
上述した実施形態および実施例の一部あるいは全部は、以下の付記のようにも記載されうるが、これらに限定されるものではない。
(付記1)
メディアデータを符号化する符号化部と、
前記メディアデータの符号化ビットレートの上限値を入力するビットレート入力部と、
前記メディアデータの解析方法を入力する解析方法入力部と、
前記符号化部に設定する符号化パラメータセットを決定する符号化パラメータ算出部と、
前記解析方法と前記符号化パラメータセットを入力し、前記解析方法における解析精度を算出する解析精度算出部を有し、
前記符号化パラメータ算出部は、前記符号化パラメータセットの候補を複数生成し、前記解析精度算出部を用いて前記候補に対する前記解析精度を算出し、算出した前記解析精度をもとに前記符号化部に設定する前記符号化パラメータセットを決定することを特徴とするメディア符号化装置。
(付記2)
付記1に記載のメディア符号化装置であって、
前記メディアデータが映像データであり、前記符号化パラメータセットが前記映像データのビットレートとフレームレートを含み、
前記符号化パラメータセットの候補は、各々前記フレームレートが異なり、
前記符号化パラメータ算出部は、前記符号化パラメータセットの候補の中で、解析精度が最も高くなる前記符号化パラメータセットを出力することを特徴とするメディア符号化装置。
(付記3)
付記1または2に記載のメディア符号化装置であって、
前記メディアデータが映像データであり、前記解析精度算出部は、前記解析方法と、前記映像データのビットレートとフレームレートが入力されると、前記解析方法における解析精度を出力することを特徴とするメディア符号化装置。
(付記4)
付記2または3に記載のメディア符号化装置であって、
前記符号化パラメータセットが、さらに符号化方法を含み、
前記符号化パラメータセットの候補は、各々前記フレームレートと前記符号化方法が異なることを特徴とするメディア符号化装置。
(付記5)
付記3または4に記載のメディア符号化装置であって、
前記解析精度算出部は、前記解析方法と、前記映像データのビットレートとフレームレートと、前記符号化方法が入力されると、前記解析方法における解析精度を出力することを特徴とするメディア符号化装置。
(付記6)
付記1~5のいずれかに記載のメディア符号化装置であって、
前記解析方法入力部から複数の解析方法と前記各解析方法の重みが入力され、
前記符号化パラメータ算出部は、前記解析精度の重み付き和が最も高くなる前記符号化パラメータセットを出力することを特徴とするメディア符号化装置。
(付記7)
付記6に記載のメディア符号化装置であって、
前記符号化部は階層符号化技術を使ってメディアデータを符号化し、
前記符号化パラメータセットが、階層数と、各階層のビットレートとフレームレートを含み、
前記符号化パラメータ算出部は、前記解析精度の重み付き和が最も高くなる前記符号化パラメータセットおよび前記各解析方法の前記階層への割り当てを出力することを特徴とするメディア符号化装置。
(付記8)
付記1~7に記載のメディア符号化装置であって、
前記メディアデータ入力部から入力されたメディアデータ、または、前記符号化部で符号化されたメディアデータの特徴量を算出するメディア解析部を有し、
前記解析精度算出部は、前記メディア解析部での解析結果を用いて前記解析精度を算出することを特徴とするメディア符号化装置。
(付記9)
付記8に記載のメディア符号化装置であって、
前記メディアデータが映像データであり、前記解析精度算出部は、前記解析方法と、前記映像データのビットレートとフレームレートと、前記メディア解析部が出力した前記特徴量が入力されると、前記解析方法における解析精度を出力することを特徴とするメディア符号化装置。
(付記10)
付記1~9のいずれかに記載のメディア符号化装置を有する第1情報通信装置と、
前記第1情報通信装置とネットワークを通して接続され、前記第1情報通信装置から受信したメディアデータを解析する前記解析方法に対応した解析エンジンを有する第2情報通信装置と、
からなる通信システム。
(付記11)
符号化部がメディアデータを符号化し、
ビットレート入力部が、前記メディアデータの符号化ビットレートの上限値を入力し、
解析方法入力部が、前記メディアデータの解析方法を入力し、
解析精度算出部が、前記解析方法と前記符号化パラメータセットを入力し、前記解析方法における解析精度を算出し、
符号化パラメータ算出部が、前記符号化パラメータセットの候補を複数生成し、前記解析精度算出部を用いて前記候補に対する前記解析精度を算出し、算出した前記解析精度をもとに前記符号化部に設定する前記符号化パラメータセットを決定する、
ことを特徴とするメディア符号化方法。
(付記12)
ネットワークを通して符号化メディアデータを伝送する通信システムにおけるメディア符号化装置としてコンピュータを機能させるプログラムであって、
符号化部がメディアデータを符号化し、
ビットレート入力部が、前記メディアデータの符号化ビットレートの上限値を入力し、
解析方法入力部が、前記メディアデータの解析方法を入力し、
解析精度算出部が、前記解析方法と前記符号化パラメータセットを入力し、前記解析方法における解析精度を算出し、
符号化パラメータ算出部が、前記符号化パラメータセットの候補を複数生成し、前記解析精度算出部を用いて前記候補に対する前記解析精度を算出し、算出した前記解析精度をもとに前記符号化部に設定する前記符号化パラメータセットを決定する、
機能を前記コンピュータに実現するプログラム。
7. Additional Notes Some or all of the embodiments and examples described above can also be described as the following additional notes, but are not limited to these.
(Appendix 1)
an encoding unit that encodes media data;
a bit rate input unit for inputting an upper limit value of the encoding bit rate of the media data;
an analysis method input unit for inputting an analysis method for the media data;
an encoding parameter calculation unit that determines an encoding parameter set to be set in the encoding unit;
an analysis accuracy calculation unit that inputs the analysis method and the encoding parameter set and calculates the analysis accuracy in the analysis method;
The encoding parameter calculation unit generates a plurality of candidates for the encoding parameter set, calculates the analysis accuracy for the candidates using the analysis accuracy calculation unit, and performs the encoding based on the calculated analysis accuracy. A media encoding device, which determines the encoding parameter set to be set in a section.
(Appendix 2)
The media encoding device according to
the media data is video data, the encoding parameter set includes a bit rate and a frame rate of the video data;
The coding parameter set candidates have different frame rates,
The media encoding device, wherein the encoding parameter calculation unit outputs the encoding parameter set with the highest analysis accuracy among the encoding parameter set candidates.
(Appendix 3)
The media encoding device according to
The media data is video data, and the analysis accuracy calculation unit outputs the analysis accuracy in the analysis method when the analysis method and the bit rate and frame rate of the video data are input. Media Encoder.
(Appendix 4)
The media encoding device according to
the encoding parameter set further comprising an encoding method;
The media encoding device, wherein the encoding parameter set candidates are different in the frame rate and the encoding method.
(Appendix 5)
The media encoding device according to
When the analysis method, the bit rate and frame rate of the video data, and the encoding method are input, the analysis accuracy calculation unit outputs the analysis accuracy in the analysis method. Device.
(Appendix 6)
The media encoding device according to any one of
a plurality of analysis methods and the weight of each analysis method are input from the analysis method input unit;
The media encoding device, wherein the encoding parameter calculation unit outputs the encoding parameter set that maximizes the weighted sum of the analysis accuracies.
(Appendix 7)
The media encoding device according to
The encoding unit encodes media data using a layered encoding technique;
The coding parameter set includes the number of layers and the bit rate and frame rate of each layer,
The media encoding device, wherein the encoding parameter calculation unit outputs allocation of the encoding parameter set and each analysis method to the layer, which gives the highest weighted sum of the analysis accuracies.
(Appendix 8)
The media encoding device according to
a media analysis unit that calculates a feature amount of the media data input from the media data input unit or the media data encoded by the encoding unit;
The media encoding device, wherein the analysis accuracy calculation unit calculates the analysis accuracy using an analysis result of the media analysis unit.
(Appendix 9)
The media encoding device according to
The media data is video data, and the analysis accuracy calculation unit receives the analysis method, the bit rate and frame rate of the video data, and the feature amount output by the media analysis unit. A media encoding device, characterized by outputting analysis accuracy in the method.
(Appendix 10)
a first information communication device having the media encoding device according to any one of
a second information communication device connected to the first information communication device through a network and having an analysis engine corresponding to the analysis method for analyzing media data received from the first information communication device;
A communication system consisting of
(Appendix 11)
an encoder encoding the media data;
A bit rate input unit inputs an upper limit value of the encoding bit rate of the media data;
an analysis method input unit inputs the analysis method of the media data;
an analysis accuracy calculation unit inputs the analysis method and the encoding parameter set and calculates the analysis accuracy in the analysis method;
An encoding parameter calculation unit generates a plurality of candidates for the encoding parameter set, calculates the analysis accuracy for the candidates using the analysis accuracy calculation unit, and uses the calculated analysis accuracy to generate the encoding unit. determining the encoding parameter set to set to
A media encoding method characterized by:
(Appendix 12)
A program that causes a computer to function as a media encoding device in a communication system that transmits encoded media data over a network,
an encoder encoding the media data;
A bit rate input unit inputs an upper limit value of the encoding bit rate of the media data;
an analysis method input unit inputs the analysis method of the media data;
an analysis accuracy calculation unit inputs the analysis method and the encoding parameter set and calculates the analysis accuracy in the analysis method;
An encoding parameter calculation unit generates a plurality of candidates for the encoding parameter set, calculates the analysis accuracy for the candidates using the analysis accuracy calculation unit, and uses the calculated analysis accuracy to generate the encoding unit. determining the encoding parameter set to set to
A program that implements a function on the computer.
本発明は、監視カメラ、車載カメラ等で撮影した映像・音声の記憶媒体への保存、または、撮影した映像・音声を監視センターへ配信する映像配信システムにおけるメディア符号化に適用できる。 INDUSTRIAL APPLICABILITY The present invention can be applied to storage of video/audio captured by surveillance cameras, in-vehicle cameras, etc. in a storage medium, or to media encoding in a video distribution system that distributes captured video/audio to a monitoring center.
10、10A、10B、10C、604 メディア符号化装置
101 メディアデータ入力部
102、102B、102C 符号化部
103 出力部
104、104A、104B、104C 符号化パラメータ算出部
105、105A、105B、105C 解析精度算出部
106 解析方法入力部
107 ビットレート入力部
108 メディア解析部
109 プロセッサ
110 プログラムメモリ
10, 10A, 10B, 10C, 604
Claims (10)
メディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力する符号化器と、
前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力する入力部と、
前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成し、前記複数の符号化パラメータセット候補ごとに解析精度を算出し、前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する符号化パラメータセット決定部と、
を有するメディア符号化装置。 A media encoding device in a communication system for transmitting encoded media data over a network,
an encoder that encodes media data according to an encoding parameter set and outputs the encoded media data;
an input unit for inputting an upper limit value of the encoding bit rate of the media data and information on an analysis method of the media data;
generating a plurality of coding parameter set candidates under conditions of the analysis method and the upper limit value of the coding bit rate, calculating analysis accuracy for each of the plurality of coding parameter set candidates, and calculating the calculated analysis accuracy a coding parameter set determination unit that determines a higher coding parameter set candidate as the coding parameter set to be provided to the encoder;
A media encoding device having
前記符号化パラメータセット決定部が前記解析方法の解析精度を予め用意された関数式あるいは解析精度テーブルを用いて算出するメディア符号化装置。 A media encoding device according to claim 1, comprising:
A media encoding device in which the encoding parameter set determination unit calculates the analysis accuracy of the analysis method using a function or an analysis accuracy table prepared in advance.
前記メディアデータが映像データであり、前記符号化パラメータセットが前記映像データのビットレートとフレームレートを含み、
前記符号化パラメータセット決定部が前記複数の符号化パラメータセット候補を前記フレームレートが異なるように生成するメディア符号化装置。 A media encoding device according to claim 1 or 2,
the media data is video data, the encoding parameter set includes a bit rate and a frame rate of the video data;
A media encoding device, wherein the encoding parameter set determination unit generates the plurality of encoding parameter set candidates such that the frame rates are different.
前記符号化パラメータセットが符号化方法を更に含み、
前記符号化パラメータセット決定部が前記複数の符号化パラメータセット候補を前記フレームレートおよび前記符号化方法の少なくとも一つが異なるように生成するメディア符号化装置。 A media encoding device according to claim 3, comprising:
the encoding parameter set further comprising an encoding method;
A media encoding apparatus, wherein the encoding parameter set determination unit generates the plurality of encoding parameter set candidates such that at least one of the frame rate and the encoding method is different.
前記入力部が複数の解析方法と各解析方法の重みを入力し、
前記符号化パラメータセット決定部が、前記複数の解析方法の各々の解析精度の重み付き和が最も高くなる符号化パラメータセット候補を前記符号化パラメータセットとして決定するメディア符号化装置。 A media encoding device according to any one of claims 1-4,
the input unit inputs a plurality of analysis methods and a weight for each analysis method;
The media encoding device, wherein the encoding parameter set determination unit determines, as the encoding parameter set, a coding parameter set candidate with the highest weighted sum of the analysis accuracies of the plurality of analysis methods.
前記符号化器が前記メディアデータを階層符号化し、
前記入力部が複数の解析方法と各解析方法の重みを入力し、
前記符号化パラメータセットが、前記階層符号化の階層数と、各階層のビットレートと、前記解析方法の各階層への割当てと、を含み、
前記符号化パラメータセット決定部が、各階層のビットレートの組合せ候補ごと、および前記複数の解析方法の各階層への割当て候補ごとに解析精度を算出し、前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定するメディア符号化装置。 A media encoding device according to any one of claims 1-5,
the encoder layer-encodes the media data;
the input unit inputs a plurality of analysis methods and a weight for each analysis method;
The coding parameter set includes the number of layers of the layered coding, the bit rate of each layer, and the allocation of the analysis method to each layer,
The coding parameter set determination unit calculates analysis accuracy for each bit rate combination candidate for each layer and for each allocation candidate for each layer of the plurality of analysis methods, and the code with the higher calculated analysis accuracy A media encoding apparatus for determining a candidate encoding parameter set as the encoding parameter set to be provided to the encoder.
前記メディアデータまたは前記符号化メディアデータからメディア特徴量を算出するメディア解析部を更に有し、
前記符号化パラメータセット決定部が、前記メディア特徴量に基づいて、前記複数の符号化パラメータセット候補ごとに解析精度を算出するメディア符号化装置。 A media encoding device according to any one of claims 1-6,
further comprising a media analysis unit that calculates a media feature amount from the media data or the encoded media data;
The media encoding device, wherein the encoding parameter set determination unit calculates analysis accuracy for each of the plurality of encoding parameter set candidates based on the media feature quantity.
前記メディアデータが映像データであり、 前記符号化パラメータセット決定部が、前記解析方法と、前記映像データのビットレートおよびフレームレートと、前記メディア特徴量とに基づいて前記解析方法における解析精度を算出するメディア符号化装置。 A media encoding device according to claim 7, comprising:
The media data is video data, and the coding parameter set determination unit calculates analysis accuracy in the analysis method based on the analysis method, the bit rate and frame rate of the video data, and the media feature amount. A media encoder that
符号化器がメディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力し、
符号化パラメータ決定部が、
前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力し、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成し、
前記複数の符号化パラメータセット候補ごとに解析精度を算出し、
前記算出された解析精度がより高い符号化パラメータセット候補を、前記符号化器へ与える前記符号化パラメータセットとして決定する、
メディア符号化方法。 A media encoding method in a communication system for transmitting encoded media data over a network, comprising:
an encoder encoding media data according to an encoding parameter set and outputting the encoded media data;
The encoding parameter determination unit
Inputting the upper limit value of the coding bit rate of the media data and information about the analysis method of the media data, and generating a plurality of coding parameter set candidates under the condition of the analysis method and the upper limit value of the coding bit rate. death,
calculating analysis accuracy for each of the plurality of coding parameter set candidates;
determining a coding parameter set candidate with a higher calculated analysis accuracy as the coding parameter set to be provided to the encoder;
Media encoding method.
メディアデータを符号化パラメータセットに従って符号化し、前記符号化メディアデータを出力する機能と、
前記メディアデータの符号化ビットレートの上限値と前記メディアデータの解析方法に関する情報とを入力し、前記解析方法および前記符号化ビットレートの上限値の条件下で複数の符号化パラメータセット候補を生成する機能と、
前記複数の符号化パラメータセット候補ごとに解析精度を算出する機能と、
前記算出された解析精度がより高い符号化パラメータセット候補を前記符号化パラメータセットとして決定する機能と、
を前記コンピュータに実現するプログラム。 A program that causes a computer to function as a media encoding device in a communication system that transmits encoded media data over a network,
encoding media data according to an encoding parameter set and outputting the encoded media data;
Inputting the upper limit value of the coding bit rate of the media data and information about the analysis method of the media data, and generating a plurality of coding parameter set candidates under the condition of the analysis method and the upper limit value of the coding bit rate. and the ability to
a function of calculating analysis accuracy for each of the plurality of coding parameter set candidates;
a function of determining a coding parameter set candidate with a higher calculated analysis accuracy as the coding parameter set;
on the computer.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019007878A JP7310148B2 (en) | 2019-01-21 | 2019-01-21 | Media encoding method and apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019007878A JP7310148B2 (en) | 2019-01-21 | 2019-01-21 | Media encoding method and apparatus |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020120188A JP2020120188A (en) | 2020-08-06 |
| JP7310148B2 true JP7310148B2 (en) | 2023-07-19 |
Family
ID=71891288
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019007878A Active JP7310148B2 (en) | 2019-01-21 | 2019-01-21 | Media encoding method and apparatus |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7310148B2 (en) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7400991B2 (en) | 2020-10-30 | 2023-12-19 | 富士通株式会社 | Server, control method, and control program |
| CN119815080B (en) * | 2022-07-14 | 2025-12-26 | 杭州海康威视数字技术股份有限公司 | A neural network-based image decoding and encoding method, apparatus, and device. |
| WO2026058427A1 (en) * | 2024-09-13 | 2026-03-19 | Ntt株式会社 | Object recognition rate calculation device, object recognition rate calculation method, and program |
| WO2026058428A1 (en) * | 2024-09-13 | 2026-03-19 | Ntt株式会社 | Object recognition rate calculation device, object recognition rate calculation method, and program |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011234033A (en) | 2010-04-26 | 2011-11-17 | Panasonic Corp | Monitoring camera and monitor system |
| JP2013030852A (en) | 2011-07-26 | 2013-02-07 | Nippon Telegr & Teleph Corp <Ntt> | Scalable video encoding device and method and program |
| JP2014220732A (en) | 2013-05-10 | 2014-11-20 | 株式会社リコー | Information processing apparatus, information processing method, and program |
| US20160057432A1 (en) | 2014-08-25 | 2016-02-25 | Renesas Electronics Corporation | Image communication apparatus, image transmission apparatus, and image reception apparatus |
-
2019
- 2019-01-21 JP JP2019007878A patent/JP7310148B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011234033A (en) | 2010-04-26 | 2011-11-17 | Panasonic Corp | Monitoring camera and monitor system |
| JP2013030852A (en) | 2011-07-26 | 2013-02-07 | Nippon Telegr & Teleph Corp <Ntt> | Scalable video encoding device and method and program |
| JP2014220732A (en) | 2013-05-10 | 2014-11-20 | 株式会社リコー | Information processing apparatus, information processing method, and program |
| US20160057432A1 (en) | 2014-08-25 | 2016-02-25 | Renesas Electronics Corporation | Image communication apparatus, image transmission apparatus, and image reception apparatus |
| JP2016046707A (en) | 2014-08-25 | 2016-04-04 | ルネサスエレクトロニクス株式会社 | Image communication device, image transmission device, and image reception device |
Non-Patent Citations (1)
| Title |
|---|
| Jens-Rainer Ohm, et al.,SVC Requirements Specified by MPEG (ISO/IEC JTC 1 / SC 29 / WG 11),Joint Video Team (JVT) of ISO/IEC MPEG & ITU-T VCEG (ISO/IEC JTC1/SC29/WG11 and ITU-T SG16 Q.6) 14th Meeting: Hong Kong, CN, 18-21 Jan., 2005,JVT-N026,2005年04月20日,pp.1-31,庁内DB(送付可) |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020120188A (en) | 2020-08-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7310148B2 (en) | Media encoding method and apparatus | |
| US11412229B2 (en) | Method and apparatus for video encoding and decoding | |
| US10990812B2 (en) | Video tagging for video communications | |
| RU2699258C2 (en) | Image prediction method and an image prediction device | |
| TW202002632A (en) | Method of adaptive filtering for multiple reference line of intra prediction in video coding, video encoding apparatus and video decoding apparatus therewith | |
| US10754242B2 (en) | Adaptive resolution and projection format in multi-direction video | |
| WO2010050152A1 (en) | Pixel prediction value generation procedure automatic generation method, image encoding method, image decoding method, devices using these methods, programs for these methods, and recording medium on which these programs are recorded | |
| CN110248192B (en) | Encoder switching method, decoder switching method, screen sharing method and screen sharing system | |
| CN117014659B (en) | Video transcoding method and device, electronic equipment and storage medium | |
| CN117176959B (en) | Processing method, processing device and storage medium | |
| CN112839224B (en) | Prediction mode selection method and device, video coding equipment and storage medium | |
| US10051281B2 (en) | Video coding system with efficient processing of zooming transitions in video | |
| CN114746870B (en) | A high-level syntax for priority signaling in neural network compression | |
| US20130286227A1 (en) | Data Transfer Reduction During Video Broadcasts | |
| CN113099241B (en) | Reference frame list updating method, device, equipment and storage medium | |
| CN103517074A (en) | Image encoding apparatus and control method thereof | |
| CN116013221A (en) | Screen refresh rate adjusting method and device, electronic equipment and storage medium | |
| CN109493304A (en) | A kind of image processing method and device | |
| JP6825703B2 (en) | Transmitters, communication systems, communication methods, and programs | |
| CN110557642B (en) | Video frame coding motion searching method and image encoder | |
| JP2020150512A (en) | Media encoding method and device | |
| KR20220118332A (en) | Scalable video coding apparatus and method for real-time video streaming | |
| CN116600133A (en) | Encoding processing method, transcoding server and storage medium | |
| CN107197281A (en) | A kind of method and electronic equipment for realizing estimation | |
| US20250133213A1 (en) | Video encoding method and apparatus, electronic device and storage medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211206 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230119 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230403 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230606 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230619 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 7310148 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |