Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4091582B2 - 動画像符号化装置、及び動画像符号化方法 - Google Patents
[go: Go Back, main page]

JP4091582B2 - 動画像符号化装置、及び動画像符号化方法 - Google Patents

動画像符号化装置、及び動画像符号化方法 Download PDF

Info

Publication number
JP4091582B2
JP4091582B2 JP2004258948A JP2004258948A JP4091582B2 JP 4091582 B2 JP4091582 B2 JP 4091582B2 JP 2004258948 A JP2004258948 A JP 2004258948A JP 2004258948 A JP2004258948 A JP 2004258948A JP 4091582 B2 JP4091582 B2 JP 4091582B2
Authority
JP
Japan
Prior art keywords
encoded data
frame rate
amount
code amount
moving image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004258948A
Other languages
English (en)
Other versions
JP2006074703A (ja
Inventor
奈穂美 武田
晋一郎 古藤
朋夫 山影
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004258948A priority Critical patent/JP4091582B2/ja
Priority to US11/218,658 priority patent/US20060050782A1/en
Publication of JP2006074703A publication Critical patent/JP2006074703A/ja
Application granted granted Critical
Publication of JP4091582B2 publication Critical patent/JP4091582B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6377Control signals issued by the client directed to the server or network components directed to server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23406Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving management of server-side video buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像符号化装置、及び動画像符号化方法に関し、符号化された一つの動画像データから複数のフレームレートで再生を可能にするものである。
NTSC圏のTVは60フィールド/秒である一方、PAL圏では50フィールド/秒であり、圏毎に一秒間に表示されるフィールド量が異なっていた。そして、映画をTV向けに編集する際、映画は24フレーム/秒であるため、NTSC圏では、3:2プルダウンを行い、1フレームおきに3フィールド、2フィールドをつくり、24フレーム/秒から60フィールド/秒の動画像を作成する。またPAL圏のTVでは早回しにより25フレームを1秒に表示して50フィールド/秒としている。
また、ディスク等に記録する際に映画を24フレーム/秒として共通に符号化しておき、NTSC圏では3:2プルダウンによりアナログ信号を生成することで再生を行い、一方、PAL圏ではマスタークロックを25/24倍に早めたアナログ信号を生成することで50フィールド/秒で再生を行う方法が提案されている(例えば特許文献1)。これにより映画を符号化するに際し、PAL圏およびNTSC圏の各々について符号化する必要がなかった。
一方、HDDVDをHDTVで再生する際に、符号化されたデジタル信号からアナログ信号を生成する必要がなく、直接デジタル信号による再生が可能である。しかし、HDTVにおいて、NTSC圏とPAL圏の画像サイズが一緒ではあるが、フレームレートが異なる。このためHDDVDを作成するためのHDDVDオーサリングでは、NTSC圏とPAL圏のそれぞれについてエレメンタリーストリームを作成する必要があった。
特開2000−102034号公報
しかしながら、この場合、HDTVサイズの動画像のエレメンタリーストリームを作成するためには時間がかかるため、NTSC圏、PAL圏などの異なるフレームレート毎にエレメンタリーストリームを作成する場合、かかる時間が膨大となるという問題がある。
さらに、HDTVサイズの動画像の場合、エレメンタリーストリームの保存に必要な記憶容量が大きいため、NTSC圏用、PAL圏用などの異なるフレームレート毎にエレメンタリーストリームをそれぞれ保存する場合、大きなディスクスペースを確保しなければならないという問題がある。
本発明は、上記に鑑みてなされたものであって、エレメンタリーストリームの作成時にフレームレート毎に異なる受信バッファの制約条件を同時に満たすように動画像符号化を行い、一つのエレメンタリーストリームを複数のフレームレートで使用可能にすることで、符号化にかかる時間を短縮し、符号化に必要なディスクスペースを低減することを可能とする動画像符号化装置、及び動画像符号化方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明にかかる動画像符号化装置は、1秒ごとに24フレーム表示する入力動画像を符号化して、符号化データを出力する動画像符号化装置において、PAL規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する第1の受信記憶領域に占める第1の占有量を記憶する第1の記憶手段と、前記符号化データの再生時に前記第1の受信記憶領域が受信した前記符号化データの第1の受信量、及び前記符号化データの再生時に表示される各画像の第1の符号量に基づいて、前記第1の記憶手段が記憶する前記第1の占有量を変動させる第1の変動手段と、前記第1の変動手段により変動した前記第1の占有量に基づいて、前記PAL規格フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記第1の符号量の条件を示す第1の符号量条件を導出する第1の導出手段と、NTSC規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する第2の受信記憶領域に占める第2の占有量を記憶する第2の記憶手段と、3:2プルダウンを用いた前記符号化データの再生時に前記第2の受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の第2の符号量に基づいて、前記第2の記憶手段が記憶する前記第2の占有量を変動させる第2の変動手段と、前記第2の変動手段により変動した前記第2の占有量に基づいて、前記NTSC規格フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記第2の符号量の条件を示す第2の符号量条件を導出する第2の導出手段と、前記第1の導出手段により導出された前記第1の符号量条件と、前記第2の導出手段により導出された前記第2の符号量条件とを満たす符号量で、前記入力動画像を符号化する符号化手段と、を備えることを特徴とする。
また、本発明にかかる動画像符号化装置は、1秒ごとに24フレーム表示する入力動画像を符号化して、符号化データを出力する動画像符号化装置において、PAL規格フレームレートでは第1のビットレートで再生され且つNTSC規格フレームレートでは第2のビットレートで再生される前記符号化データであって、前記PAL規格フレームレートと前記NTSC規格フレームレートとの比、および、前記第1のビットレートと前記第2のビットレートとの比の両方が一致する前記符号化データを出力する際、前記PAL規格フレームレート及び前記NTSC規格フレームレートから、任意に選択された一つのフレームレートを示す選択フレームレートによる前記符号化データの再生時の受信記憶領域に占める占有量を記憶する記憶手段と、前記選択フレームレートによる前記符号化データの再生時において、前記受信記憶領域が受信した前記符号化データの受信量及び表示される各画像の符号量に基づいて、前記記憶手段が記憶する前記占有量を変動させる変動手段と、前記変動手段により変動した前記占有量に基づいて、前記選択フレームレートによる前記符号化データの再生時に前記受信記憶領域で1ビットのマージンを有するよう、表示される次の画像が満たすべき前記符号量の条件を示す符号量条件を導出する導出手段と、前記導出手段により導出された前記符号量条件を満たす符号量で、前記入力動画像を符号化する符号化手段と、を備えることを特徴とする。
また、本発明にかかる動画像符号化装置は、1秒ごとに24フレーム表示する入力動画像を可変ビットレートで符号化して符号化データを出力する動画像符号化装置において、前記符号化データを再生する対象となるPAL規格フレームレート、及び前記符号化データを3:2プルダウンで再生する対象となるNTSC規格フレームレートを含む複数のフレームレートから、フレームレートが最も高いPAL規格フレームレートを選択する選択手段と、前記PAL規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する受信記憶領域に占める占有量を記憶する記憶手段と、前記PAL規格フレームレートによる前記符号化データの再生時に前記受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の符号量に基づいて、前記記憶手段が記憶する前記占有量を変動させる変動手段と、前記変動手段により変動した前記占有量に基づいて、前記選択手段により選択された前記フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記符号量の条件を示す符号量条件を導出する導出手段と、前記導出手段により導出された前記符号量条件を満たす符号量で、前記入力動画像を符号化する符号化手段と、を備えることを特徴とする。
また、本発明にかかる動画像符号化方法は、1秒ごとに24フレーム表示する入力動画像を符号化して、符号化データを出力する動画像符号化方法において、PAL規格フレームレートによる前記符号化データの再生時に第1の受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の符号量に基づいて、前記PAL規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する前記第1の受信記憶領域に占める第1の占有量を変動させる第1の変動ステップと、前記第1の変動ステップにより変動した前記第1の占有量に基づいて、前記PAL規格フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記符号量の条件を示す第1の符号量条件を導出する第1の導出ステップと、前記符号化データの再生時に第2の受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の符号量に基づいて、NTSC規格フレームレートによる3:2プルダウンを用いた前記符号化データの再生時に受信した前記符号化データを一時的に記憶する前記第2の受信記憶領域に占める第2の占有量を変動させる第2の変動ステップと、前記第2の変動ステップにより変動した前記第2の占有量に基づいて、前記NTSC規格フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記符号量の条件を示す第2の符号量条件を導出する第2の導出ステップと、前記第1の導出ステップにより導出された前記第1の符号量条件と、前記第2の導出ステップにより導出された前記第2の符号量条件とを満たす符号量で、前記入力動画像を符号化する符号化ステップと、を備えることを特徴とする。
また、本発明にかかる動画像符号化方法は、1秒ごとに24フレーム表示する入力動画像を符号化して、符号化データを出力する動画像符号化方法において、PAL規格フレームレートでは第1のビットレートで再生され且つNTSC規格フレームレートでは第2のビットレートで再生される前記符号化データであって、前記PAL規格フレームレートと前記NTSC規格フレームレートとの比と、および、前記第1のビットレートと前記NTSC規格ビットレートとの比の両方が一致する前記符号化データを出力する際、前記PAL規格フレームレート及び前記NTSC規格フレームレートから、任意に選択された一つのフレームレートを示す選択フレームレートによる前記符号化データの再生時において、受信記憶領域が受信した前記符号化データの受信量及び表示される各画像の符号量に基づいて、選択フレームレートによる前記符号化データの再生時の前記受信記憶領域に占める占有量を変動させる変動ステップと、前記変動ステップにより変動した前記占有量に基づいて、前記選択フレームレートによる前記符号化データの再生時に前記受信記憶領域で1ビットのマージンを有するよう、表示される次の画像が満たすべき前記符号量の条件を示す符号量条件を導出する導出ステップと、前記導出ステップにより導出された前記符号量条件を満たす符号量で、前記入力動画像を符号化する符号化ステップと、を備えることを特徴とする。
また、本発明にかかる動画像符号化方法は、1秒ごとに24フレーム表示する入力動画像を可変ビットレートで符号化して符号化データを出力する動画像符号化方法において、前記符号化データを再生する対象となるPAL規格フレームレート、及び前記符号化データを3:2プルダウンで再生する対象となるNTSC規格フレームレートを含む複数のフレームレートから、フレームレートが最も高いPAL規格フレームレートを選択する選択ステップと、前記PAL規格フレームレートによる前記符号化データの再生時に受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の符号量に基づいて、当該PAL規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する前記受信記憶領域に占める占有量を変動させる変動ステップと、前記変動ステップにより変動した前記占有量に基づいて、前記選択ステップにより選択された前記フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記符号量の条件を示す符号量条件を導出する導出ステップと、前記導出ステップにより導出された前記符号量条件を満たす符号量で、前記入力動画像を符号化する符号化ステップと、を備えることを特徴とする。
本発明によれば、第1の符号量条件と第2の符号量条件とを満たす符号量で、入力動画像の符号化をするため、符号化された符号化データPAL規格フレームレート及びNTSC規格フレームレートのいずれの再生時でもオーバーフロー及びアンダーフローが生じないため、複数のフレームレートにより使用可能な符号化データを出力することとなり、符号化にかかる時間を短縮し、符号化に必要なディスクスペースを低減することが可能という効果を奏する。
また、本発明によれば、符号量条件を満たす符号量で、入力動画像の符号化をするため、符号化された符号化データは、PAL規格フレームレートを第1のビットレートで再生時及びNTSC規格フレームレートを第2のビットデータで再生時でもオーバーフロー及びアンダーフローが生じないため、当該複数のフレームレートにより使用可能な符号化データを出力することとなり、符号化にかかる時間を短縮し、符号化に必要なディスクスペースを低減することが可能という効果を奏する。
また、本発明によれば、入力動画像を可変ビットレートで符号化する場合において、PAL規格フレームレート、及び前記符号化データを3:2プルダウンで再生する対象となるNTSC規格フレームレートを含む複数のフレームレートについて再生するために導出された符号量条件を満たす符号量で、入力動画像の符号化をするため、符号化後動画像情報は複数のフレームレートによる再生時にアンダーフローが生じないように符号化したため、複数のフレームレートにより使用可能な符号化データを出力することとなり、符号化にかかる時間を短縮し、符号化に必要なディスクスペースを低減することが可能という効果を奏する。
以下に添付図面を参照して、この発明にかかる動画像符号化装置、及び動画像符号化方法の最良な実施の形態を詳細に説明する。
(第1の実施の形態)
第1の実施の形態は、データに変換する際にCBR(Constant Bit Rate)によりレート制御を行う場合に適した動画像符号化装置100、及び動画像符号化装置100により符号化された符号化後動画像データを多重化する動画像多重化編集装置1100を説明する。なお、本実施の形態は、動画像符号化装置100に用いられるレート制御をCBRに制限するものではなく、VBR(Variable Bit Rate)に用いても良い。
図1は、本発明の第1の実施の形態にかかる動画像符号化装置100の構成を示すブロック図である。動画像符号化装置100は、動画像符号化部101、PAL用占有量加算部109、PAL用占有量減算部102、PAL用仮想受信バッファ103、PAL用符号量条件導出部104、NTSC用占有量加算部110、NTSC用占有量減算部105、NTSC用仮想受信バッファ106、NTSC用符号量条件導出部107、符号量条件設定部108から構成される。これらの構成を備えることにより、動画像符号化装置100は、入力された符号前動画像データからPAL圏内あるいはNTSC圏内で再生してもアンダーフローもオーバーフローも発生しないような条件を満たした符号化後動画像データを出力することが可能となる。
また、動画像符号化装置100から出力された符号化後動画データはPAL圏内で再生するためのタイミングデータが設定されているものとし、NTSC圏内で再生するためにはタイミングデータを変更する必要がある。NTSC圏内で再生するためのタイミングデータに変更する動画像多重化編集装置は後述する。なお、動画像符号化装置100から出力される符号化後動画データは、PAL圏内で再生するためのタイミングデータが設定されることに制限するものではなく、NTSC圏内で再生するためのタイミングデータが設定されることにしてもよい。
動画像符号化部101は、後述する符号量条件設定部108により設定された符号化するための条件に従って入力された符号化前動画像データを符号化し、符号化された符号化後動画像データを出力する。また本実施の形態において、動画像データを符号化する方法はH.264を用いて行う。また、符号化方法をH.264に制限するものではなく、例えば、MPEG2などが考えられる。
なお、NTSC圏用の符号化後動画像データとPAL圏用の符号化後動画像データではタイミングデータのサイズ(詳しくは後述するbit_rate_value_minus1情報の符号長等)が異なる場合がある。このため動画像符号化部101は、符号化時にサイズが大きいほうに合わせてタイミングデータの領域(詳しくは後述するSequence Parameter SET RBSP等)のサイズを決定する。本実施の形態ではNTSC圏用のタイミングデータの領域が大きいため、それに合わせてPAL圏用のタイミングデータの領域を決定する。そして、動画像符号化部101は、符号化時に未使用領域についてゼロスタッフィングする。なお具体的なサイズの違いについては後述する。
なおタイミングデータの領域のサイズはNTSC圏用およびPAL圏用のタイミングデータについての領域のみを確保することに制限するものではなく、再生する対象となる複数のフレームレートのタイミングデータについて十分な領域を確保する必要がある。
PAL用仮想受信バッファ103は、PAL圏において再生時に用いられる受信バッファを仮想的に実現し、受信バッファが記憶可能な容量、及び動画像符号化部101から出力された符号化後動画像データが再生された場合の受信バッファ内のバッファ占有量を記憶する。
PAL用占有量加算部109は、PAL圏用に設定されたビットレートに応じたピクチャk―1の引き去り時刻からピクチャkの引き去り時刻までにバッファ占有量の増加量をPAL用仮想受信バッファ103に加算する。
PAL用占有量減算部102は、PAL圏で用いられるフレームレートでのピクチャkの引き去り時刻に、PAL用仮想受信バッファ103が記憶するバッファ占有量から、動画像符号化部101により符号化前動画像データを符号化して得られるピクチャkの発生ビットを減算する。なお、kは0から始まる整数とし、入力された符号化前動画像データが保持するピクチャの数だけあるものとする。
PAL用符号量条件導出部104は、動画像符号化部101により入力された符号化後動画像データが、PAL用仮想受信バッファ103により実現されるPAL圏における受信バッファをオーバーフローが発生しないように、あるいはPAL用占有量減算部102によるPAL用仮想受信バッファ103に対するバッファ占有量の減算によりアンダーフローが発生しないように、動画像符号化部101から出力されるピクチャkの発生ビットの条件を導出する。
NTSC用仮想受信バッファ106は、NTSC圏において再生時に用いられる受信バッファを仮想的に実現し、受信バッファが記憶可能な容量、及び動画像符号化部101から出力された符号化後動画像データが再生された場合の受信バッファ内のバッファ占有量を記憶する。
NTSC用占有量加算部110は、NTSC圏用に設定されたビットレートに応じて、ピクチャk―1の引き去り時刻からピクチャkの引き去り時刻までのバッファ占有量の増加量をNTSC用仮想受信バッファ106に加算する。
NTSC用占有量減算部105は、NTSC圏で用いられるフレームレートでのピクチャkの引き去り時刻に、NTSC用仮想受信バッファ106が記憶するバッファ占有量から、動画像符号化部101により符号化前動画像データを符号化して得られるピクチャkの発生ビットを減算する。
また、NTSC圏では入力された符号化前動画像データについて3:2プルダウンを行い、ピクチャ毎に3field,2field,3field,2field…と割り当てていくため、NTSC用占有量減算部105は、3field,2field,3field,2field…毎に引き去り時刻を設定するものとする。
NTSC用符号量条件導出部107は、動画像符号化部101により入力された符号化後動画像データが、NTSC用仮想受信バッファ106により実現されるNTSC圏における受信バッファをオーバーフローが発生しないように、あるいはNTSC用占有量減算部105によるNTSC用仮想受信バッファ106に対するバッファ占有量の減算によりアンダーフローが発生しないように、動画像符号化部101から出力されるピクチャkの発生ビットの条件を導出する。
符号量条件設定部108は、PAL用符号量条件導出部104により導出される符号化後動画像データの発生ビットの条件及びNTSC用符号量条件導出部107により導出される符号化後動画像データの発生ビットの条件を全て満たすように動画像符号化部101により符号化されるピクチャkの発生ビットの条件を導き、当該条件に合うように発生ビットの量を制御するために、量子化値情報、符号量に影響を与える符号化モード選択情報などの符号化条件を設定する。このように条件を設定することで、PAL圏及びNTSC圏においてアンダーフロー及びオーバーフローが発生することがない条件を設定することが可能となる。
図2は、本実施の形態にかかる動画像多重化編集装置1100の構成を示したブロック図である。本図で示した動画像多重化編集装置1100は、動画像符号化装置100により符号化された、複数のフレームレートで再生できるように符号化された符号化後動画像データについて、所望のフレームレートで再生可能にするため復号化時刻または表示時刻に関するタイミングデータを挿入または修正し、入力されたオーバーレイ画像を符号化後動画像データと同期するためにタイミングデータを挿入または修正し、さらに複数のオーディオデータから、所望のフレームレートで再生するために必要なオーディオデータを選択して多重化する。
動画像タイミング変更部1110は、複数のフレームレートで再生可能な符号化後動画像データを、所望のフレームレートで再生を可能とするため修正を行う。この動画像タイミング変更部1110は、符号化後動画像入力部1111、符号化後動画像記憶部1112、符号化後動画像変更部1113とから構成される。
符号化後動画像入力部1111は、動画像符号化装置100により生成された複数のフレームレートで再生が可能な符号化後動画像データを入力する。
符号化後動画像記憶部1112は、符号化後動画像入力部1111により入力された符号化後動画像データを記憶する。
符号化後動画像変更部1113は、符号化後動画像記憶部1112に記憶された符号化後動画像に対して所望のフレームレートで再生が可能となるように変更を行う。本実施の形態では、動画像符号化装置100により出力された符号化後動画像データはPAL圏内で再生するためのタイミングデータが設定されているので、NTSC圏内で再生するためのタイミングデータに変更する。なお、NTSC圏内で再生するためのタイミングデータへの変更に制限するものではなく、符号化後動画像データが再生する対象としたフレームレートであればよいものとする。
また、符号化後動画像変更部1113はビットレート、フレームレート、初期バッファ占有量に依存した受信開始を0とした最初のピクチャの引き去り開始時刻および各ピクチャの引き去り時刻等のタイミングデータについて再計算を行い、再計算された値で符号化後動画像データの該当箇所を変更する。なお、変更される値については後述する。また複数のフレームレートで再生可能なように符号化されているため動画像データそのものの再符号化は行わない。
また、符号化後動画像変更部1113は、符号化方式がH.264の場合において修正することとする。なお、符号化方式をH.264に制限するものではなく、他の符号化方式に適用してもよい。
オーバーレイ画像変更部1101は、入力されたオーバーレイ画像を所望のフレームレートで再生可能とするためタイミングデータ箇所の変更を行う。本実施の形態では、入力されたオーバーレイ画像がPAL圏で再生するためのタイミングデータが挿入されたものとし、NTSC圏で再生するための変更を行う。なお、タイミングデータの変更方法について制限を設けるものではなく、本実施の形態では従来から周知の方法を用いて変更するものとする。
オーディオ選択部1102は、複数のフレームレートに対応する複数のオーディオデータから、所望のフレームレートに対応するオーディオデータを選択する。例えば、PAL圏用のオーディオデータが第1のオーディオデータであれば、第1のオーディオデータを後述するPAL用多重化部1121に出力し、NTSC圏用のオーディオデータが第2のオーディオデータであれば、第2のオーディオデータを後述するNTSC用多重化部1121に出力する。
多重化部1120は、所望のフレームレートで再生可能なように変更された符号化後動画像データ、オーバーレイ画像、選択されたオーディオデータより多重化を行い、符号化後映像データを生成する。多重化部1120は、PAL用多重化部1121及びNTSC用多重化部1122で構成される。なお、多重化部1120で多重化される動画像データをNTSC圏に対応する多重化、PAL圏に対応する多重化に制限するものではなく、再生する対象となるフレームレートに対応する多重化であればよい。また、2つのフレームレートについて多重化することに制限するものではなく、生成する対象となるフレームレートについての多重化であれば、1つでも良いし、あるいは2つより多くのフレームレートについて多重化を行っても良い。
動画像多重化編集装置1100により、動画像符号化装置100により符号化された動画像符号化データについて、再生対象とするフレームレートによるタイミングデータの変更及び多重化が可能となる。
次に、以上により構成された本実施の形態に係る動画像符号化装置100において入力された符号化前動画像データからPAL圏及びNTSC圏で再生してもオーバーフロー及びアンダーフローを生じない符号化後動画像データを出力するまでの処理について説明する。図3は本実施の形態にかかる動画像符号化装置100における入力された符号化前動画像データから符号化後動画像データを出力するまでの全体処理を示すフローチャートである。
まず、PAL用仮想受信バッファ103について初期化を行う(ステップS201)。具体的には以下の数1式で示すようにPAL用仮想受信バッファ103による符号化後動画像データのバッファ占有量(以下この変数をpal_cpb_occupancy(k)とする)に初期バッファ占有量(以下この定数値をinitial_cpb_occupancyとする)を入力する。
pal_cpb_occupancy(-1)=initial_cpb_occupancy…(1)
なお初期値としてpal_cpb_occupancy(k)についてk=-1としたのは、ピクチャkでkが0から始まるためである。
そしてピクチャkについてk=0から符号前動画像データが保持する全てのピクチャについて符号化を終了するまでステップS203からステップS205までの処理をループする(ステップS202)。
PAL用占有量加算部109は、PAL圏用に設定されたビットレートに応じたピクチャk―1の引き去り時刻からピクチャkの引き去り時刻までに増加するバッファ占有量をPAL用仮想受信バッファ103に加算する(ステップS203)。具体的には数2式により行われる。
pal_cpb_occupancy(k) = pal_cpb_occupancy(k-1)+pal_bit_rate×[(PAL圏内のフレームレートでのピクチャkの引き去り時刻)−(PAL圏内のフレームレートでのピクチャk−1の引き去り時刻)]…(2)
ただし、ピクチャ0(つまりk=0)においては、PAL圏内のフレームレートでのピクチャk−1の引き去り時刻とPAL圏内のフレームレートでのピクチャkの引き去り時刻は等しいものとして数2式により算出する。
そして、PAL用符号量条件導出部104は、PAL用仮想受信バッファ103においてピクチャkの引き去り直後にアンダーフローしないようにピクチャkの発生ビット量の上限(pal_max_bits)を導出し、かつピクチャk+1の引き去り直前にオーバーフローしないようにするためのピクチャkの発生ビット量の下限(pal_min_bits)を導出し、符号量条件設定部108に出力する(ステップS204)。
PAL用占有量減算部105は、後述するステップS213において動画像符号化部101により入力されるピクチャkの発生ビット量を、PAL用仮想受信バッファ103のバッファ占有量から減算する(ステップS205)。具体的には数3式により行われる。pal_cpb_occupancy(k) = pal_cpb_occupancy(k)-ピクチャkの発生ビット…(3)
ステップS205による発生ビットによる減算まで終了したあと、再びステップS203から処理を行うこととする(ステップS206)。そして符号前動画像データが保持する全てのピクチャについて符号化が終了した場合に処理を終了する。
そして、NTSC圏により行われる処理手順は、PAL圏により行われる処理手順のステップS201〜S206と同様にして、NTSC用仮想受信バッファ106の初期化から開始し、ピクチャk毎にループし、ピクチャk毎にバッファ占有量を増加させ、ピクチャk毎に発生ビット量の上限(ntsc_max_bits)及び下限(ntsc_min_bits)を導出し、さらにピクチャkの発生ビットをNTSC用仮想受信バッファ106のバッファ占有量から減算する(ステップS221〜ステップS226)。また、ステップS221によりNTSC用仮想受信バッファ106による符号化後動画像データのバッファ占有量(以下この変数をntsc_cpb_occupancy(k)とする)を初期化する数値はステップS201と同様にinitial_cpb_occupancyとする。
またステップS223における、NTSC用占有量加算部109によるNTSC用仮想受信バッファ106のバッファ占有量の加算は数4式により算出される。
ntsc_cpb_occupancy(k) = ntsc_cpb_occupancy(k-1)+ntsc_bit_rate×[(NTSC圏内のフレームレートでのピクチャkの引き去り時刻)−(NTSC圏内のフレームレートでのピクチャk−1の引き去り時刻)]…(4)
なお、NTSC圏内では3:2プルダウンが行われるため、”NTSC圏内のフレームレートでのピクチャkの引き去り時刻)−(NTSC圏内のフレームレートでのピクチャk−1の引き去り時刻)”はkの値により異なる。
また、ステップS225において、NTSC用仮想受信バッファ106のバッファ占有量からの減算は数5式により算出される。また当然ながらピクチャkの発生ビットは数3式と同じである。
ntsc_cpb_occupancy(k) = ntsc_cpb_occupancy(k)-ピクチャkの発生ビット…(5)
そして、符号量条件設定部108及び動画像符号化部101で行われる処理もピクチャkについて、kが0から符号前動画像データが保持する全てのピクチャについて符号化が終了するまでループする(ステップS211)。
そして符号量条件設定部108は、ステップS204により入力されたPAL圏におけるピクチャkの発生ビットの上限及び下限、そしてステップS224により入力されたNTSC圏におけるピクチャkの発生ビットの上限及び下限、のいずれの条件を満たすように符号化条件の設定を行う(ステップS212)。
まずは、PAL圏およびNTSC圏の両方の条件を満たした発生ビットの上限を数6式より算出する。
max_bits = min(pal_max_bits, ntsc_max_bits)…(6)
次に、PAL圏およびNTSC圏の両方の条件を満たした発生ビットの下限を数7式より算出する。
min_bits = max(pal_min_bits, ntsc_min_bits)…(7)
そして符号量条件設定部108は、数6式および数7式により算出されたmax_bits及びmin_bitsについて数8式が成立するような量子化値情報などの符号化条件を設定し、動画像符号化部101に出力する。
min_bits≦ピクチャkの発生ビット量≦max_bits…(8)
そして動画像符号化部101は、入力された符号化条件を満たすようにピクチャkについて符号化を行う(ステップS213)。また、ピクチャkの発生ビット量をPAL用占有量減算部102及びNTSC用占有量減算部105に出力する。
ステップS213によるピクチャkの符号化まで終了したあと、ループの開始であるステップS211から処理を行う(ステップS214)。そして符号前動画像データが保持する全てのピクチャについて符号化が終了した場合に処理を終了する。
次に、以上により構成された本実施の形態に係る動画像多重化編集装置1100が、PAL圏で再生するためのタイミングデータが挿入された符号化後動画像データについてNTSC圏で再生するためのタイミングデータに変更し、さらに多重化するまでの処理について説明する。図4は本実施の形態にかかる動画像符号化装置100により出力された、PAL圏で再生するためのタイミングデータが挿入された符号化後動画像データを、NTSC圏で再生するためのタイミングデータに変更し、さらに多重化するまでの全体処理を示すフローチャートである。
なお、動画像多重化編集装置1100において、動画像符号化データをPAL圏で再生するために行う多重化は、従来よく知られた処理手順と同様のため説明を省略する。
まず、符号化後動画像入力部1111は、PAL圏用のタイミングデータが挿入された符号化後動画像データを入力する(ステップS1201)。
次に、符号化後動画像記憶部1112は、符号化後動画像入力部1111により入力された符号化後動画像データを記憶する(ステップS1202)。
そして、符号化後動画像変更部1113は、符号化後動画像記憶部1112に記憶された符号化後動画像データが有するPAL圏用のタイミングデータを、NTSC圏用のタイミングデータに変更する(ステップS1203)。このタイミングデータの変更について具体的に説明する。
図5−1は、PAL圏用符号化後画像データのビット列を示す概念図である。本図は、説明の便宜上帯状の図を用いてビット列の記憶場所を表しているが、実際の記録媒体の形状を表すものではない。なお、PAL圏用符号化後画像データとは、PAL圏用に再生が可能である動画像データを意味する。
図5−2は、本実施の形態にかかる動画像多重化編集装置1100により生成されたNTSC圏用符号化後画像データのビット列を示す概念図である。本図も同様に上述したとおり、実際の記録媒体の形状を表すものではない。本図で示された網線領域は、符号化後動画像変更部1113により変更されたタイミング情報等の部分を表している。
そして符号化後動画像変更部1113は、図5−1のPAL圏用符号化後画像データから図5−2のNTSC圏用符号化後画像データを作成するために、PAL圏用符号化後画像データのPAL圏用のタイミングデータをNTSC圏用のタイミングデータに修正する。
以下にタイミングデータの修正箇所について、シーケンス毎に修正すべき箇所とピクチャ毎に修正すべき箇所に分けて説明する。
まず、符号化後動画像変更部1113は、シーケンス毎の修正として、符号化後画像を使用する際に利用されるデータであるVideo usabirily informationを修正する。最初にSequence Parameter SET RBSPのvui_parametersにおけるvideo_format情報の書き換えが必要である場合、ビデオフォーマットがPALであるのか、NTSCであるのかSECAMであるのか、MACであるのか判断し、適切な識別子を記述する。
なお、HTVにおいてPAL圏、NTSC圏についてHDTV独自の識別子が定義されることも考えられるが、圏の違いにより識別子の記述を切り替えるのであれば、新たに定義された識別子であるか否かを問わない。
符号化後動画像変更部1113は、PAL圏用符号化後画像データからNTSC圏用符号化後画像データを生成するために、PAL圏用符号化後画像データのvideo_format情報部を修正する。
符号化後動画像変更部1113は、Sequence Parameter SET RBSPのvui_parametersにおいてビットレート情報の記述を変更する。ビットレート情報の記述はvui_parameters中のhrd_parametersにあるbit_rate_value_minus1とbit_rate_scaleにより表されている。この場合、H.264バッファリングモデルのタイプに依存して設定の仕方が異なる。例えば、可変ビットレート(VBR)の場合にはNTSC圏、PAL圏によらず、共通の最大ビットレートを設定するため、記述の変更は不要である。一方、コンスタントビットレート(CBR)の場合はフレームレートの比と同一の比となるようにビットレートを設定する。
具体的な値であらわすと、フレームレートが25fpsであるPAL圏と24fpsであるNTSC圏における各ビットレートは数(9)式、数(10)式として設定される。
25×2^((6+bit_rate_scale)×N)…(9)
24×2^((6+bit_rate_scale)×N)…(10)
ここでbit_rate_scale=0、N=7500の場合、PAL圏のビットレートは12 Mbpsとなり、NTSC圏のビットレートは11.52 Mbpsとなる。これらビットレートを用いると、bit_rate_value_minus1はそれぞれ数(11)式、数(12)式となる。
25×2^N―1…(11)
24×2^N―1…(12)
また、フレームレートが25fpsと23.967fpsの場合、ビットレートは数(13)式、数(14)式となり、bit_rate_scale=0,N=187の場合bit_rate_value_minus1は数式15、数式16となる。
1001×2^((6+bit_rate_scale)×N)…(13)
960×2^((6+bit_rate_scale)×N)…(14)
1000×2^N―1…(15)
960×2^N―1…(16)
また図4に示す処理手順とは異なるが、動画像符号化装置100により符号化する際に、タイミングデータの領域にゼロスタッフィングした理由の詳細を説明する。コンスタントビットレート(CBR)の場合はフレームレート毎にbit_rate_value_minus1のコンテキストが異なるため、これを符号化した場合の符号長が異なる場合がある。例えば符号化後動画像のビットレートが11.52Mbpsであり、再生レートが24fpsであるとき、符号化後動画像データのビットレート情報の記述部分のbit_rate_value_minus1には数(16)式を符号化したビット列が記述されている。この符号化後動画像データを再生レートを25fpsに修正する場合、数(16)式を符号化したビット列を、数(15)式を符号化したビット列で置き換える。
なお、数(15)式を符号化したビット列が数(16)式を符号化したビット列より長く、かつゼロスタッフィングしていない場合、bit_rate_value_minus1以降のコンテキストにおいて符号化動画像データのビット位置がずれることとなる。つまりNTSC圏用符号化後動画像データはPAL圏用符号化後動画像データと比べてbit_rate_value_minus1以降のデータは、bit_rate_value_minus1の差分だけ後ろにずれる。
この場合、ビット位置のずれを考慮しながら、続く符号化情報を編集する必要があるが、最終的な符号化情報のトータルのビット量が記憶容量の制限より多くなる可能性もある。このため修正可能性のあるタイミングデータを含む符号化データの容量サイズの修正可能範囲を考慮して十分なサイズ分確保し、使用しない部分についてゼロスタッフィングすることとした。
図4のステップS1203の続きに戻り、符号化後動画像変更部1113は、データフレームレートを表すデータであり、Sequence Parameter SET RBSPのvui_parametersに含まれるtime_scaleとnum_units_in_tickの記述を変更する。本実施の形態おいてはtime_scaleとnum_units_in_tickの符号長は同一であるが、設定する値はフレームレートと3:2プルダウンにより変更される。
具体的にはPAL圏での25fpsの場合、time_scaleが25、num_units_in_tickが1とするのに対し、NTSC圏での23.976fpsであり、表示時に明示的3:2プルダウンを行う場合、time_scaleが60000、num_units_in_tickを1001とする。ここで自動的3:2プルダウンの場合はtime_scaleを24000、num_units_in_tickを1001とする。一方、NTSC圏24fpsで明示的3:2プルダウンを行う場合にはtime_scaleを30、num_units_in_tickを1とし、自動的3:2プルダウンを行う場合にはtime_scaleを24、num_units_in_tickを1とする。
次に、符号化後動画像変更部1113は、シーケンス毎の修正のうち、復号化、描画の際に利用されるデータであるSupplemental enhancement information メッセージを修正する。
具体的には、符号化後動画像変更部1113は、符号化後動画像の受信を開始してから、最初のピクチャを表示するタイミング情報であるbuffering_period_SEI中のinitial_cpb_removal_delayおよびinitial_cpb_remocal_delay_offsetを修正する。これらの符号長はSequence Parameter Set RBSPのvui_parameters中のhrd_parametersにより決定されるため、NTSC圏用、PAL圏用とで同一サイズとなるが、値はNTSC圏用/PAL圏用とで受信バッファのバッファ占有量が同一になるようにビットレートに応じた異なる値を設定する。つまり、このときのバッファ占有量をbuffer_occupancy、バッファのサイズをbuffer_sizeとした場合PAL圏用のinitial_cpb_removal_delay、initial_cpb_removal_delay_offsetが数(17)式、数(18)式であるのに対して、NTSC圏用の値は数(19)式、数(20)式となる。
initial_cpb_removal_delay=buffer_occupancy/bit_rate_for_pal…(17)
initial_cpb_removal_delay_offset=buffer_size/bit_rate_for_pal―initial_cpb_removal_delay…(18)
initial_cpb_removal_delay=buffer_occupancy/bit_rate_for_ntsc…(19)
initial_cpb_removal_delay_offset=buffer_size/bit_rate_for_ntsc―initial_cpb_removal_delay…(20)
さらに符号化後動画像変更部1113は、符号化後動画像データをピクチャ毎の修正を行う。
まず、符号化後動画像変更部1113は、復号時、描画時に必要なピクチャ間の処理の遅延時間を記述してある部分を修正する。つまり、pic_timing_SEIのcpb_removal_delay(DTSに対応)およびdpb_output_delay(PTSに対応)について、明示的に3:2プルダウンを行わない場合はNTSC圏用/PAL圏用とで同じ値を設定するが、明示的3:2プルダウンを行う場合はNTSC圏用/PAL圏用とで個別の値を設定する。
具体的にはPAL圏用は全てのピクチャにおいてcpb_removal_delay、 dpb_output_delayは1とするが、明示的に3:2プルダウン(3field,2field,3field,2fieldの場合)を行うNTSC圏用では、以下のようにピクチャ毎にcpb_removal_delayの値を修正する。
つまりcpb_removal_delayがピクチャ0の場合に0、ピクチャ1の場合に3、ピクチャ2の場合に2、ピクチャ3の場合に3、ピクチャ4の場合に2、以下同様となる。
次に符号化後動画像変更部1113は、ピクチャ毎の修正箇所として、pic_timing_SEIのpic_structを修正する。pic_structはピクチャの表示の仕方を示すものであり、明示的3:2プルダウン表示をしない場合にはframe表示を指定する。明示的プルダウン表示を行う場合、 (Top field,Bottom field,Top fieldの順で3field表示)、(Bottom field,Top field,Bottom fieldの順で3field表示)、(Top field,Bottom fieldの順で2field表示),(Bottom field,Top fieldの順で2filed表示)のどの表示形式で行うかをピクチャ毎に指定する。
また、符号化後動画像変更部1113は、pic_timing_SEIの各タイムスタンプ情報を必要に応じて適切に変更する。なお、本処理手順とは異なるが、上述したシーケンス毎の修正と同様にpic_timing_SEIの符号長がNTSC圏用/PAL圏用とで異なる場合は、動画像符号化装置100の動画像符号化部101においてbyte_stream_nal_units()単位で長いほうに合わせてサイズを決め、動画像生成装置による符号化時に使用しない部分にゼロスタッフィングしておくこととする。
以上により符号化後動画像変更部1113によるタイミングデータの変更は終了し、次の処理が行われることとなる。
そしてオーバーレイ画像変更部1101は、入力されたPAL圏で表示するためのオーバーレイ画像についてNTSC圏で再生可能とするためにタイミングデータを変更する(ステップS1204)。
さらにオーディオ選択部は、入力されたオーディオデータからNTSC圏で再生するために適したオーディオデータを選択する(ステップS1205)。
以上の処理によりタイミング情報のみの修正を行うだけで、ビデオ信号の再符号化を行うことなく、複数のフレームレートで再生可能な符号化動画像データをそれぞれのフレームレートで再生される符号化後動画像データに変更することが可能となる。これにより、複数のフレームレートで使用可能な一つの動画像符号化データから、簡単かつ高速にフレームレート毎に再生可能な動画像符号化データを生成することが可能になる。
上述した処理手順により、動画像多重化編集装置1100は、動画像符号化装置100により得られた符号化後動画像からタイミングデータ(video_format情報とbit_rate_value_minus1情報)を修正する。本実施の形態ではタイミングデータにゼロスタッフィングしているため、サイズの違いによるSequence Parameter SET RBSP以降のビット位置に変更がなく、また符号化動画像データのサイズも修正前後で変更がないため容易な修正が可能となった。
さらにタイミングデータが変更された動画像符号化データについて多重化することが可能となった。
さらに、動画像符号化装置100でゼロスタッフィングせずに、動画像多重化編集装置1100が符号量のずれを考慮しながら変更を行う場合、変更前の符号化後動画像データと変更後の符号化後動画像データの符号量サイズが異なるため、例えば符号量のずれのためHDDVD等の媒体に記録できなくなるなどの不具合も考えられる。しかし、動画像符号化装置100がゼロスタッフィングすることで、符号量サイズのずれを考慮する必要が無くなる。
なお、動画像符号化装置100でPAL圏用に再生レートをあわせて符号化し、動画像多重化編集装置1100でNTSC圏用に修正したが、最初にPAL圏用に再生レートをあわせて符号化し、後にNTSC圏用に修正してもよい。この場合も、動画像符号化装置100は、上述したとおりタイミングデータの領域のサイズを決定してから符号化する。そして動画像多重化編集装置1100により、タイミングデータ(video_format情報とbit_rate_value_minus1情報)を修正する際にタイミングデータの領域のサイズに満たない部分はゼロスタッフィングすることとする。
また、本実施の形態では、NTSC圏用とPAL圏用間の変更のみに制限するものではなく、他のビットレートによる変更であっても良い。
本実施の形態の動画像多重化編集装置1100により、一つの符号化後動画像データから、複数のフレームレート毎のコンテンツが作成可能なため、符号化のコストを減らし、なおかつ、コンテンツを保存するために必要な記憶容量を削減することが可能となる。
なお、本実施の形態に動画像符号化装置100で生成したPAL圏用符号化後画像データから動画像多重化編集装置1100によりNTSC圏用符号化語画像データに変更することに制限するものではない。例えば動画像符号化装置100で生成したNTSC圏用符号化語画像データからPAL圏用符号化後画像データを生成するため、符号化後動画像変更部1113がNTSC圏用符号化語画像データのタイミングデータを変更するなど、再生可能なフレームレート間でタイミングデータを変更するものであればよいこととする。
なお本実施の形態は、再生可能にする複数のフレームレートを、PAL圏用フレームレート及びNTSC圏用フレームレートのみに制限するものではない。例えば、SECAMあるはMACなど他のフレームレート毎に、仮想受信バッファ、占有量加算部、占有量減算部、符号量条件導出部を備えて、これら他のフレームレートの符号量の条件を満たすように符号量条件設定部108で符号化するための条件を設定することも可能である。
本実施の形態では、フレームレートをPAL圏用のフレームレート及びNTSC圏用のフレームレートの2つの場合の構成及び処理手順について説明したが、フレームレートが2つに制限するものではなく、より多い場合においても適用可能である。
また、NTSC圏用における3:2プルダウン以外のフレームレートの変動がある場合でも適用可能である。この場合、ピクチャの引き去り時刻の間隔がピクチャ番号に依存して変動するが、上述したNTSC圏用の処理手順と同様の処理手順を行えばよい。
また再生可能とする複数のフレームレートの全てにおいて各受信バッファがアンダーフローやオーバーフローしないような発生ビットの符号量の条件を設定して符号化を行い、ピクチャkの発生ビット量を制御するため、符号化された符号化動画像は複数のフレームレートで使用が可能となるため、複数のフレームレート毎に符号化を行うよりも、符号化にかかる時間を短縮し、符号化に必要なディスクスペースを低減することが可能となる。
また、本実施の形態では符号化を行う動画像符号化装置100と、タイミングデータの変更及び多重化を行う動画像多重化編集装置を異なる装置としたが、これらの構成を一つにまとめた装置で処理を行うことで、入力された符号化前動画像データから、複数のフレームレート毎に多重化された複数の符号化後動画像データを出力することにしても良い。
(第2の実施の形態)
第2の実施の形態は、データに変換する際にVBRによりレート制御を行う場合に適した動画像符号化装置300を説明する。そして符号化された符号化後動画像データを複数のフレームレートで使用するため、複数のフレームレートから最も高いフレームレートを選択し、選択されたフレームレートの仮想受信バッファでアンダーフローを発生させないように発生ビットの符号量を制御するものである。また、本実施の形態において、複数のフレームレートのピークレートは同一とする。これにより最も高いフレームレートのバッファ占有量が他のフレームレートのバッファ占有量を上回ることがなくなり、最も高いフレームレートのみ考慮すれば良いこととなる。
また、動画像符号化装置300により符号化された符号化後動画像データを多重化する動画像多重化編集装置は、第1の実施の形態で説明した動画像多重化編集装置1100と同じ構成要件を備えたものであるため、説明を省略する。
図6は、第2の実施の形態にかかる動画像符号化装置の構成を示すブロック図である。動画像符号化装置300は、動画像符号化部101、フレームレート選択部301、符号量条件設定部302、仮想受信バッファ管理部310から構成される。そして仮想受信バッファ管理部310は占有量減算部311、仮想受信バッファ312、符号量条件導出部313、占有量加算部314から構成される。これらの構成を備えることにより、動画像符号化装置800は、入力された符号前動画像データから複数のフレームレートで再生してもアンダーフローを発生しないような条件を満たした符号化後動画像データを出力することが可能となる。なお、VBRによりレート制御を行うときはオーバーフローを考慮しなくて良い。また、動画像符号化部101により行われる処理は第1の実施の形態と同じであるため説明を省略する。
本実施の形態では、動画像符号化装置300から出力された符号化後動画像データが再生可能な複数のフレームレートを、PAL圏で再生するためのフレームレートおよびNTSC圏用で再生するためのフレームレートとする。さらに、PAL圏で再生するためのフレームレートおよびNTSC圏用で再生するためのフレームレートでのピークレートは同じものとする。なお、再生する対象となるフレームレートを上述の二つに制限するものではない。
また、動画像符号化装置300から出力された符号化後動画データは、第1の実施の形態と同じく、PAL圏内で再生するためのタイミングデータが設定されているものとする。なお、出力される符号化後動画データをPAL圏内で再生するためのタイミングデータが設定されるものに制限するものではなく、再生可能はフレームレート中から選択されたフレームレートであれば良いものとする。
なお、NTSC圏内で再生するためのタイミングデータの変更は、第1の実施の形態と同様に、動画像多重化編集装置1100で行う。タイミングデータの変更の処理手順も第1の実施の形態と同じ処理手順なので省略する。
フレームレート選択部301は、複数あるフレームレートから最も高いフレームレートを選択する。本実施の形態においては、PAL圏で再生するためのフレームレート及びNTSC圏用で再生するための変動平均化フレームレートから、最も高いフレームレートであるPAL圏で再生するためのフレームレートを選択する。なお、最も高いフレームレートをPAL圏で再生するためのフレームレートに制限するものではない。
仮想受信バッファ管理部310は、フレームレート選択部301で選択された最も高いフレームレートを用いた場合による、符号量条件の導出までの処理を行う。以下に仮想受信バッファ管理部310を構成する仮想受信バッファ312、占有量加算部314、占有量減算部311、符号量条件導出部313について説明する。
仮想受信バッファ312は、フレームレート選択部301で選択された最も高いフレームレートによる再生時に用いられる受信バッファを仮想的に実現し、受信バッファが記憶可能な容量、及び動画像符号化部101から出力された符号化後動画像データが再生された場合の受信バッファ内のバッファ占有量を記憶する。
占有量加算部314は、フレームレート選択部301で選択された最も高いフレームレートの、ビットレートに応じたピクチャk―1の引き去り時刻からピクチャkの引き去り時刻までに増加するバッファ占有量を仮想受信バッファ312に加算する。
占有量減算部311は、フレームレート選択部301で選択された最も高いフレームレートでのピクチャkの引き去り時刻に、仮想受信バッファ312が記憶するバッファ占有量から、動画像符号化部101により符号化前動画像データを符号化して得られるピクチャkの発生ビットを減算する。なお、kは0から始まる整数とし、入力された符号化前動画像データが保持するピクチャの数だけあるものとする。
また本実施の形態は、再生する対象となる複数のフレームレートのなかに、例えばNTSC圏で再生するフレームレートのように変動のあるフレームレートがある場合、変動のあるフレームレートについては、変動を平均化した変動平均化フレームレートとして扱う。この変動平均化フレームでは、引き去り時刻も平均化した平均の引き去り時刻を用い、平均の引き去り時刻にピクチャkの発生ビットを減算することとする。
符号量条件導出部313は、占有量減算部311による仮想受信バッファ312に対するバッファ占有量の減算によりアンダーフローが発生しないように、動画像符号化部101から出力されるピクチャkの発生ビットの条件を導出する。
符号量条件設定部302は、符号量条件導出部313により導出される符号化後動画像データの転送量の条件を満たすように動画像符号化部101により符号化されるピクチャkの発生ビットの条件を導き、当該条件に合うように発生ビットの量を制御するために、量子化値情報、符号量に影響を与える符号化モード選択情報などの符号化条件を設定する。このように条件を設定することで、PAL圏及びNTSC圏においてアンダーフローが発生することがない条件を設定することが可能となる。
次に、以上により構成された本実施の形態に係る動画像符号化装置300において入力された符号化前動画像データからPAL圏及びNTSC圏で再生してもアンダーフローを生じない符号化後動画像データを出力するまでの処理について説明する。図7は本実施の形態にかかる動画像符号化装置300における入力された符号化前動画像データから符号化後動画像データを出力するまでの全体処理を示すフローチャートである。なお、上述したとおりPAL圏及びNTSC圏における各々のフレームレートに対応したピークレートは同じものとし、このピークレートをpeak_bit_rateとする。
まず仮想受信バッファ312について初期化を行う(ステップS411)。具体的には以下の数1式で示すように仮想受信バッファ312による符号化後動画像データのバッファ占有量(以下この変数をfirst_cpb_occupancy(k) とする))について初期バッファ占有量(以下この定数値をinitial_cpb_occupancyとする)を入力する。この入力を数21式に示す。
first_cpb_occupancy(-1)=initial_cpb_occupancy…(21)
フレームレート選択部は、最も高いフレームレートを選択する(ステップS412)。本実施の形態では、NTSC圏で再生するフレームレートもしくはPAL圏で再生するフレームレートから、最も高いフレームレートであるPAL圏で再生するフレームレートを選択する。
そしてピクチャkにおいてk=0から符号前動画像データが保持する全てのピクチャについて符号化を終了するまでステップS414からステップS416までの処理をループする(ステップS413)。
占有量加算部314は、最も高いフレームレートの、ビットレートに応じたピクチャk―1の引き去り時刻からピクチャkの引き去り時刻までに増加するバッファ占有量を仮想受信バッファ312に加算した値を用いてクリップする(ステップS414)。具体的には数22式により行われる。
first_cpb_occupancy(k) = clip(0, 受信バッファのサイズ, first_cpb_occupancy(k-1) + peak_bit_rate×[(フレームレートでのピクチャkの引き去り時刻)−(フレームレートでのピクチャk−1の引き去り時刻)])…(22)
なお、クリップ(Clip)とは、Clip(min,max,value)において、value<minならminとなり、value>maxならmaxとなり、min≦value≦maxの場合のみvalueとなる式をいう。
ただし、ピクチャ0(k=0の場合のピクチャをいう)においては、最も高いフレームレートでのピクチャk−1の引き去り時刻と最も高いフレームレートでのピクチャkの引き去り時刻は等しいものとして数22式により算出する。
そして符号量条件導出部313は、最も高いフレームレートにおいて仮想受信バッファ312においてピクチャkの引き去り直後にアンダーフローしないようにピクチャkの発生ビット量の上限(selected_max_bits)を導出し、符号量条件設定部302に出力する(ステップS415)。なお、ピクチャkの発生ビット量がselected_max_bitsとなった場合でもピクチャkの引き去り直後に仮想受信バッファ312のバッファ占有量が少なくとも1bitとなるようにselected_max_bitsを決定する。つまり(first_cpb_occupancy-1)≧selected_max_bitsとなる必要がある。また本実施の形態ではレート制御がVBRのため、発生符号量が小さい場合でもオーバーフローしないため、ピクチャkの発生ビット量の下限を導出する必要はない。
また、NTSC圏で再生するフレームレートのような変動するフレームレートの場合、平均の引き去り時刻に基づいて処理をおこなうため、実際の引き去り時刻とのずれにより、仮想受信バッファ312におけるバッファ占有量と実際に再生している場合のバッファ占有量との間にずれが生じる。しかし本実施の形態では考慮する必要はない。このバッファ占有量のずれを考慮する必要がない理由は後述する。
また、ピクチャkの引き去り直後に仮想受信バッファ312のバッファ占有量が少なくとも1bitとなるようにした理由について説明する。ピクチャk−1とピクチャkの間の引き去り時刻間隔では、バッファ占有量の増加分はその時刻間隔にpeak_bit_rateを掛けた値であるため小数ともなる。しかし、実際のバッファ占有量は整数であるため、計算上の値とは大きくとも1ビット未満のずれが生ずる。このため、ピクチャkの引き去り直後に仮想受信バッファ312のバッファ占有量が少なくとも1ビットとなるようにマージンを考慮してselected_max_bitsを決定することとした。これにより、他のフレームレートで再生を行う場合にもアンダーフローは発生しない。
占有量減算部311は、後述するステップS403において動画像符号化部101により入力されるピクチャkの発生ビット量を、仮想受信バッファ312のバッファ占有量から減算する(ステップS416)。具体的には数23式により行われる。
selected_cpb_occupancy(k) = selected_cpb_occupancy(k)-ピクチャkの発生ビット…(23)
ステップS416による発生ビットによる減算まで終了したあと、再びステップS414から処理を行うこととする(ステップS417)。そして符号前動画像データが保持する全てのピクチャについて符号化が終了した場合に処理を終了する。
そして、符号量条件設定部302及び動画像符号化部101で行われる処理もピクチャkについて、kが0から符号前動画像データが保持する全てのピクチャについて符号化が終了するまでループする(ステップS401)。
次に符号量条件設定部302は、ステップS415により入力されたselected_max_bitsによるピクチャkの発生ビットの上限の条件を満たすように符号化条件の設定を行う(ステップS402)。
さらに符号量条件設定部302は、数24式が成立するような量子化値情報などの符号化条件を動画像符号化部101に出力する。
ピクチャkの発生ビット量≦selected_max_bits…(24)
そして動画像符号化部101は、入力された符号化条件を満たすようにピクチャkについて符号化を行う(ステップS403)。また、ピクチャkの発生ビット量を占有量減算部311に出力する。
ステップS404によるピクチャkの符号化まで終了したあと、ループの開始であるステップS401から処理を行う(ステップS404)。そして符号前動画像データが保持する全てのピクチャについて符号化が終了した場合に処理を終了する。
図8は上述した処理手順により出力された符号化後動画像データの再生時の複数のフレームレートによる受信バッファのバッファ占有量の推移を示した図である。鎖線が最も高いフレームレートの推移を示した線で、網線がそれ以外のフレームレートの推移を示した線である。なお、受信バッファが記憶可能な領域のサイズはbmaxとする。
本実施の形態では、複数のフレームレートに対応するピークレートが同一である。そして本図により最も高いフレームレートの受信バッファのバッファ占有量は他のフレームレートの受信バッファのバッファ占有量を各ピクチャkの引き去り直前、直後にかかわらず常に同一であるか下回ることがわかり、決して上回ることはない。
そして最も高いフレームレートの受信バッファが図4で示した処理手順によりアンダーフローを生じないように制御しているため、他のフレームレートで再生を行う場合でも計算上、アンダーフローが発生することはない。
したがって、動画像符号化装置300は、上述した処理手順により複数のフレームレートで再生可能な符号化後動画像データの出力が可能となる。さらに一つのフレームレートのみ考慮して複数のフレームレートで再生可能な符号化が可能であるため、処理の負荷が軽減されることとなる。
また、’ピクチャkの引き去り時刻―ピクチャ(k―1) の引き去り時刻’は、PAL圏で再生するフレームレートでは常に同一期間となるが、NTSC圏で再生するフレームレートでは3:2プルダウンが行われるため同一期間とはならない。
この期間のずれのため、平均の引き去り時刻を用いた場合、仮想受信バッファのバッファ占有量と、実際に符号化後動画像データを再生した場合の受信バッファのバッファ占有量に、ずれが生じる。このバッファ占有量のずれは、最も高いフレームレートであるか否かにかかわらず発生する。
例えば符号化前動画像データである24000/1001 fps(frame/sec)を3:2プルダウンして、NTSC圏で再生可能な30000/1001 fpsつまり60000/1001 (field/sec)を実現するものとする。このときのビットレートはntsc_bit_rateとする。また3:2プルダウンのない場合となる変動平均化フレームレートは24000/1001 fpsとなる。
3:2プルダウンする場合、再生時の受信バッファからピクチャが引き去られる時刻間隔はピクチャ番号に依存して変動する。本実施の形態においては、NTSC圏では時刻間隔が3field,2field,3field,2fieldを規則的に繰り返すこととする。つまり変動平均化フレームレートの引き去り時刻が2.5field毎となるため、ずれは奇数のピクチャに限り、0.5fieldのみ正の値にずれるものとなる。また本実施の形態では、他の変動するフレームレートを用いる場合であっても、引き去り時刻は正の値にのみ、ずれるものに制限する。
より具体的に説明すると、変動ありフレームレートと変動平均化フレームレートで0枚目のピクチャを示すピクチャ0が引き去られる時刻を0とした場合、変動平均化フレームレートでピクチャ1が引き去られる時刻は1001/24000 (sec)となる。そして変動ありフレームレートでピクチャ1が引き去られる時刻は(1001/60000)×3 (sec)となる。この時刻のずれを数25式に示す。
(1001/60000)×3−1001/24000 = 1001/120000…(25)
このように変動平均化フレームレートと実際の変動ありフレームレートではピクチャ1の引き去り時刻に1000/120000秒のずれが生じることとなる。
図9は、変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでの引き去り時刻の差異を示した図である。本図では、網線が変動ありフレームレートにおける受信バッファからの各ピクチャの引き去り時刻であり、鎖線が変動平均化フレームレートにおける受信バッファから各ピクチャの引き去り時刻である。本図を参照すると、1ピクチャ毎に引き去り時刻が数25式により求められた1000/120000秒ずれる場合と一致する場合が周期的に繰り返されることがわかる。
このNTSC圏のための3:2プルダウンの場合は、2ピクチャが周期となるため、ずれの最大値は1000/120000秒となる。なお、変動ありフレームレートと変動平均化フレームレートが一致するまでの周期は、変動ありフレームレートにより異なり、この一致するまでの周期の中でバッファ占有量のずれの最大値を算出する必要がある。
図10は、変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでの引き去り時刻の差異により生じるバッファ占有量の推移のずれを示した図である。本図では、網線が変動ありフレームレートにおけるバッファ占有量の推移であり、鎖線が変動平均化フレームレートにおけるバッファ占有量の推移である。本図により、変動ありフレームレートの受信バッファは、変動平均化フレームレートとの間のピクチャの引き去り時刻のずれとともにバッファ占有量の推移にずれが生じる。
このバッファ占有量の推移のずれは数26式により算出される。
ntsc_bit_rate×[(変動ありフレームレートにおけるピクチャ2k'の引き去り時刻)−(変動平均化フレームレートにおけるピクチャ(2k'-1)の引き去り時刻)]…(26)
なお、数26式が示した、ずれとしては正の値の場合と負の値の場合が考えられる。つまり、3:2プルダウンにおいて、3field,2field,3fieild,2fieldという繰り返しでは図7で示したようにずれは正の値となるが、2field,3field,2fieild,3fieldではずれは負の値となる。なお、本実施の形態ではずれは正の値のみ扱うものとする。
そして本実施の形態で用いられる動画像符号化装置300でのレート制御は可変レートであるため、オーバーフローを考慮する必要はない。このため、平均の除去する時刻のずれが正の値となる場合、図7で示したように変動ありフレームレートによる推移は変動平均化フレームレートによる推移と比べて一致するか上回るかのどちらかであり、下回ることはない。つまり、本実施の形態のようにずれの値が正の値に限る場合、変動ありフレームレートと変動平均化フレームレートのバッファ占有量の違いによるアンダーフローは生じないため、ずれを考慮する必要はない。つまり本実施の形態の動画像符号化装置300では特別な処理を必要としない。
なお、本実施の形態は、複数のフレームレートをPAL圏またはNTSC圏に制限するものではない。また、本実施の形態は、動画像符号化装置300に用いられる複数のフレームレートをピークレートが同一であるものに制限するものではなく、例えば最も高いフレームレートのピークレートより、最も高いフレームレート以外の他のフレームレートのピークレートが低い場合などが考えられる。また、最も高いフレームレートのピークレートより他のピークレートの方が高い場合は、それによるずれを考慮して符号化するための条件を設定すればよい。
本実施の形態における動画像符号化装置300は、再生可能とする複数のフレームレートから最も高いフレームレートにおいて受信バッファがアンダーフローしないようにピクチャkの発生ビット量を制御するため、符号化された符号化動画像は複数のフレームレートで使用が可能となる。これにより複数のフレームレート毎に符号化を行うよりも、符号化にかかる時間を短縮し、符号化に必要なディスクスペースを低減することが可能となる。
(第3の実施の形態)
図11は、第3の実施の形態にかかる、動画像符号化装置の構成を示すブロック図である。本実施の形態にかかる動画像符号化装置800は、データに変換する際にVBRによりレート制御を行う場合に適している。なお、動画像符号化装置800は、第2の実施の形態の動画像符号化装置300に、ずれ算出部801を加えたものである。このような構成を備えることにより、動画像符号化装置800は、再生可能な複数のフレームレートの中の、変動のあるフレームレートで生じる平均の除去する時刻のずれが負の値でも、アンダーフローを発生しないような条件を満たした符号化後動画像データを出力することが可能となる。なお、VBRによりレート制御を行うときはオーバーフローを考慮しなくて良い。以下の説明では、上述した第2の実施の形態と同一の構成要素には同一の符号を付してその説明を省略している。
また、動画像符号化装置800により符号化された符号化後動画像データを多重化する動画像多重化編集装置は、第1の実施の形態で説明した動画像多重化編集装置1100と同じ構成要件を備えたものであるため、説明を省略する。
ずれ算出部801は、実際の引き去り時刻と平均引き去り時刻の違いにより生じる、実際の受信バッファのバッファ占有量と平均引き去り時刻による受信バッファのバッファ占有量のずれの最大値を算出し、符号量条件導出部811にずれの最大値を出力する。
ずれ算出部801は、符号化後動画像データが再生可能なフレームレートの中に変動があるフレームレートが複数ある場合は、変動があるフレームレートの中で最も大きいバッファ占有量のずれを算出する。
本実施の形態においては、複数のフレームレートをPAL圏で再生するフレームレートとNTSC圏で再生するフレームレートとするが、本実施の形態に適用可能なフレームレートを、この2つのフレームレートに制限するものではない。また、本実施の形態では、ずれの最大値の算出をNTSC圏での3:2プルダウンを用いて説明するが、ずれの最大値の算出を3:2プルダウンに制限するものではない。なお、このずれの算出方法は後述する。
また、3:2プルダウンする場合、受信バッファからピクチャが引き去られる時刻間隔はピクチャ番号に依存して変動する。本実施の形態においては、NTSC圏では時刻間隔が2filed,3field,2field,3fieldを規則的に繰り返す。なお、動画像符号化装置800では、変動するフレームレートによる平均の引き去り時刻と実際の引き去り時刻のずれは、正の値もしくは負の値のどちらでもよい。
符号量条件導出部811は、ずれ算出部801により算出されたずれの最大値を予め考慮に入れて、動画像符号化部101から出力されるピクチャkの発生ビットの条件を導出する。具体的には、仮想受信バッファ312が保持する受信バッファが記憶可能な領域において、バッファ占有量が、ずれ算出部から入力されたずれの最大値の値を下回らないように、ピクチャkの発生ビット量の上限(selected_max_bits)を導出する。
図12は、変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでの引き去り時刻のずれが負の値である場合の引き去り時刻の差異により生じるバッファ占有量の推移のずれを示した図である。
変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでのずれがtdiff_2であり、時間の経過に伴うバッファ占有量の増加比率は一定であるため、時刻のずれtdiff_2が定められた値であれば、バッファ占有量のずれであるbdiff_2も定められた数となる。そして受信バッファの下限値0から一定のマージンbmin'をとり、bmin'≧bdiff_2が成立すれば、アンダーフローは生じないこととなる。
つまり符号量条件導出部811は、アンダーフローが生じないような条件を導出するためには、ずれ算出部801から入力されたずれの最大値を、受信バッファの実際の下限値(本実施の形態では’0’)に加えた値を下限値として設定する。そして符号量条件導出部811は、この設定された下限値を下回らないような符号化条件を導出すれば、最大のずれが生じている場合であって、かつピクチャkの引き取り時刻であってもアンダーフローが生じないこととなる。具体的には、符号量条件導出部313は、仮想受信バッファ312においてピクチャkの引き去り直後にバッファ占有量が、少なくともmax(ずれの最大値、1bit)となるようにfirst_max_bitを決定する。
このような構成を備えることで動画像符号化装置800は、再生する対象となる複数のフレームレートにおいて、変動するフレームレートがあり、且つ、この変動によるずれが正の値あるいは負の値にかかわらず、アンダーフローを発生させないような符号化が可能となる。
次に、以上により構成された本実施の形態に係る動画像符号化装置800により符号化された符号化後動画像データについて、ずれ算出部801が再生可能な全フレームレートでのずれの最大値を算出するまでの処理について説明する。図13は本実施の形態にかかる動画像符号化装置800のずれ算出部801が再生可能な全フレームレートでのずれの最大値を算出するまでの処理を示すフローチャートである。
まず、ずれ算出部801は、全フレームレートのずれの最大値(bdif_max)を0に初期化する(ステップS501)。
そして、ずれ算出部801は、再生可能とする全フレームレートについてステップS503からステップS511までの処理手順を行うためにループを開始する(ステップS502)。本実施の形態ではNTSC圏で再生するためのフレームレート及びPAL圏で再生するためのフレームレートについてステップS503からステップS511までの処理手順が行われる。
まず、ずれ算出部801は、フレームレートlが変動のあるフレームレートであるか否か判定する(ステップS503)。変動のあるフレームレートと判定した場合(ステップS503:Yes)、フレームレートlのずれの最大値(bdif_(l)_max)を0で初期化する(ステップS504)。本実施の形態では、NTSC圏で再生するためのフレームレートの場合に変動のあるフレームレートと判定される。
次にずれ算出部801は、フレームレートlのピクチャ毎にループして(ステップS505)、引き去り時刻の変動に基づく受信バッファのバッファ占有量のずれを調べる。このステップS506からステップS508までの処理は、変動ありフレームレートlとこの変動平均化フレームレートの除去する時刻がずれ始めてから一致するまでの1周期分の各ピクチャについて繰り返せばよい。なお、ずれが生じないことが明らかなピクチャについてはステップS506からステップS508までの処理を省略してもよい。
そしてずれ算出部801は、変動ありフレームレートにおけるピクチャkの引き去り時刻における、この変動ありフレームレートの受信バッファのバッファ占有量と、フレームレートkの変動を平均化した変動平均化フレームレートの受信バッファのバッファ占有量のずれの値(bdif_(l)_(k))を算出する(ステップS506)。具体的にはNTSC圏で再生するためのフレームレートにおいては上述した数12式により算出された値がずれの値となる。
ずれ算出部801は、ステップS506により算出されたずれの値(bdif_(l)_(k))が、ずれの最大値(bdif_(l)_max)をより大きいか否か判定する(ステップS507)。
そして、ずれ算出部801は、ずれの値(bdif_(l)_(k))がずれの最大値(bdif_(l)_max)より大きいと判定した場合(ステップS507:Yes)、ずれ算出部801は、ずれの最大値(bdif_(l)_max)をずれの値(bdif_(l)_(k))で更新する(ステップS508)。ずれの値(bdif_(l)_(k))がずれの最大値(bdif_(l)_max)より小さいと判定した場合(ステップS507:No)、特に処理は行わないものとする。
これでピクチャkについての処理は終了する(ステップS509)。そして一周期分の各ピクチャについてステップS506からステップS508までの処理が終了していない場合、次のピクチャk+1についての処理を開始する(ステップS505)。
次に、ずれ算出部801は、フレームレートkの処理により求められたずれの最大値(bdif_(l)_max)が、全フレームレートでのずれの最大値(bdif_max)より大きいか否か判定する(ステップS510)。ずれの最大値(bdif_(l)_max)が、全フレームレートでのずれの最大値(bdif_max)より大きいと判定した場合(ステップS510:Yes)、全フレームレートでのずれの最大値(bdif_max)をずれの最大値(bdif_(l)_max)で更新する(ステップS511)。ずれの最大値(bdif_(l)_max)が、全フレームレートでのずれの最大値(bdif_max)より小さいと判定した場合(ステップS510:No)、特に処理は行わない。
ずれ算出部801は、フレームレートlに変動がないと判定した場合(S503:No)、ずれの最大値(bdif_(l)_max)が、全フレームレートでのずれの最大値(bdif_max)より小さいと判定した場合(ステップS510:No)あるいはS511まで処理手順が終了した場合は、フレームレートlについての処理は終了し(ステップS512)、再びフレームレートl+1についての処理を開始する(ステップS502)。なお、全てのフレームレートの処理が終了した場合にはループせずに終了する。
上述した処理手順により、全てのフレームレートでのずれの最大値を取得することが可能となる。そして符号量条件導出部811は、ずれ算出部801により入力されたずれの最大値を考慮して、符号量の条件を導出する。
そして、ずれ算出部801が算出したずれの最大値を考慮して符号量条件導出部811符号量条件を導出し、この符号量条件を満たすように発生ビットの量を制御するために、量子化値情報、符号量に影響を与える符号化モード選択情報などの符号化条件を符号量条件設定部302が設定し、この設定された符号化条件に基づいて動画像符号化部101が入力された符号化前動画像データを符号化するため、変動ありフレームレートによるずれが正の値あるいは負の値に関わらずアンダーフローを生じない符号化後動画像データの出力が可能となった。
(第4の実施の形態)
図14は、第4の実施の形態にかかる動画像符号化装置1400の構成を示すブロック図である。動画像符号化装置1400は、データに変換する際にCBR(Constant Bit Rate)によりレート制御を行う場合に適している。動画像符号化装置1400は、第1の実施の形態の動画像符号化装置100とは動画像符号化部1401による処理が異なるものである。このような構成を備えることで複数のフレームレートで再生可能なタイミングデータを備えた符号化後動画像データの出力が可能となる。
なお、本実施の形態の動画像符号化部1401による符号化の処理は本実施の形態による構成に限り可能とするものではなく、例えば第2の実施の形態あるいは第3の実施の形態における動画像符号化部101を動画像符号化部1401に変更することで、同様の処理を行うことが可能である。
なお、本実施の形態においては、複数のフレームレートにおけるタイミングデータが符号化後動画像データに含まれるため、動画像多重化編集装置1100によるタイミングデータの変更は不要となる。そして多重化する際に、複数のフレームレートのタイミングデータを有したオーバーレイ画像及び複数のフレームレート分のオーディオデータとともに多重化を行う。本実施の形態において、この多重化方法は従来よく知られた方法を用いることとするが、従来よく知られた方法に制限するものではない。
動画像符号化部1401は、符号量条件設定部108により設定された符号化するための条件に従って入力された符号化前動画像データを符号化し、複数のフレームレートによるタイミングデータを付加した後、符号化後動画像データを出力する。また本実施の形態において、動画像データを符号化する方法はH.264を用いて行う。また、符号化方法をH.264に制限するものではなく、例えば、MPEG2などが考えられる。
図15−1は、動画像符号化部1401により出力された符号化後動画像データの一例を示した図である。本図で示すようにタイミングデータの挿入箇所に複数のフレームレートに対応するタイミングデータが挿入されている。このため、符号化後動画像データを再生時する際、挿入されたタイミングデータに対応するフレームレートであれば、再生が可能となる。また、複数のタイミングデータの挿入方法として他の態様も考えられる。
図15−2は、本実施の形態とは別の形態による動画像符号化部により出力された符号化後動画像データの一例を示した図である。本図は、タイミングデータの挿入箇所として一つのフレームレートは従来と同じ箇所に挿入し、他のフレームレートは最後に付加したものである。このような構造を備えることで、一つのフレームレートにおいては従来通り再生が可能であり、他のフレームレートについては最後に付加されたタイミングデータを参照することで再生が可能となる。
本実施の形態における動画像符号化装置1400により、符号化された符号化後動画像データは、複数のフレームレートにおいてアンダーフローもオーバーフローも生じず、さらに複数のフレームレートに対応付けられたタイミングデータを複数付加されたため、複数のフレームレートにおいて符号化後動画像データは再生可能となる。
(変形例)
本発明は、上述した各実施の形態に限定されるものではなく、以下に例示するような種
々の変形が可能である。
(変形例1)
例えば各実施の形態においては、符号量条件設定部(108、302)により設定される符号化する条件、あるいは動画像符号化部(101、1401)により符号化された発生ビットはピクチャ毎に処理を行っていた。しかし、ピクチャをスライス、マクロブロック、ブロック等の小さい画像単位に分解して、その画像単位符号化終了毎に、符号化による発生ビットを占有量減算部(105、311)より(PAL用、NTSC用)仮想受信バッファ(103,106、312)から減算し、(PAL用、NTSC用)符号量条件導出部(104、107、313)は画像単位毎に発生ビットの上限、下限を導出し、符号量条件設定部(108、302)で当該画像単位ごとの量子化値情報,符号量に影響を与える符号化モードの選択情報などの符号化条件を動画像符号化部(101、1401)に出力しても良い。
図16は、マクロブロック毎の行われる符号化の処理手順を示した図である。なお、説明を容易にするため第1の実施の形態におけるNTSC圏の仮想受信バッファ(106)等を用いた場合の処理手順である図3で示したステップS221〜S226までの処理手順の代わりとなる処理手順について説明する。なお、画像単位をマクロブロックに制限するものではなく、スライスやブロック等でもよい。
まずは第1の実施の形態の図3のステップS221〜S223と同様にして、NTSC用仮想受信バッファ106の初期からNTSC用占有量加算部110による加算まで行われる(ステップS1601〜S1604)。
つぎに、ピクチャkのマクロブロックmについてステップS1604〜S1606までを繰り返し処理を行う。NTSC用符号量条件導出部107ではピクチャkの発生符号量の下限、上限の条件に合うようにマクロブロックmを符号化するための符号化条件(量子化値や選択する符号化モード等、発生ビット量に影響を与える符号化時の条件)導出し、符号量条件設定部108に出力する(ステップS1605)。
そして、図3のステップS212及びS231とは、ピクチャkがマクロブロックmに置き換わった点で異なるが、他については同様の処理により、動画像符号化部101によりマクロブロックmを符号化した発生ビットがNTSC用占有量減算部105に入力される(図示しない)。そしてNTSC用占有量減算部105は入力された発生ビットをNTSC用仮想受信バッファ106から減算する(ステップS1606)。そしてマクロブロックmについての処理が終了し(ステップS1607)、次のマクロブロックm+1についての処理が開始される(ステップS1604)。そして、ピクチャkのマクロブロック全ての処理が終了した場合、次のピクチャk+1についての処理が開始される(ステップS1608)。
本変形例で示したように、動画像符号化装置による動画像データの符号化を行う画像単位はピクチャ以外でも可能となる。
(変形例2)
また第1の実施の形態においてフレームレートとビットレートの対応について特に制限しなかったが、複数のフレームレートの比が複数のフレームレートにおけるビットレートの比となるようにしてもよい。
例えば、PAL圏で再生するフレームレートとNTSC圏で再生するフレームレートにそれぞれ対応したPAL圏で再生するビットレートとNTSC圏で再生するビットレートを次のようにする。PAL圏で再生するビットレート(pal_bit_rate)とNTSC圏で再生するビットレート(ntsc_bit_rate)の比をPAL圏で再生するフレームレートとNTSC圏で再生するフレームレートの比と一致させる。つまり、NTSC圏で再生するビットレートをPAL圏で再生するビットレート×(NTSC圏で再生するフレームレート/PAL圏で再生するフレームレート)とする。
図17は、変形例2にかかる動画像符号化装置により符号化された符号化後動画像データの再生時において、PAL圏でのフレームレートとNTSC圏でのフレームレートによるバッファ占有量の推移を示した図である。本図に示したように、フレームレートの違いにより除去する時刻の差が生じても、除去する情報量は同じであり、バッファ占有量の最大値および最小値は一致する。
しかしながら、実際はpal_cpb_occupancy(k)およびntsc_cpb_occupancy(k)は整数値であるため、切り上げ切り下げによる誤差が発生する。従って多くとも1ビット未満のずれが生じる可能性がある。このことを、以降では一ビット未満の誤差で一致していると表現する。
つまり、フレームレートとビットレートの比を一致させ、仮想受信バッファに1ビットのマージンを有した場合、レート制御がCBRであっても、図6に示すような一つのフレームレートのみに対応付けられた占有量加算部、占有量減算部、仮想受信バッファ、符号量条件導出部を備えた動画像符号化装置により符号化後動画像データの出力が可能となる。
したがって、再生する対象となる複数のフレームレートと、複数のフレームレートのビットレートの比を一致させ、仮想受信バッファに1ビットのマージンを有する場合、レート制御がCBRであっても、一つのフレームレートについてアンダーフロー及びオーバーフローにならないように動画像データを符号化することで、再生する対象となるフレームレートにおいてアンダーフロー及びオーバーフローが発生しない動画像符号化データの生成が可能となる。これにより動画像符号化装置による符号化処理による付加が軽減されることとなる。
(変形例3)
第1の実施の形態にかかる動画像符号化装置100では、NTSC圏で再生されるフレームレートのように変動のあるフレームレートでは、変動にあわせて除去する時刻を設定していた。しかし、第1の実施の形態にかかる動画像符号化装置と同様の構成を備えた動画像符号化装置でも、変動のあるフレームレートにおいて、第2または3の実施の形態のように平均の除去する時刻を設定して、発生ビットを減算しても良い。
本変形例においては、第1の実施の形態にかかる動画像符号化装置と同様の構成に加え、さらにずれ算出部を備えた動画像符号化装置とする。そして本変形例の動画像符号化装置において、レート制御がCBRの場合の処理について説明する。まずは変動のあるフレームレートにおける除去する時刻と、変動のあるフレームレートの変動を平均化した変動平均化フレームレートにおける除去する時刻のずれが負の値の場合は、第3の実施の形態の動画像符号化装置と同様にアンダーフローを発生しないような条件を満たした符号化後動画像データを出力する必要がある。そのために第3の実施の形態と同様に、受信バッファの下限値からずれの最大値以上のマージンを取ることで、アンダーフローを発生しないようにすることが可能となる。
そして、レート制御がCBRの場合は、オーバーフローを発生しないように制御する必要もあり、変動のあるフレームレートにおける除去する時刻と、変動のあるフレームレートの変動を平均化した変動平均化フレームレートにおける除去する時刻のずれが正の値の場合でもずれを考慮した符号化を行う必要がある。
図18は、変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでの引き去り時刻のずれが正の値である場合の引き去り時刻の差異により生じるバッファ占有量の推移のずれを示した図である。
変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでのずれがtdiff_1の場合のバッファ占有量のずれがbdiff_1とする。この場合、受信バッファの上限値bmaxから一定のマージンをとった最大値bmax'を設定し、bmax−bmax'≧bdiff_1が成立すれば、オーバーフローは生じないこととなる。
つまり、本変形例の動画像符号化装置は、ずれが正の値ならば、NTSC用条件導出部においてずれ算出部により算出されたずれの最大値以上のマージンを取った最大値bmax'を用いて発生ビットの条件を設定し、ずれが負の値ならば、NTSC用条件導出部において、第3の実施の形態と同様にずれ算出部により算出されたずれの最大値以上のマージンを取った最小値bminを用いて発生ビットの条件を導出する。さらにずれが正の値および負の値両方ともある場合、ずれの最大値以上のマージンを取った最大値bmax'及びずれの最大値以上のマージンを取った最小値bminの両方を用いて発生ビットの条件を導出する。
なお、本変形例での変動のあるフレームレートをNTSC圏で再生できるフレームレートに制限するものではない。
以上のように、本発明にかかる動画像符号化装置、動画像符号化方法は、入力された入力動画像情報を符号化して符号化データとして出力する装置等に有用であり、特に一つの符号化された符号化データから複数のフレームレートで再生可能にする技術に適している。
第1の実施の形態にかかる動画像符号化装置の構成を示したブロック図である。 第1の実施の形態にかかる動画像多重化編集装置の構成を示したブロック図である。 第1の実施の形態にかかる動画像符号化装置における入力された符号化前動画像データから符号化後動画像データを出力するまでの全体処理を示すフローチャートである。 第1の本実施の形態にかかる動画像符号化装置において、PAL圏で再生するためのタイミングデータが挿入された符号化後動画像データをNTSC圏で再生するためのタイミングデータに変更し、さらに多重化するまでの全体処理を示すフローチャートである。 第1の実施の形態にかかるPAL圏用符号化後画像データのビット列の概念を示した図である。 第1の実施の形態にかかる動画像多重化編集装置により生成されたNTSC圏用符号化後画像データのビット列の概念を示した図である。 第2の実施の形態にかかる動画像符号化装置の構成を示したブロック図である。 第2の実施の形態にかかる動画像符号化装置における入力された符号化前動画像データから符号化後動画像データを出力するまでの全体処理を示したフローチャートである。 第2の実施の形態にかかる動画像符号化装置により出力された符号化後動画像データの再生時の複数のフレームレートによる受信バッファのバッファ占有量の推移を示した図である。 NTSC圏で再生するための変動するフレームレートを平均化した変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでの引き去り時刻の差異を示した図である。 NTSC圏で再生するための変動するフレームレートを平均化した変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでの引き去り時刻の差異により生じるバッファ占有量の推移のずれを示した図である。 第3の実施の形態にかかる動画像符号化装置の構成を示すブロック図である。 NTSC圏で再生するための変動するフレームレートを平均化した変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでの引き去り時刻のずれが負の値である場合の引き去り時刻の差異により生じるバッファ占有量の推移のずれを示した図である。 第3の実施の形態にかかる動画像符号化装置のずれ算出部が再生可能な全フレームレートでのずれの最大値を算出するまでの処理を示すフローチャートである。 第4の実施の形態にかかる動画像符号化装置の構成を示すブロック図である。 第4の実施の形態にかかる動画像符号化装置により出力された符号化後動画像データの一例を示した図である。 第4の実施の形態とは別の形態による動画像符号化装置により出力された符号化後動画像データの一例を示した図である。 変形例1にかかる動画像符号化装置による画像単位毎の行われる符号化の処理手順を示した図である。 変形例2にかかる動画像符号化装置により符号化された符号化後動画像データの再生時において、PAL圏でのフレームレートとNTSC圏でのフレームレートによるバッファ占有量の推移を示した図である。 NTSC圏で再生するための変動するフレームレートを平均化した変動平均化フレームレートの引き去り時刻とNTSC圏で再生する場合のフレームレートでの引き去り時刻のずれが正の値である場合の引き去り時刻の差異により生じるバッファ占有量の推移のずれを示した図である。
符号の説明
100、300、800、1400 動画像符号化装置
101、1401 動画像符号化部
102 PAL用占有量減算部
103 PAL用仮想受信バッファ
104 PAL用符号量条件導出部
105 NTSC用占有量減算部
106 NTSC用仮想受信バッファ
107 NTSC用符号量条件導出部
108、302 符号量条件設定部
109 PAL用占有量加算部
110 NTSC用占有量加算部
301 フレームレート選択部
310 仮想受信バッファ管理部
311 占有量減算部
312 仮想受信バッファ
313 符号量条件導出部
314 占有量加算部
801 ずれ算出部
811 符号量条件導出部
1100 動画像多重化装置
1101 オーバーレイ画像変更部
1102 オーディオ選択部
1110 動画像タイミング変更部
1111 符号化後動画像入力部
1112 符号化後動画像記憶部
1113 符号化後動画像変更部
1120 多重化部
1121 PAL用多重化部
1122 NTSC用多重化部

Claims (15)

  1. 1秒ごとに24フレーム表示する入力動画像を符号化して、符号化データを出力する動画像符号化装置において、
    PAL規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する第1の受信記憶領域に占める第1の占有量を記憶する第1の記憶手段と、
    前記符号化データの再生時に前記第1の受信記憶領域が受信した前記符号化データの第1の受信量、及び前記符号化データの再生時に表示される各画像の第1の符号量に基づいて、前記第1の記憶手段が記憶する前記第1の占有量を変動させる第1の変動手段と、
    前記第1の変動手段により変動した前記第1の占有量に基づいて、前記PAL規格フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記第1の符号量の条件を示す第1の符号量条件を導出する第1の導出手段と、
    NTSC規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する第2の受信記憶領域に占める第2の占有量を記憶する第2の記憶手段と、
    3:2プルダウンを用いた前記符号化データの再生時に前記第2の受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の第2の符号量に基づいて、前記第2の記憶手段が記憶する前記第2の占有量を変動させる第2の変動手段と、
    前記第2の変動手段により変動した前記第2の占有量に基づいて、前記NTSC規格フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記第2の符号量の条件を示す第2の符号量条件を導出する第2の導出手段と、
    前記第1の導出手段により導出された前記第1の符号量条件と、前記第2の導出手段により導出された前記第2の符号量条件とを満たす符号量で、前記入力動画像を符号化する符号化手段と、
    を備えることを特徴とする動画像符号化装置。
  2. 前記第1の変動手段は、
    前記第1の記憶手段が記憶する前記第1の占有量に、前記PAL規格フレームレートによる前記符号化データの再生時にビットレートに応じて前記第1の受信記憶領域が受信した前記符号化データの受信量を加算する第1の加算手段と、
    前記第1の記憶手段が記憶する前記第1の占有量から、前記PAL規格フレームレートによる前記符号化データの再生時に前記符号化データを除去する時刻に、前記符号化手段により前記入力動画像を符号化して得られた前記符号化データの再生時に表示する前記各画像の前記符号量を減算する第1の減算手段と、を有し、
    前記第2の変動手段は、
    前記第2の記憶手段が記憶する前記第2の占有量に、前記NTSC規格フレームレートによる前記符号化データの再生時にビットレートに応じて前記第2の受信記憶領域が受信した前記符号化データの受信量を加算する第2の加算手段と、
    前記第2の記憶手段が記憶する前記第2の占有量から、前記NTSC規格フレームレートによる3:2プルダウンを用いた前記符号化データの再生時に前記符号化データを除去する時刻に、前記符号化手段により前記入力動画像を符号化して得られた前記符号化データの再生時に表示する前記各画像の前記符号量を減算する第2の減算手段と、を有すること、
    を特徴とする請求項1に記載の動画像符号化装置。
  3. 前記第1の導出手段は、前記第1の減算手段により前記符号量を減算する前での、前記第1の記憶手段に記憶する前記第1の占有量の最大量を上限とし、及び前記第1の減算手段により前記符号量を減算する前での前記第1の占有量の最大量に、次回の前記第1の減算手段による減算処理まで前記第1の加算手段により加算される前記受信量を加え、前記第1の受信記憶領域の記憶可能な上限量を差し引いた量を下限とした、前記各画像の前記符号量の条件を示す前記符号量条件を導出し、
    前記第2の導出手段は、前記第2の減算手段により前記符号量を減算する前での、前記第2の記憶手段に記憶する前記第2の占有量の最大量を上限とし、及び前記第2の減算手段により前記符号量を減算する前での前記第2の占有量の最大量に、次回の前記第2の減算手段による減算処理まで前記第2の加算手段により加算される前記受信量を加え、前記第2の受信記憶領域の記憶可能な上限量を差し引いた量を下限とした、前記各画像の前記符号量の条件を示す前記符号量条件を導出すること、
    を特徴とする請求項2に記載の動画像符号化装置。
  4. 1秒ごとに24フレーム表示する入力動画像を符号化して、符号化データを出力する動画像符号化装置において、
    PAL規格フレームレートでは第1のビットレートで再生され且つNTSC規格フレームレートでは第2のビットレートで再生される前記符号化データであって、前記PAL規格フレームレートと前記NTSC規格フレームレートとの比、および、前記第1のビットレートと前記第2のビットレートとの比の両方が一致する前記符号化データを出力する際、前記PAL規格フレームレート及び前記NTSC規格フレームレートから、任意に選択された一つのフレームレートを示す選択フレームレートによる前記符号化データの再生時の受信記憶領域に占める占有量を記憶する記憶手段と、
    前記選択フレームレートによる前記符号化データの再生時において、前記受信記憶領域が受信した前記符号化データの受信量及び表示される各画像の符号量に基づいて、前記記憶手段が記憶する前記占有量を変動させる変動手段と、
    前記変動手段により変動した前記占有量に基づいて、前記選択フレームレートによる前記符号化データの再生時に前記受信記憶領域で1ビットのマージンを有するよう、表示される次の画像が満たすべき前記符号量の条件を示す符号量条件を導出する導出手段と、
    前記導出手段により導出された前記符号量条件を満たす符号量で、前記入力動画像を符号化する符号化手段と、
    を備えることを特徴とする動画像符号化装置。
  5. 1秒ごとに24フレーム表示する入力動画像を可変ビットレートで符号化して符号化データを出力する動画像符号化装置において、
    前記符号化データを再生する対象となるPAL規格フレームレート、及び前記符号化データを3:2プルダウンで再生する対象となるNTSC規格フレームレートを含む複数のフレームレートから、フレームレートが最も高いPAL規格フレームレートを選択する選択手段と、
    前記PAL規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する受信記憶領域に占める占有量を記憶する記憶手段と、
    前記PAL規格フレームレートによる前記符号化データの再生時に前記受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の符号量に基づいて、前記記憶手段が記憶する前記占有量を変動させる変動手段と、
    前記変動手段により変動した前記占有量に基づいて、前記選択手段により選択された前記フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記符号量の条件を示す符号量条件を導出する導出手段と、
    前記導出手段により導出された前記符号量条件を満たす符号量で、前記入力動画像を符号化する符号化手段と、
    を備えることを特徴とする動画像符号化装置。
  6. 前記変動手段は、
    前記記憶手段が記憶する前記占有量に、前記選択手段により選択された前記フレームレートによる前記符号化データの再生時に前記可変ビットレートに応じて前記受信記憶領域が受信した量を示す受信量を加算する加算手段と、
    前記記憶手段が記憶する前記占有量から、前記選択手段により選択された前記フレームレートによる前記符号化データの再生時に前記符号化データを除去する時刻に、前記符号化手段により前記入力動画像を符号化して得られた前記符号化データの再生時に表示する前記各画像の前記符号量を減算する減算手段と、
    を有することを特徴とする請求項5に記載の動画像符号化装置。
  7. 前記導出手段は、前記減算手段により前記符号量を減算する前での、前記記憶手段に記憶する前記占有量の最大量を上限とし、前記各画像の前記符号量の条件を示す前記符号量条件を導出すること
    を特徴とする請求項6に記載の動画像符号化装置。
  8. 複数の前記フレームレートのピークレートが同一であることを特徴とする請求項5〜7のいずれか1つに記載の動画像符号化装置。
  9. 前記減算手段により前記記憶手段が記憶する前記占有量から前記符号量を減算する時刻と、実際の前記符号化データの再生時の前記符号化データを除去する時刻の差異による、前記記憶手段が記憶する前記占有量と実際の前記符号化データの再生時の前記占有量の差分を示す差分量を算出する差分算出手段と、
    前記導出手段は、前記減算手段により前記符号量を減算する直前の前記記憶手段に記憶する前記占有量から、前記差分算出手段により算出された前記差分量を削除した量を上限とし、前記各画像の前記符号量の条件を示す前記符号量条件を導出すること
    を特徴とする請求項7に記載の動画像符号化装置。
  10. 前記差分算出手段は、前記減算手段により前記記憶手段が記憶する前記占有量から前記符号量を減算する時刻と、NTSC圏での前記フレームレートの再生のため3:2プルダウンしたことによる実際の前記符号化データの再生時の前記符号化データを除去する時刻の差異による、前記記憶手段が記憶する前記占有量と実際の前記符号化データの再生時の前記占有量の差分を示す差分量を算出すること、
    を特徴とする請求項9に記載の動画像符号化装置。
  11. 前記符号化手段は、前記符号化データに対して、再生時に動画像を表示するタイミングの情報を示すタイミング情報を記載するタイミング領域として、前記再生する対象となる複数の前記フレームレートの該タイミング情報のうち、情報が最も多い該タイミング情報が記憶可能となる領域以上を確保し、複数の前記フレームレートのうち、一つの前記フレームレートに対応したタイミング情報を記載し、空いた領域にスタッフィングすることを特徴とする請求項1〜10のいずれか一つに記載の動画像符号化装置。
  12. 前記符号化手段は、さらに前記符号化データを再生する対象となる前記フレームレート毎に対応付けられた複数の、再生時に動画像を表示するタイミングを示すタイミング情報を記載することを特徴とする請求項1又は5に記載の動画像符号化装置。
  13. 1秒ごとに24フレーム表示する入力動画像を符号化して、符号化データを出力する動画像符号化方法において、
    PAL規格フレームレートによる前記符号化データの再生時に第1の受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の符号量に基づいて、前記PAL規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する前記第1の受信記憶領域に占める第1の占有量を変動させる第1の変動ステップと、
    前記第1の変動ステップにより変動した前記第1の占有量に基づいて、前記PAL規格フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記符号量の条件を示す第1の符号量条件を導出する第1の導出ステップと、
    前記符号化データの再生時に第2の受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の符号量に基づいて、NTSC規格フレームレートによる3:2プルダウンを用いた前記符号化データの再生時に受信した前記符号化データを一時的に記憶する前記第2の受信記憶領域に占める第2の占有量を変動させる第2の変動ステップと、
    前記第2の変動ステップにより変動した前記第2の占有量に基づいて、前記NTSC規格フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記符号量の条件を示す第2の符号量条件を導出する第2の導出ステップと、
    前記第1の導出ステップにより導出された前記第1の符号量条件と、前記第2の導出ステップにより導出された前記第2の符号量条件とを満たす符号量で、前記入力動画像を符号化する符号化ステップと、
    を備えることを特徴とする動画像符号化方法。
  14. 1秒ごとに24フレーム表示する入力動画像を符号化して、符号化データを出力する動画像符号化方法において、
    PAL規格フレームレートでは第1のビットレートで再生され且つNTSC規格フレームレートでは第2のビットレートで再生される前記符号化データであって、前記PAL規格フレームレートと前記NTSC規格フレームレートとの比と、および、前記第1のビットレートと前記NTSC規格ビットレートとの比の両方が一致する前記符号化データを出力する際、前記PAL規格フレームレート及び前記NTSC規格フレームレートから、任意に選択された一つのフレームレートを示す選択フレームレートによる前記符号化データの再生時において、受信記憶領域が受信した前記符号化データの受信量及び表示される各画像の符号量に基づいて、選択フレームレートによる前記符号化データの再生時の前記受信記憶領域に占める占有量を変動させる変動ステップと、
    前記変動ステップにより変動した前記占有量に基づいて、前記選択フレームレートによる前記符号化データの再生時に前記受信記憶領域で1ビットのマージンを有するよう、表示される次の画像が満たすべき前記符号量の条件を示す符号量条件を導出する導出ステップと、
    前記導出ステップにより導出された前記符号量条件を満たす符号量で、前記入力動画像を符号化する符号化ステップと、
    を備えることを特徴とする動画像符号化方法。
  15. 1秒ごとに24フレーム表示する入力動画像を可変ビットレートで符号化して符号化データを出力する動画像符号化方法において、
    前記符号化データを再生する対象となるPAL規格フレームレート、及び前記符号化データを3:2プルダウンで再生する対象となるNTSC規格フレームレートを含む複数のフレームレートから、フレームレートが最も高いPAL規格フレームレートを選択する選択ステップと、
    前記PAL規格フレームレートによる前記符号化データの再生時に受信記憶領域が受信した前記符号化データの受信量、及び前記符号化データの再生時に表示される各画像の符号量に基づいて、当該PAL規格フレームレートによる前記符号化データの再生時に受信した前記符号化データを一時的に記憶する前記受信記憶領域に占める占有量を変動させる変動ステップと、
    前記変動ステップにより変動した前記占有量に基づいて、前記選択ステップにより選択された前記フレームレートによる前記符号化データの再生時に表示される次の画像が満たすべき前記符号量の条件を示す符号量条件を導出する導出ステップと、
    前記導出ステップにより導出された前記符号量条件を満たす符号量で、前記入力動画像を符号化する符号化ステップと、
    を備えることを特徴とする動画像符号化方法。
JP2004258948A 2004-09-06 2004-09-06 動画像符号化装置、及び動画像符号化方法 Expired - Fee Related JP4091582B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004258948A JP4091582B2 (ja) 2004-09-06 2004-09-06 動画像符号化装置、及び動画像符号化方法
US11/218,658 US20060050782A1 (en) 2004-09-06 2005-09-06 Moving picture coding apparatus and coded moving picture editing apparatus generating moving picture data renderable at plural frame rates

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004258948A JP4091582B2 (ja) 2004-09-06 2004-09-06 動画像符号化装置、及び動画像符号化方法

Publications (2)

Publication Number Publication Date
JP2006074703A JP2006074703A (ja) 2006-03-16
JP4091582B2 true JP4091582B2 (ja) 2008-05-28

Family

ID=35996169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004258948A Expired - Fee Related JP4091582B2 (ja) 2004-09-06 2004-09-06 動画像符号化装置、及び動画像符号化方法

Country Status (2)

Country Link
US (1) US20060050782A1 (ja)
JP (1) JP4091582B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007194735A (ja) * 2006-01-17 2007-08-02 Toshiba Corp デジタル情報記録媒体、デジタル情報記録再生装置及びその記録再生方法
JP4993044B2 (ja) * 2009-04-08 2012-08-08 ソニー株式会社 再生装置、再生方法、および記録方法
JP2010263615A (ja) 2009-04-08 2010-11-18 Sony Corp 情報処理装置、情報処理方法、再生装置、再生方法
JP4836014B2 (ja) * 2009-07-24 2011-12-14 日本電気株式会社 ディスクアレイ装置及び物理ディスクの復元方法
JP5691341B2 (ja) * 2010-09-22 2015-04-01 株式会社島津製作所 放射線撮影装置および画像再生装置
JP5848993B2 (ja) * 2012-03-06 2016-01-27 株式会社メガチップス 画像処理装置
US9479773B2 (en) 2012-09-24 2016-10-25 Qualcomm Incorporated Access unit independent coded picture buffer removal times in video coding
KR101427552B1 (ko) * 2014-03-31 2014-08-07 (주) 넥스트칩 영상 신호 전송 방법 및 장치
US10136146B1 (en) * 2016-03-23 2018-11-20 Amazon Technologies, Inc. Metadata optimizations for encoding of media content

Also Published As

Publication number Publication date
JP2006074703A (ja) 2006-03-16
US20060050782A1 (en) 2006-03-09

Similar Documents

Publication Publication Date Title
JP4769717B2 (ja) 画像復号化方法
JP3594409B2 (ja) Mpegオーディオ再生装置およびmpeg再生装置
JP4091582B2 (ja) 動画像符号化装置、及び動画像符号化方法
US6314139B1 (en) Method of inserting editable point and encoder apparatus applying the same
JP2005136633A (ja) 動画像符号化装置および動画像符号化制御方法
US7333711B2 (en) Data distribution apparatus and method, and data distribution system
JP2000165802A (ja) ストリーム編集装置と編集方法
US20040103446A1 (en) Audio-video multiplexed data generating apparatus, reproducing apparatus and moving video decoding apparatus
JP4775208B2 (ja) 再生方法、再生プログラムおよび再生装置
JP4791129B2 (ja) 画像符号化装置、画像符号化方法及び画像編集装置
KR100975170B1 (ko) 화상 데이터 재생 장치 및 방법
JP4464255B2 (ja) ビデオ信号多重化装置、ビデオ信号多重化方法及び映像再生装置
JP4096915B2 (ja) デジタル情報再生装置及び方法
JP2008167061A (ja) 符号化装置及び符号化方法
JP3277971B2 (ja) データ多重化装置、データ多重化方法及びデータ記録媒体
JP2000244872A (ja) トランスコーダ装置
JP5046907B2 (ja) 記録装置、その制御方法、プログラム
JP4064604B2 (ja) 画像処理方法及び装置
JP4867872B2 (ja) 画像処理装置、この画像処理装置の制御方法、及び、プログラム
JP3918509B2 (ja) 動画像編集装置、動画像編集方法、動画像復号化装置及び動画像復号化方法
JP2003169296A (ja) 動画像の再生方法
JP2002218458A (ja) 映像再生装置
KR20010007567A (ko) 디지털 복호화 방법
JPH11220695A (ja) 動画像データの復号装置及び復号方法
JP2005159525A (ja) デジタル再生装置または再生方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060919

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080228

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110307

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees