Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4185437B2 - 映像合成出力装置及び音声再生出力装置 - Google Patents
[go: Go Back, main page]

JP4185437B2 - 映像合成出力装置及び音声再生出力装置 - Google Patents

映像合成出力装置及び音声再生出力装置 Download PDF

Info

Publication number
JP4185437B2
JP4185437B2 JP2003371798A JP2003371798A JP4185437B2 JP 4185437 B2 JP4185437 B2 JP 4185437B2 JP 2003371798 A JP2003371798 A JP 2003371798A JP 2003371798 A JP2003371798 A JP 2003371798A JP 4185437 B2 JP4185437 B2 JP 4185437B2
Authority
JP
Japan
Prior art keywords
information
card
video
output
speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003371798A
Other languages
English (en)
Other versions
JP2005136776A (ja
Inventor
仁博 冨山
祐一 岩舘
豊 折原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2003371798A priority Critical patent/JP4185437B2/ja
Publication of JP2005136776A publication Critical patent/JP2005136776A/ja
Application granted granted Critical
Publication of JP4185437B2 publication Critical patent/JP4185437B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Studio Circuits (AREA)

Description

本発明は、映像合成出力装置及び音声再生出力装置に係り、特に、カードを識別するための文字や模様等が描かれたカードを撮影し、撮影したカード情報や動きに対応した動画映像、三次元動映像、又は音声を高精度に出力するための映像合成出力装置及び音声再生出力装置に関する。
従来、模様が描かれたカードを撮影し、撮影したカメラ映像から検出されるカードの種類や三次元位置情報に基づいて、楽器を制御するMIDI(Musical Instrument Digital Interface)信号を出力する装置、及び映像を出力する装置についての技術が知られている(例えば、特許文献1参照。)。
特許文献1では、オペレータにより把持されるカードを撮影することで得られるビデオストリーム信号に基づいて、カードの三次元位置及び姿勢等からなる三次元情報を検出し、それに対応するMIDIデータを出力する。また、特許文献1では、カードを撮影することにより得られる三次元情報(座標位置、回転角度、チルト角度等)に応じた映像を表示する。
また、表示させる映像としては三次元形状のデータが考えられるが、表示するために必要な三次元形状データを取得する技術としては、例えば、被写体の概形形状を測定し、その概形形状を基にブロックマッチングにより被写体のより詳細な形状を求め、更にカメラからの距離情報を求めることができる技術がある(例えば、特許文献2参照。)。
特開2002−32076号公報 特開2003−271928号公報
しかしながら、特許文献1には、カード毎に対応する音声や映像を出力するだけであり、例えば、カメラにより撮影されるカードの移動速度等に対応した映像や音声の出力が考慮されていない。また、同時に撮影されるカードが複数であった場合に、その組み合わせや位置関係に対応した映像や音声を出力することもできない。このため、カードを用いた高精度な映像、音声出力を実現しているとは言えない。
本発明は、上述した問題点に鑑みなされたものであり、カードを撮影した映像から検出されるカード情報やカードの速度情報に基づいて、動画映像や三次元動映像と、実際に撮影されているカメラ映像とを合成して高精度な映像を出力する映像合成出力装置及びカード情報やカードの速度情報に基づいて高精度な音声出力を実現するための映像合成出力装置及び音声再生出力装置を提供することを目的とする。
上記課題を解決するために、本件発明は、以下の特徴を有する課題を解決するための手段を採用している。
請求項1に記載された発明は、カードを撮影するカメラの映像信号によりカードの種類、三次元位置情報、及び姿勢情報からなるカード情報に基づいて、前記映像信号に他の映像信号を合成して出力するための映像合成出力装置において、前記カメラにより撮影される映像信号の所定のフレーム間隔におけるフレーム毎に得られる前記カード情報に基づいて、カードの速度を検出する速度検出部と、前記カード情報と前記速度検出部により得られる速度情報とに基づいて、合成する映像信号を選択して出力する映像出力部とを有することを特徴とする。
請求項1記載の発明によれば、カード情報だけでなく速度情報を用いて映像を選択することで、カードの移動内容に対応する様々な映像を出力することができる。これにより、インタラクティブ性に優れた高精度な映像を出力することができる。
請求項2に記載された発明は、前記映像出力部は、前記カード情報と前記速度検出部により得られる速度情報とに基づいて、動画映像を選択し、前記三次元位置情報と前記姿勢情報とに基づいて、前記動画映像の表示、非表示、大きさ、位置、方向を制御して出力することを特徴とする。
請求項2記載の発明によれば、カード情報及び速度情報に基づいて動画映像を選択し、更に大きさや表示位置等を制御して出力することにより、より高精度な映像出力を実現することができる。
請求項3に記載された発明は、前記映像出力部は、前記カード情報と、前記速度検出部により得られる速度情報と、色情報及び前記三次元位置情報から得られる接続情報とに基づいて三次元動映像を選択し、前記三次元位置情報と前記姿勢情報とに基づいて、前記三次元動映像の表示、非表示、大きさ、位置、方向を制御して出力することを特徴とする。
請求項3記載の発明によれば、カード情報、速度情報、及び接続情報に基づいて三次元動映像を選択し、更に大きさや表示位置等を制御して出力することにより、より高精度な映像出力を実現することができる。
請求項4に記載された発明は、前記カメラにより撮影される映像信号に複数のカードが存在する場合、前記速度検出部は、前記カード情報に基づいて前記複数のカード間の相対速度情報を検出することを特徴とする。
請求項4記載の発明によれば、複数のカードの夫々についてカード情報及び相対速度情報を用いて映像を選択することで、カード間の移動内容に対応する様々な映像を出力することができる。これにより、インタラクティブ性に優れた高精度な映像を出力することができる。
請求項5に記載された発明は、前記複数のカードのカード情報からカード間の距離や姿勢情報からなる相互位置姿勢情報を検出する相互位置姿勢検出部を有することを特徴とする。
請求項5記載の発明によれば、相互位置姿勢情報を用いて、カード間の移動や姿勢内容に対応する様々な映像を出力することができる。
請求項6に記載された発明は、前記映像出力部は、前記相対速度情報と前記相互位置姿勢情報とに基づいて、前記動画映像及び/又は前記三次元動映像を選択して出力することを特徴とする。
請求項6記載の発明によれば、前記相対速度情報と前記相互位置姿勢情報とを用いることで、より高精度な映像出力を実現することができる。
請求項7に記載された発明は、カードを撮影するカメラの映像信号によりカードの種類、三次元位置情報、及び姿勢情報からなるカード情報に基づいて、予め蓄積された音声を再生出力する音声再生出力装置において、前記カメラにより撮影される映像信号の所定のフレーム間隔におけるフレーム毎に得られる前記カード情報に基づいて、カードの速度を検出する速度検出部と、前記カード情報と前記速度検出部により得られる速度情報とに基づいて、音声ファイルを選択して再生出力する音声再生出力部とを有し、前記カメラにより撮影される映像信号に複数のカードが存在する場合、前記速度検出部は、前記カード情報に基づいて前記複数のカード間の相対速度情報を検出することを特徴とする。
請求項7記載の発明によれば、カード情報だけでなく速度情報を用いて音声を選択することで、カードの移動内容に対応する様々な音声を出力することができる。また、複数のカードの夫々についてカード情報及び相対速度情報を用いて音声を選択することで、カード間の移動内容に対応する様々な音声を出力することができる。これにより、インタラクティブ性に優れた高精度な音声を出力することができる。
請求項に記載された発明は、前記複数のカードのカード情報からカード間の距離や姿勢情報からなる相互位置姿勢情報を検出する相互位置姿勢検出部を有することを特徴とする。
請求項記載の発明によれば、相互位置姿勢情報を用いて、カード間の移動や姿勢内容に対応する様々な音声を出力することができる。
請求項に記載された発明は、前記音声再生出力部は、前記相対速度情報と前記相互位置姿勢情報とに基づいて、前記音声ファイルを選択して出力することを特徴とする。
請求項記載の発明によれば、前記相対速度情報と前記相互位置姿勢情報とを用いることで、より高精度な音声出力を実現することができる。
本発明によれば、カードを撮影したカメラ映像から得られるカード情報及びカードの速度情報に基づいて、インタラクティブ性に優れた高精度な映像又は音声を出力することができる。
<本発明の概要>
本発明は、特定の文字や模様等の識別情報が描かれたカードを撮影し、撮影したカメラ映像から検出されるカードの種類、三次元位置情報、姿勢情報からなるカード情報とカードの速度情報に基づいて、予め蓄積されている動画映像や三次元動映像から対応する映像を選択し、実際に撮影されているカメラ映像と合成して出力する。
ここで、三次元位置情報とは、カメラの撮影にて得られるカードのx、y、z座標における位置情報を表している。上述の内容を図を用いて説明する。図1は、カードとカメラとの位置関係を示す一例の図である。ここで、カード11には、カードの種類(種別)を特定するために文字(図1において、a)が描かれている。なお、カードを識別できるものであれば、文字に限らず、数字や、模様、顔の写真等でもよい。
図1に示すようにカード11の位置情報は、x座標がカメラに対して水平方向の位置を示し、y座標がカメラに対して垂直方向の位置を示し、z座標がカメラに対する距離を示している。また、姿勢情報は、上述のx軸、y軸、z軸の各軸に対する所定のカードの位置を基準とした回転の度合を示すものであり、カードそのものの姿勢を表すものである。これにより、ユーザがカードを動かした場合、カードを撮影したカメラからカード情報(カードの種類、三次元位置情報、姿勢情報)を取得する。
また、本発明ではカメラ映像から検出される複数のフレームから予め設定されたフレーム間隔により夫々の三次元位置情報、姿勢情報の差分を取得し、取得した差分からカードの移動速度を検出する。検出した速度情報に基づいて対応する動画映像及び/又は三次元動映像を選択し、実際に撮影されちるカメラの映像信号と合成して出力する。
具体的には、特定の文字や模様等の識別情報が描かれたカードの領域抽出、パターンマッチング等の画像処理を行うことにより、カードの種類、三次元位置情報、姿勢情報からなるカード情報を取得する。なお、上述のカード情報を取得するための画像処理技術としては、既に様々な技術が存在し、例えば、「画像処理工学」末松良一,山田宏尚著、コロナ社(以下、非特許文献1という。)に記載されている画像認識技術や、「マーカー追跡に基づく拡張現実感システムとそのキャリブレーション」加藤博一,Mark Billinghurst,浅野浩一,橘啓八郎著、基礎論文 TVRSJ vol4 No.4 1999(以下、非特許文献2という。)に記載されている技術を適用することができる。
また、カード情報に基づいて、予め蓄積されているか又は外部から入力される動画映像と、更に色情報及び三次元座標情報を持つ頂点群の接続情報により蓄積されている三次元動映像とを射影変換、視点変換して出力し、クロマキー処理等の映像合成手法を利用して、実際にカードを撮影しているカメラ映像と合成して出力する。
ここで、射影変換、視点変換については、例えば、「OpenGL Programming Guide」Jackie Neider,Tom Davis,Mason Woo著、アジソンウェスレイ(以下、非特許文献3という。)に記載されているように三次元空間を表現するためのフォーマットであるOpenGLを用いた射影変換、視点変換技術を適用することができる。また、画像の合成技術については、例えば、「C言語で学ぶ実践画像処理」(井上誠喜,八木伸行,林正樹,中須英輔,三谷公二,奥井誠人著、オーム社)(以下、非特許文献4いう。)等に記載されているクロマキー処理等の映像合成を用いることができる。
更に、上述の色情報とは、例えば、カードの領域が矩形で形成されている場合、その矩形の頂点(P,P,P,P)の夫々の色情報(R,G,B)〜(R,G,B)を示し、上述の接続情報は、例えば、上述の矩形の頂点(P,P,P,P)から形成される2つの三角形(P,P,P),(P,P,P)のように形成された領域における点の接続情報を示している。なお、上述の三角形(P,P,P),(P,P,P)の夫々の色情報を内挿することで三角形の領域内の色が設定され、これが三次元形状の面に相当する。このように色情報を用いて三次元動映像を形成する技術としては、例えば、「注解 VRML2.0リファレンスマニュアル」(Rikk Carey,Gavin Bell著 アジソンウェスレイ)(以下、非特許文献5という。)がある。
また、本発明では、カメラで撮影されたカードの種類、三次元位置情報、姿勢情報からなるカード情報及びカードの速度情報に基づいて、予め蓄積される音声ファイルから再生出力する音声ファイルの種類、ボリューム、パンニングを選択し、その音声ファイルを再生出力する。ここで、音声ファイルのフォーマットとしては、wav,aiff,MP3,WMA,VQ,rm,ram,mov,aac,atrac3等がある。
更に、本発明では、複数のカードが撮影された場合に、複数のカード同士における互いの種類、三次元位置情報、姿勢情報から前記動画映像、三次元動映像の表示、非表示、大きさ、位置、方向、及び前記音声ファイルのオン、オフ、ボリューム、パンニング、出力する音声の種類を制御する。
<実施例1:映像合成出力装置>
次に、本発明を適用した動画映像及び三次元動映像を実際に撮影されているカメラからの映像信号と合成して出力するための映像合成出力装置について図を用いて説明する。
図2は、本発明における映像合成出力システムの一構成例を示す図である。図2の映像合成出力システムは、カード21を撮影するためのカメラ22と、カード情報取得装置23と、映像合成出力装置24とを有するよう構成されている。また、映像合成出力装置24は、速度検出部25と、動画映像出力部26と、三次元動映像出力部27と、映像合成出力部28とを有するよう構成されている。
図2に示す映像合成出力システムは、まずカードを識別するための特定の文字や模様が描かれているカード21をカメラ22により撮影する。カメラ22にて撮影されたカメラ映像信号は、カード情報取得装置23及び映像合成出力部28に出力される。なお、カード21は、例えば、ユーザにより把持されカメラ21に対して三次元座標(図1に示すx,y,z座標)での移動や回転を行う。
カード情報取得装置23は、カメラ22から入力されたカメラ映像信号からカード21の領域を抽出し、パターンマッチング等の画像処理を行って撮影された映像中に含まれるカードの種類、三次元位置情報、姿勢情報からなるカード情報を取得する。また、カード情報取得装置23は、取得したカード情報を速度検出部25、動画映像出力部26、及び三次元動映像出力部27に出力する。なお、カード情報取得装置23にて、カード21の領域を抽出する際には、例えば、非特許文献2に示すように図2のカード21内に矩形を描き、その描かれた角の三次元座標を取得することで、三次元位置情報や姿勢情報を取得することができる。
速度検出部25は、カード情報取得装置23から逐次入力されるカードの種類、三次元位置情報、及び姿勢情報からカードの種類毎に映像信号に含まれる予め設定されるフレーム間隔での三次元位置情報及び姿勢情報を取得し、その三次元位置情報、姿勢情報の差分を計算してカード毎の方向を含めた移動速度を求め、カードの種類及び速度情報を動画映像出力部26及び三次元動映像出力部27に出力する。ここで、フレーム間隔として、例えば、1秒間に30フレームを有する映像信号であれば間隔を15フレームと設定する。
動画映像出力部26では、入力されるカードの種類及び移動速度から予め蓄積されている動画映像データ又は外部から入力される動画映像の中から対応する動画映像を選択し、更に、カードの三次元位置情報、姿勢情報に基づいて、出力する動画映像を射影変換及び視点変換により移動、回転させて動画映像信号として映像合成出力部28に出力する。なお、射影変換及び視点変換により出力される映像は、実際にカメラ22により撮影されたカード上に出力され、更に、向きをカードの向きに対応して調整した映像が出力されるようにする。これにより、カードの向きに対応して映像の向きを変えて表示することができる。
なお、出力される映像の位置は、本発明においてはこの限りではなく、例えば、カードから所定の位置だけ離れた位置に映像を出力させるよう設定することもできる。
また、三次元動映像出力部27は、予め蓄積されている三次元動映像データの中から、速度検出部25により入力された速度情報と、カード情報取得装置23により入力されたカードの種類、三次元位置情報、姿勢情報からなるカード情報、及び上述した色情報及び三次元座標情報を持つ頂点群の接続情報から対応する三次元動映像を選択する。
更に、カード21の三次元位置情報、姿勢情報に基づいて、出力する三次元動映像を射影変換、視点変換して移動、回転させてOpenGL等の一般に利用可能な三次元動映像描画ソフトウェアにより描画し三次元動映像を生成し、生成した三次元動映像信号を映像合成出力部28に出力する。
なお、三次元空間(三次元仮想現実空間)を表現するための三次元空間フォーマットとしては、OpenGLの他にVRML,DirectX,DXF等の三次元空間フォーマットを適用することができる。
ここで、動画映像出力部26及び三次元動映像出力部27に夫々蓄積されている映像を選択するためのデータの例について、図を用いて説明する。
図3は、動画映像出力部及び三次元動映像出力部に夫々蓄積されている映像選択データの一例を示す図である。
図3に示すデータ項目は、カードの種類を特定するカード種別と、速度検出部25から検出された速度条件と、カード種別及び速度条件に対応する映像等からなる。更に、三次元動映像出力部27に蓄積されているデータには、上述の接続情報も含まれる。
図3において、例えば、カード種別がaで、所定のフレーム間隔で測定されたカードの移動速度が7cm/sであった場合、人Aが歩いている映像が選択される。また、カード種別がaで、所定のフレーム間隔で測定されたカードの移動速度が15cm/sであった場合、人Aが走っている映像が選択される。このようにカードの移動速度に応じて選択される映像が異なる。この選択された映像に基づいて、動画映像出力部26、三次元動映像出力部27の夫々において、映像を選択しカード情報に含まれる三次元座標情報及び姿勢情報に基づいて射影変換、視点変換を行う。更に、映像を表示、非表示、大きさ、位置、方向等の制御を行い映像合成出力部28に出力する。
映像合成出力部28では、カメラ22から入力される実際に撮影されているカメラの映像と、動画映像出力部26から入力される動画映像と、三次元動映像出力部27から入力される三次元動映像信号をキー信号処理等を利用した映像合成ソフトウェアにより合成を行い、カメラ映像と、動画映像と、三次元動映像との合成信号を映像信号としてディスプレイ装置やプロジェクタ等により出力する。なお、出力される具体的な内容については後述する。
ここで、キー信号処理については、例えば、上述の非特許文献4に示すようなクロマキー信号処理等を用いることにより、映像を合成することができる。
また、映像合成出力部28において、動画映像出力部26又は三次元動映像出力部27のどちらか一方からしか映像信号が入力されなければ、その一方から得られる映像信号と、カメラ22から入力される映像信号とを合成して出力する。
このように、速度検出部25により得られる速度情報を用いることで、最適な映像を選択して表示させることができる。これにより、ユーザが動かしたカードに対してインタラクティブ性に優れた高精度な映像を出力することができる。
<実施例2:音声再生出力装置>
次に、本発明を適用した音声再生出力システムの構成について図を用いて説明する。
図4は、本発明における音声再生出力システムの一構成例を示す図である。図4に示す音声出力システムは、カード41を撮影するカメラ42と、カード情報取得装置43と、音声再生出力装置44とを有するよう構成されている。また、音声再生出力装置44は、速度検出部45と、音声再生出力部46とを有するよう構成されている。ここで、カード41は、上述のカード21と同一である。
まず、カードを特定するための文字や模様等の識別情報が描かれているカード41をカメラ42により撮影する。カメラ42にて撮影されたカメラ映像信号は、カード情報取得装置43に出力される。なお、カード41は、ユーザにより把持されカメラ42に対して三次元座標(図1に示すx,y,z座標)での移動や回転を行う。
カード情報取得装置43は、カメラ42から入力されたカメラ映像信号からカード41の領域を抽出し、パターンマッチング等の画像処理を行って撮影された映像中に含まれるカードの種類、三次元位置情報、姿勢情報からなるカード情報を取得する。また、カード情報取得装置43は、取得したカード情報を速度検出部45、及び音声再生出力部46に出力する。
速度検出部45は、カード情報取得装置43から逐次入力されるカードの種類、三次元位置情報、及び姿勢情報からカードの種類毎に映像信号に含まれる予め設定されるフレーム間隔での三次元位置情報及び姿勢情報を取得し、その三次元位置情報、姿勢情報の差分を計算してカード毎の方向を含めた移動速度を求め、カードの種類及び速度情報を音声再生出力部46に出力する。
音声再生出力部46では、入力されるカードの種類及び移動速度から予め蓄積されている音声ファイル又は外部から入力される音声の中から対応する音声ファイルを選択して、音声信号を再生し、スピーカ等の音声出力装置に出力する。
なお、音声出力において、例えば、複数のスピーカを用いたサラウンド再生出力が可能である場合には、速度情報、三次元位置情報及び姿勢情報に基づいて所定のスピーカに音声出力を行う。また、カードとカメラからの距離に対応させて音声のボリューム変えたり、パンニングやエフェクト、残響等の音声制御を行う。これにより臨場感のある音声を出力することができる。
ここで、音声再生出力部46が有する音声を選択するためのデータ例について、図を用いて説明する。図5は、音声再生出力部が有するデータの一例を示す図である。図5に示すデータ項目は、カードの種類から得られるカード種別と、速度検出部45から得られる速度条件と、カード種別と速度条件とから音声を出力するものである。
図5において、例えば、カード種別がbで、速度が2cm/sであれば、人Bの声で口笛を吹いている音声ファイルを選択する。なお、音声ファイルとしては、wav,aiff,MP3,WMA,VQ,rm,ram,mov,aac,atrac3等でフォーマットされた音声ファイルを用いることができる。
上述したように、本発明を適用した音声再生出力装置により、速度情報に基づいて、ユーザが動かしたカードに対してインタラクティブ性に優れた高精度な音声ファイルを出力することができる。
ここで、上述の映像合成出力装置24、音声再生出力装置44は、組み合わせた構成にすることも可能である。これにより、更に高精度な映像出力、音声出力を実現することができる。
また、カメラに撮影されるカードは、1枚だけでなく、複数枚の場合もある。複数枚の場合には、夫々が上述の実施例で示しているように1枚で撮影されているときと同様の動作を行うこともできるが、複数撮影されている場合に夫々のカードの相対速度や相互位置に基づいて、出力される映像や音声を選択することで、より高精度な映像出力や音声出力を実現することができる。
ここで、上述したように複数枚のカードが撮影された場合に本発明を適用した映像合成出力装置及び音声再生出力装置について説明する。なお、後述する実施例3では、映像合成出力と、音声再生出力とを1つの装置構成にて実現する例について説明するが、上述の実施例に示すように夫々を別々の装置構成とすることもできる。
<実施例3:映像合成・音声再生出力装置>
図6は、本発明における映像合成・音声再生出力システムの一構成例を示す図である。図6に示す映像合成・音声再生出力システムは、カード61−1,61−2を撮影するカメラ62と、カード情報取得装置63と、映像合成・音声再生出力装置64とを有するよう構成されている。
また、映像合成・音声再生出力装置64は、速度検出部65と、相互位置姿勢検出部66と、動画映像出力部67と、三次元動映像出力部68と、音声再生出力部69と、映像合成出力部70とを有するよう構成されている。
ここで、図6に示す実施例では、2枚のカード61−1,61−2を用いた例について説明するが、本発明においてはこの限りではなく、3枚以上であってもよい。
まず、カード61−1,61−2をカメラ62により撮影する。カメラ62にて撮影されたカメラ映像信号は、カード情報取得装置63及び映像合成出力部70に出力される。なお、カード61−1,61−2は、ユーザにより把持されカメラ62に対して三次元座標(図1に示すx,y,z座標)での移動や回転を行う。
カード情報取得装置63は、カメラ62から入力されたカメラ映像信号からカード61−1,61−2の夫々の領域を抽出し、パターンマッチング等の画像処理を行って撮影された映像中に含まれるカードの種類、三次元位置情報、姿勢情報からなるカード情報を取得する。また、カード情報取得装置63は、取得したカード情報を速度検出部65、相互位置姿勢検出部66に出力する。
速度検出部65は、カード情報取得装置63から逐次入力されるカードの種類、三次元位置情報、及び姿勢情報から、複数のカードの種類毎に映像信号に含まれる予め設定されるフレーム間隔での三次元位置情報及び姿勢情報を取得し、その三次元位置情報、姿勢情報の差分を計算してカード間の方向を含めた相対移動速度を求め、カードの種類、撮影された複数のカード間の相対速度情報を動画映像出力部67、三次元動映像出力部68、及び音声再生出力部69に出力する。
また、相互位置姿勢検出部66は、入力される夫々のカードのカード情報からカード同士が相互にどの位置でどの方向を向いているかの相互位置姿勢情報(カード間の距離や姿勢情報)を検出し、カード情報及び相互位置姿勢情報を動画映像出力部67、三次元動映像出力部68、音声再生出力部69に出力する。
動画映像出力部67では、入力されるカード情報、カード間の相対速度情報及び相互位置姿勢情報から、予め蓄積されている動画映像データ又は外部から入力される動画映像の中から対応する動画映像を選択し、更に、カード61−1,61−2の三次元位置情報、姿勢情報に基づいて、出力する動画映像を射影変換及び視点変換により移動、回転させて動画映像信号として映像合成出力部70に出力する。なお、射影変換及び視点変換により出力される映像は、実際にカメラ62により撮影されたカード上に出力され、更に、向きをカードの向きに対応して調整した映像が出力されるようにする。
また、三次元動映像出力部68は、予め蓄積されている三次元動映像データの中から、速度検出部65により入力されたカード間の相対速度情報及び相互位置姿勢情報、カード情報、及び接続情報から対応する三次元動映像を選択する。更に、カード61−1,61−2の三次元位置情報、姿勢情報に基づいて、出力する三次元動映像を射影変換、視点変換して移動、回転させてOpenGL等の一般に利用可能な三次元動映像描画ソフトウェアにより描画し三次元動映像を生成し、生成した三次元動映像信号を映像合成出力部70に出力する。
映像合成出力部70は、カメラ62から入力される実際に撮影されているカメラの映像と、動画映像出力部67から入力される動画映像と、三次元動映像出力部68から入力される三次元動映像信号をキー信号処理等により合成を行い、カメラ映像と、動画映像と、三次元動映像との合成信号を映像信号としてディスプレイ装置やプロジェクタ等により出力する。なお、出力される具体的な内容については後述する。
一方、音声再生出力部69では、入力されるカード情報、カード間の相対速度情報、及び相互位置姿勢情報から予め蓄積されている音声ファイル又は外部から入力される音声の中から対応する音声ファイルを選択して、音声信号を再生し、スピーカ等の音声出力装置に出力する。
なお、音声出力において、例えば、複数のスピーカを用いたサラウンド再生出力が可能である場合には、相対速度情報、相互位置姿勢情報に基づいて所定のスピーカに音声出力を行う。これにより臨場感のある音声を出力することができる。
ここで、動画映像出力部67、三次元動映像出力部68、及び音声再生出力部69に夫々蓄積されている映像を選択するためのデータの例と、そのデータにより、ディスプレイに出力される映像出力、及び音声出力の具体例について、図7、図8を用いて説明する。
図7は、動画映像出力部、三次元動映像出力部、音声再生出力部に蓄積されている映像を選択するためのデータの一例を示す図である。また、図8は、図7のデータ例に基づく映像出力、音声出力の一例を示す図である。
ここで、図7(a)は、動画映像出力部67、及び三次元動映像出力部68が備えるデータ例であり、図7(b)は、音声再生出力部69が備えるデータ例である。図7では、少なくとも2つのカード種別(カードの種類)に対応する相対速度、相互位置におけるカードの映像(図7(a))、又は音声(図7(b))の情報が蓄積されている。また、三次元動映像出力部68の場合には、上述の項目の他に接続情報も含まれる。
また、図7のデータでは、2枚のカードが撮影されている場合についてのデータ例を示しているが、本発明においてカードの枚数についてはこの限りではなく複数枚に対応させてデータを蓄積することもできる。なお、カードが1枚の場合には、図3又は図5に示すデータを参照する。更に、データ内に条件に対応する映像が複数存在する場合は、全てを選択してもよく、また複数ある映像や音声に優先順位を設けて選択することもできる。
例えば、図8(a)に示すように、同時に撮影される2枚のカード81−1,81−2が存在し、カード81−1の種類(カード種別)をaとし,カード81−2の種類(カード種別)をbとする。ここで、カード81−1とカード81−2を互いに接近させた場合の、映像、音声の出力について説明する。
まず、速度検出部65により得られる2枚のカードの相対移動速度が0.5cm/sで、相互位置姿勢検出部66から得られる相互位置が2cmの位置にある場合、図7(a)からカード種別aに対応する映像1として人Aがおじぎをする映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、所定の位置に映像を出力する(図8(b))。また、図7(b)から対応する音声として“コンニチハ”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から再生出力される。
一方、カード種別bに対応する映像2として図7(a)のデータから人Bがおじぎをする映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、所定の位置に映像を出力する(図8(b))。また、図7(b)からは、“ドウモ”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から再生出力される。
更に、速度検出部65により得られる2枚のカードの相対移動速度が0.5cm/sで、相互位置姿勢検出部66から得られる相互位置が0.2cmの位置にある場合、図7(a)からカード種別aに対応する映像1として、人Aと人Bとが握手をする映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、例えば、カード81−2よりに表示させる等の制御を行って映像を出力する(図8(c))。また、図7(b)から対応する音声として“ヨロシク”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から再生出力される。
一方、カード種別bに対応する映像2としては、図7(a)のデータから出力される映像を表示しないよう設定されている。つまり、対応するカード種別aの映像において、人Aと人Bとが握手をしている映像を表示させるため、カード種別bは映像を表示させる必要がない。このように表示させることで、人物同士が抱き合ったり、人が自動車に乗り込むような映像等をより現実的な動作で表示することができ、より詳細な映像を高精度に表示させることができる。
また、図7(b)から対応する音声として“ヨロシク”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から出力される。
更に、速度検出部65により得られる2枚のカードの相対移動速度が15cm/sで、相互位置姿勢検出部66から得られる相互位置が0.5cmの位置にある場合、図7(a)からカード種別aに対応する映像1として人Aが転倒する映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、所定の位置に映像を出力する(図8(d))。また、図7(b)から対応する音声として“ワー”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から出力される。
一方、カード種別bに対応する映像2として図7(a)のデータから人Bが転倒する映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、所定の位置に映像を出力する(図8(d))。また、図7(b)からは、“イタイ”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から出力される。
このように、相対速度情報と相互位置姿勢情報に基づいて、映像、音声を選択することで、カードが1枚の場合より多様で高精度な映像、音声を出力することができる。これにより、ユーザが動かしたカードに対してインタラクティブ性に優れた高精度な映像や音声を出力することができる。
上述したように本発明によれば、特定の文字や模様等の識別情報が描かれたカードを撮影した映像から得られるカード情報と、カードの速度情報とに基づいて動画映像、三次元動映像、音声を選択して実際に撮影された映像信号に合成することで高精度に映像出力や音声出力を実現することができる。これにより、ユーザが動かしたカードに対してインタラクティブ性に優れた高精度な映像や音声を出力することができる。
更に、実際に撮影された映像信号に複数のカードが存在する場合に、カード間の相対速度情報や相互位置姿勢情報に基づいて、動画映像、三次元動映像、音声を選択して実際に撮影された映像信号に合成することでより高精度に映像出力や音声出力を実現することができる。
以上本発明の好ましい実施例について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。
カードとカメラとの位置関係を示す一例の図である。 本発明における映像合成出力システムの一構成例を示す図である。 動画映像出力部及び三次元動映像出力部に夫々蓄積されている映像選択データの一例を示す図である。 本発明における音声再生出力システムの一構成例を示す図である。 音声再生出力部が有するデータの一例を示す図である。 本発明における映像合成・音声再生出力システムの一構成例を示す図である。 動画映像出力部、三次元動映像出力部、音声再生出力部に蓄積されている映像を選択するためのデータの一例を示す図である。 図7のデータ例に基づく映像出力、音声出力の一例を示す図である。
符号の説明
11,21,41,61,81 カード
12,22,42,62 カメラ
23,43,63 カード情報取得装置
24 映像合成出力装置
25,45,65 速度検出部
26,67 動画映像出力部
27,68 三次元動映像出力部
28,70 映像合成出力部
44 音声再生出力装置
46,68 音声再生出力部
64 映像合成・音声再生出力装置
66 相互位置姿勢検出部

Claims (9)

  1. カードを撮影するカメラの映像信号によりカードの種類、三次元位置情報、及び姿勢情報からなるカード情報に基づいて、前記映像信号に他の映像信号を合成して出力するための映像合成出力装置において、
    前記カメラにより撮影される映像信号の所定のフレーム間隔におけるフレーム毎に得られる前記カード情報に基づいて、カードの速度を検出する速度検出部と、
    前記カード情報と前記速度検出部により得られる速度情報とに基づいて、合成する映像信号を選択して出力する映像出力部とを有することを特徴とする映像合成出力装置。
  2. 前記映像出力部は、
    前記カード情報と前記速度検出部により得られる速度情報とに基づいて、動画映像を選択し、前記三次元位置情報と前記姿勢情報とに基づいて、前記動画映像の表示、非表示、大きさ、位置、方向を制御して出力することを特徴とする請求項1に記載の映像合成出力装置。
  3. 前記映像出力部は、
    前記カード情報と、前記速度検出部により得られる速度情報と、色情報及び前記三次元位置情報から得られる接続情報とに基づいて三次元動映像を選択し、前記三次元位置情報と前記姿勢情報とに基づいて、前記三次元動映像の表示、非表示、大きさ、位置、方向を制御して出力することを特徴とする請求項1に記載の映像合成出力装置。
  4. 前記カメラにより撮影される映像信号に複数のカードが存在する場合、
    前記速度検出部は、前記カード情報に基づいて前記複数のカード間の相対速度情報を検出することを特徴とする請求項1乃至3の何れか1項に記載の映像合成出力装置。
  5. 前記複数のカードのカード情報からカード間の距離や姿勢情報からなる相互位置姿勢情報を検出する相互位置姿勢検出部を有することを特徴とする請求項4に記載の映像合成出力装置。
  6. 前記映像出力部は、
    前記相対速度情報と前記相互位置姿勢情報とに基づいて、前記動画映像及び/又は前記三次元動映像を選択して出力することを特徴とする請求項5に記載の映像合成出力装置。
  7. カードを撮影するカメラの映像信号によりカードの種類、三次元位置情報、及び姿勢情報からなるカード情報に基づいて、予め蓄積された音声を再生出力する音声再生出力装置において、
    前記カメラにより撮影される映像信号の所定のフレーム間隔におけるフレーム毎に得られる前記カード情報に基づいて、カードの速度を検出する速度検出部と、
    前記カード情報と前記速度検出部により得られる速度情報とに基づいて、音声ファイルを選択して再生出力する音声再生出力部とを有し、
    前記カメラにより撮影される映像信号に複数のカードが存在する場合、前記速度検出部は、前記カード情報に基づいて前記複数のカード間の相対速度情報を検出することを特徴とする音声再生出力装置。
  8. 前記複数のカードのカード情報からカード間の距離や姿勢情報からなる相互位置姿勢情報を検出する相互位置姿勢検出部を有することを特徴とする請求項に記載の音声再生出力装置。
  9. 前記音声再生出力部は、
    前記相対速度情報と前記相互位置姿勢情報とに基づいて、前記音声ファイルを選択して出力することを特徴とする請求項に記載の音声再生出力装置。
JP2003371798A 2003-10-31 2003-10-31 映像合成出力装置及び音声再生出力装置 Expired - Fee Related JP4185437B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003371798A JP4185437B2 (ja) 2003-10-31 2003-10-31 映像合成出力装置及び音声再生出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003371798A JP4185437B2 (ja) 2003-10-31 2003-10-31 映像合成出力装置及び音声再生出力装置

Publications (2)

Publication Number Publication Date
JP2005136776A JP2005136776A (ja) 2005-05-26
JP4185437B2 true JP4185437B2 (ja) 2008-11-26

Family

ID=34648353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003371798A Expired - Fee Related JP4185437B2 (ja) 2003-10-31 2003-10-31 映像合成出力装置及び音声再生出力装置

Country Status (1)

Country Link
JP (1) JP4185437B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007206807A (ja) * 2006-01-31 2007-08-16 Nippon Hoso Kyokai <Nhk> 映像合成装置及び映像合成プログラム

Also Published As

Publication number Publication date
JP2005136776A (ja) 2005-05-26

Similar Documents

Publication Publication Date Title
US11100719B2 (en) Method and apparatus for overlaying a reproduction of a real scene with virtual image and audio data, and a mobile device
JP4310916B2 (ja) 映像表示装置
JP2002514875A (ja) 多次元空間において運動をシミュレーションするパノラマムービー
JP2009533786A (ja) 自分でできるフォトリアリスティックなトーキングヘッド作成システム及び方法
JPH05501184A (ja) 連続画像の内容変更を行う方法および装置
JP2022131778A (ja) 情報処理装置、情報処理方法、およびプログラム
US20020097245A1 (en) Sensor fusion apparatus and method for optical and magnetic motion capture systems
US20190130644A1 (en) Provision of Virtual Reality Content
WO1997042601A1 (en) Integrated interactive multimedia process
JP2016053788A (ja) 情報端末装置、情報処理方法、システムおよびプログラム
EP2643791B1 (en) Method and assembly for improved audio signal presentation of sounds during a video recording
US20240233297A1 (en) Image processing apparatus, image processing method, and computer-readable storage medium
JP4185437B2 (ja) 映像合成出力装置及び音声再生出力装置
JP2004045651A (ja) 動画像処理方法
JP2010183384A (ja) 撮影カメラ学習装置及びそのプログラム
KR101773891B1 (ko) 실시간 환경객체 선택을 통한 합성동영상 재생 시스템 및 컴퓨터 구현 방법
JP2003143477A (ja) 映像合成装置および方法
JPH10126687A (ja) すり替え編集システム
JP4530214B2 (ja) 模擬視界発生装置
JP2006048484A (ja) デザイン支援装置
JP7795931B2 (ja) 情報処理装置、情報処理方法、データ構造及びプログラム
KR20170075321A (ko) 증강현실 노래방 시스템
KR101860215B1 (ko) 프로젝터 자세에 연동하는 콘텐츠 디스플레이 시스템 및 방법
KR102685040B1 (ko) 사용자 움직임 기록 기반의 영상 제작 장치 및 방법
JP4217008B2 (ja) カメラワークシミュレータ及びシミュレーション方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080718

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080812

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080905

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130912

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140912

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees