JP4185437B2 - Video composition output device and audio reproduction output device - Google Patents
Video composition output device and audio reproduction output device Download PDFInfo
- Publication number
- JP4185437B2 JP4185437B2 JP2003371798A JP2003371798A JP4185437B2 JP 4185437 B2 JP4185437 B2 JP 4185437B2 JP 2003371798 A JP2003371798 A JP 2003371798A JP 2003371798 A JP2003371798 A JP 2003371798A JP 4185437 B2 JP4185437 B2 JP 4185437B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- card
- video
- output
- speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Reverberation, Karaoke And Other Acoustics (AREA)
- Processing Or Creating Images (AREA)
- Image Processing (AREA)
- Studio Circuits (AREA)
Description
本発明は、映像合成出力装置及び音声再生出力装置に係り、特に、カードを識別するための文字や模様等が描かれたカードを撮影し、撮影したカード情報や動きに対応した動画映像、三次元動映像、又は音声を高精度に出力するための映像合成出力装置及び音声再生出力装置に関する。 The present invention relates to a video composition output device and an audio reproduction output device, and in particular, a card on which characters or patterns for identifying a card are drawn, and a moving image corresponding to the card information and movement, The present invention relates to a video composition output device and an audio reproduction output device for outputting original motion video or audio with high accuracy.
従来、模様が描かれたカードを撮影し、撮影したカメラ映像から検出されるカードの種類や三次元位置情報に基づいて、楽器を制御するMIDI(Musical Instrument Digital Interface)信号を出力する装置、及び映像を出力する装置についての技術が知られている(例えば、特許文献1参照。)。 Conventionally, an apparatus for photographing a card with a pattern and outputting a MIDI (Musical Instrument Digital Interface) signal for controlling a musical instrument based on the type of card and three-dimensional position information detected from the photographed camera image, and A technique regarding an apparatus that outputs video is known (for example, see Patent Document 1).
特許文献1では、オペレータにより把持されるカードを撮影することで得られるビデオストリーム信号に基づいて、カードの三次元位置及び姿勢等からなる三次元情報を検出し、それに対応するMIDIデータを出力する。また、特許文献1では、カードを撮影することにより得られる三次元情報(座標位置、回転角度、チルト角度等)に応じた映像を表示する。 In Patent Document 1, three-dimensional information including a three-dimensional position and posture of a card is detected based on a video stream signal obtained by photographing a card held by an operator, and MIDI data corresponding to the three-dimensional information is output. . In Patent Document 1, an image corresponding to three-dimensional information (coordinate position, rotation angle, tilt angle, etc.) obtained by photographing a card is displayed.
また、表示させる映像としては三次元形状のデータが考えられるが、表示するために必要な三次元形状データを取得する技術としては、例えば、被写体の概形形状を測定し、その概形形状を基にブロックマッチングにより被写体のより詳細な形状を求め、更にカメラからの距離情報を求めることができる技術がある(例えば、特許文献2参照。)。
しかしながら、特許文献1には、カード毎に対応する音声や映像を出力するだけであり、例えば、カメラにより撮影されるカードの移動速度等に対応した映像や音声の出力が考慮されていない。また、同時に撮影されるカードが複数であった場合に、その組み合わせや位置関係に対応した映像や音声を出力することもできない。このため、カードを用いた高精度な映像、音声出力を実現しているとは言えない。 However, Patent Document 1 only outputs audio and video corresponding to each card. For example, video and audio output corresponding to the moving speed of a card photographed by a camera is not considered. In addition, when a plurality of cards are photographed at the same time, video and audio corresponding to the combination and positional relationship cannot be output. For this reason, it cannot be said that high-accuracy video and audio output using a card is realized.
本発明は、上述した問題点に鑑みなされたものであり、カードを撮影した映像から検出されるカード情報やカードの速度情報に基づいて、動画映像や三次元動映像と、実際に撮影されているカメラ映像とを合成して高精度な映像を出力する映像合成出力装置及びカード情報やカードの速度情報に基づいて高精度な音声出力を実現するための映像合成出力装置及び音声再生出力装置を提供することを目的とする。 The present invention has been made in view of the above-described problems, and based on card information and card speed information detected from an image obtained by photographing a card, a moving image and a three-dimensional moving image are actually photographed. A video synthesis output device that synthesizes a camera video and outputs a high-accuracy video, and a video synthesis output device and an audio playback output device for realizing high-accuracy audio output based on card information and card speed information The purpose is to provide.
上記課題を解決するために、本件発明は、以下の特徴を有する課題を解決するための手段を採用している。 In order to solve the above problems, the present invention employs means for solving the problems having the following characteristics.
請求項1に記載された発明は、カードを撮影するカメラの映像信号によりカードの種類、三次元位置情報、及び姿勢情報からなるカード情報に基づいて、前記映像信号に他の映像信号を合成して出力するための映像合成出力装置において、前記カメラにより撮影される映像信号の所定のフレーム間隔におけるフレーム毎に得られる前記カード情報に基づいて、カードの速度を検出する速度検出部と、前記カード情報と前記速度検出部により得られる速度情報とに基づいて、合成する映像信号を選択して出力する映像出力部とを有することを特徴とする。 The invention described in claim 1 synthesizes another video signal to the video signal based on the card information including the card type, the three-dimensional position information, and the posture information based on the video signal of the camera that shoots the card. A speed detection unit that detects a card speed based on the card information obtained for each frame at a predetermined frame interval of a video signal shot by the camera, and the card And a video output unit that selects and outputs a video signal to be synthesized based on the information and the speed information obtained by the speed detection unit.
請求項1記載の発明によれば、カード情報だけでなく速度情報を用いて映像を選択することで、カードの移動内容に対応する様々な映像を出力することができる。これにより、インタラクティブ性に優れた高精度な映像を出力することができる。 According to the first aspect of the present invention, various videos corresponding to the movement contents of the card can be output by selecting a video using not only the card information but also the speed information. As a result, it is possible to output a highly accurate video with excellent interactivity.
請求項2に記載された発明は、前記映像出力部は、前記カード情報と前記速度検出部により得られる速度情報とに基づいて、動画映像を選択し、前記三次元位置情報と前記姿勢情報とに基づいて、前記動画映像の表示、非表示、大きさ、位置、方向を制御して出力することを特徴とする。 According to a second aspect of the present invention, the video output unit selects a moving image based on the card information and the speed information obtained by the speed detection unit, and the three-dimensional position information, the posture information, Based on the above, the display, non-display, size, position, and direction of the moving image are controlled and output.
請求項2記載の発明によれば、カード情報及び速度情報に基づいて動画映像を選択し、更に大きさや表示位置等を制御して出力することにより、より高精度な映像出力を実現することができる。 According to the second aspect of the present invention, it is possible to realize a higher-accuracy video output by selecting a video image based on the card information and the speed information, and further controlling and outputting the size, the display position, and the like. it can.
請求項3に記載された発明は、前記映像出力部は、前記カード情報と、前記速度検出部により得られる速度情報と、色情報及び前記三次元位置情報から得られる接続情報とに基づいて三次元動映像を選択し、前記三次元位置情報と前記姿勢情報とに基づいて、前記三次元動映像の表示、非表示、大きさ、位置、方向を制御して出力することを特徴とする。 According to a third aspect of the present invention, the video output unit is a third order based on the card information, the speed information obtained by the speed detection unit, and the connection information obtained from the color information and the three-dimensional position information. An original moving image is selected, and the display, non-display, size, position, and direction of the three-dimensional moving image are controlled and output based on the three-dimensional position information and the posture information.
請求項3記載の発明によれば、カード情報、速度情報、及び接続情報に基づいて三次元動映像を選択し、更に大きさや表示位置等を制御して出力することにより、より高精度な映像出力を実現することができる。
According to the invention described in
請求項4に記載された発明は、前記カメラにより撮影される映像信号に複数のカードが存在する場合、前記速度検出部は、前記カード情報に基づいて前記複数のカード間の相対速度情報を検出することを特徴とする。 According to a fourth aspect of the present invention, when there are a plurality of cards in a video signal photographed by the camera, the speed detection unit detects relative speed information between the plurality of cards based on the card information. It is characterized by doing.
請求項4記載の発明によれば、複数のカードの夫々についてカード情報及び相対速度情報を用いて映像を選択することで、カード間の移動内容に対応する様々な映像を出力することができる。これにより、インタラクティブ性に優れた高精度な映像を出力することができる。 According to the fourth aspect of the present invention, it is possible to output various videos corresponding to the movement contents between the cards by selecting the video using the card information and the relative speed information for each of the plurality of cards. As a result, it is possible to output a highly accurate video with excellent interactivity.
請求項5に記載された発明は、前記複数のカードのカード情報からカード間の距離や姿勢情報からなる相互位置姿勢情報を検出する相互位置姿勢検出部を有することを特徴とする。 The invention described in claim 5 includes a mutual position / posture detection unit that detects mutual position / posture information including the distance between the cards and the posture information from the card information of the plurality of cards.
請求項5記載の発明によれば、相互位置姿勢情報を用いて、カード間の移動や姿勢内容に対応する様々な映像を出力することができる。 According to the fifth aspect of the present invention, it is possible to output various images corresponding to movement between cards and content of posture using the mutual position and posture information.
請求項6に記載された発明は、前記映像出力部は、前記相対速度情報と前記相互位置姿勢情報とに基づいて、前記動画映像及び/又は前記三次元動映像を選択して出力することを特徴とする。 According to a sixth aspect of the present invention, the video output unit selects and outputs the moving image and / or the three-dimensional moving image based on the relative speed information and the mutual position and orientation information. Features.
請求項6記載の発明によれば、前記相対速度情報と前記相互位置姿勢情報とを用いることで、より高精度な映像出力を実現することができる。 According to the sixth aspect of the invention, by using the relative speed information and the mutual position / posture information, it is possible to realize more accurate video output.
請求項7に記載された発明は、カードを撮影するカメラの映像信号によりカードの種類、三次元位置情報、及び姿勢情報からなるカード情報に基づいて、予め蓄積された音声を再生出力する音声再生出力装置において、前記カメラにより撮影される映像信号の所定のフレーム間隔におけるフレーム毎に得られる前記カード情報に基づいて、カードの速度を検出する速度検出部と、前記カード情報と前記速度検出部により得られる速度情報とに基づいて、音声ファイルを選択して再生出力する音声再生出力部とを有し、前記カメラにより撮影される映像信号に複数のカードが存在する場合、前記速度検出部は、前記カード情報に基づいて前記複数のカード間の相対速度情報を検出することを特徴とする。 According to the seventh aspect of the present invention, the sound reproduction for reproducing and outputting the sound accumulated in advance based on the card information including the card type, the three-dimensional position information, and the posture information by the video signal of the camera for photographing the card. In the output device, based on the card information obtained for each frame at a predetermined frame interval of the video signal photographed by the camera, a speed detection unit that detects a card speed, and the card information and the speed detection unit based on the obtained velocity information, if you select the audio file possess an audio reproduction output unit for reproducing output, a plurality of card is present in the video signal captured by the camera, the speed detection unit, Relative speed information between the plurality of cards is detected based on the card information .
請求項7記載の発明によれば、カード情報だけでなく速度情報を用いて音声を選択することで、カードの移動内容に対応する様々な音声を出力することができる。また、複数のカードの夫々についてカード情報及び相対速度情報を用いて音声を選択することで、カード間の移動内容に対応する様々な音声を出力することができる。これにより、インタラクティブ性に優れた高精度な音声を出力することができる。 According to the seventh aspect of the invention, it is possible to output various sounds corresponding to the movement contents of the card by selecting the sound using not only the card information but also the speed information. In addition, by selecting sound using card information and relative speed information for each of a plurality of cards, various sounds corresponding to the movement contents between the cards can be output. This makes it possible to output highly accurate voice with excellent interactivity.
請求項8に記載された発明は、前記複数のカードのカード情報からカード間の距離や姿勢情報からなる相互位置姿勢情報を検出する相互位置姿勢検出部を有することを特徴とする。 The invention described in claim 8 includes a mutual position / posture detecting unit that detects mutual position / posture information including the distance between the cards and the posture information from the card information of the plurality of cards.
請求項8記載の発明によれば、相互位置姿勢情報を用いて、カード間の移動や姿勢内容に対応する様々な音声を出力することができる。 According to the eighth aspect of the invention, it is possible to output various sounds corresponding to movement between cards and posture contents using the mutual position and posture information.
請求項9に記載された発明は、前記音声再生出力部は、前記相対速度情報と前記相互位置姿勢情報とに基づいて、前記音声ファイルを選択して出力することを特徴とする。 The invention described in claim 9 is characterized in that the audio reproduction output unit selects and outputs the audio file based on the relative velocity information and the mutual position and orientation information.
請求項9記載の発明によれば、前記相対速度情報と前記相互位置姿勢情報とを用いることで、より高精度な音声出力を実現することができる。 According to the ninth aspect of the invention, by using the relative velocity information and the mutual position and orientation information, it is possible to realize more accurate voice output.
本発明によれば、カードを撮影したカメラ映像から得られるカード情報及びカードの速度情報に基づいて、インタラクティブ性に優れた高精度な映像又は音声を出力することができる。 ADVANTAGE OF THE INVENTION According to this invention, based on the card information obtained from the camera image | video which image | photographed the card | curd, and the speed information of a card | curd, the highly accurate image | video or audio | voice excellent in the interactive property can be output.
<本発明の概要>
本発明は、特定の文字や模様等の識別情報が描かれたカードを撮影し、撮影したカメラ映像から検出されるカードの種類、三次元位置情報、姿勢情報からなるカード情報とカードの速度情報に基づいて、予め蓄積されている動画映像や三次元動映像から対応する映像を選択し、実際に撮影されているカメラ映像と合成して出力する。
<Outline of the present invention>
The present invention shoots a card on which identification information such as a specific character or pattern is drawn, and detects card information including card type, three-dimensional position information, and posture information detected from the captured camera image, and card speed information. Based on the above, the corresponding video is selected from the previously stored moving image and 3D video, and is combined with the actually captured camera video and output.
ここで、三次元位置情報とは、カメラの撮影にて得られるカードのx、y、z座標における位置情報を表している。上述の内容を図を用いて説明する。図1は、カードとカメラとの位置関係を示す一例の図である。ここで、カード11には、カードの種類(種別)を特定するために文字(図1において、a)が描かれている。なお、カードを識別できるものであれば、文字に限らず、数字や、模様、顔の写真等でもよい。 Here, the three-dimensional position information represents position information on the x, y, and z coordinates of the card obtained by photographing with the camera. The above contents will be described with reference to the drawings. FIG. 1 is a diagram illustrating an example of a positional relationship between a card and a camera. Here, characters (a in FIG. 1) are drawn on the card 11 in order to specify the type (type) of the card. As long as the card can be identified, it is not limited to letters, but may be numbers, patterns, facial photographs, and the like.
図1に示すようにカード11の位置情報は、x座標がカメラに対して水平方向の位置を示し、y座標がカメラに対して垂直方向の位置を示し、z座標がカメラに対する距離を示している。また、姿勢情報は、上述のx軸、y軸、z軸の各軸に対する所定のカードの位置を基準とした回転の度合を示すものであり、カードそのものの姿勢を表すものである。これにより、ユーザがカードを動かした場合、カードを撮影したカメラからカード情報(カードの種類、三次元位置情報、姿勢情報)を取得する。 As shown in FIG. 1, in the position information of the card 11, the x coordinate indicates a position in the horizontal direction with respect to the camera, the y coordinate indicates a position in the vertical direction with respect to the camera, and the z coordinate indicates a distance with respect to the camera. Yes. The posture information indicates the degree of rotation based on the position of a predetermined card with respect to the above-described x-axis, y-axis, and z-axis, and represents the posture of the card itself. Thus, when the user moves the card, card information (card type, three-dimensional position information, posture information) is acquired from the camera that has photographed the card.
また、本発明ではカメラ映像から検出される複数のフレームから予め設定されたフレーム間隔により夫々の三次元位置情報、姿勢情報の差分を取得し、取得した差分からカードの移動速度を検出する。検出した速度情報に基づいて対応する動画映像及び/又は三次元動映像を選択し、実際に撮影されちるカメラの映像信号と合成して出力する。 In the present invention, the difference between the three-dimensional position information and the posture information is acquired from a plurality of frames detected from the camera image at a preset frame interval, and the moving speed of the card is detected from the acquired difference. A corresponding moving image and / or 3D moving image is selected based on the detected speed information, and is combined with a video signal of a camera that is actually shot and output.
具体的には、特定の文字や模様等の識別情報が描かれたカードの領域抽出、パターンマッチング等の画像処理を行うことにより、カードの種類、三次元位置情報、姿勢情報からなるカード情報を取得する。なお、上述のカード情報を取得するための画像処理技術としては、既に様々な技術が存在し、例えば、「画像処理工学」末松良一,山田宏尚著、コロナ社(以下、非特許文献1という。)に記載されている画像認識技術や、「マーカー追跡に基づく拡張現実感システムとそのキャリブレーション」加藤博一,Mark Billinghurst,浅野浩一,橘啓八郎著、基礎論文 TVRSJ vol4 No.4 1999(以下、非特許文献2という。)に記載されている技術を適用することができる。 Specifically, card information consisting of card type, three-dimensional position information, and posture information is obtained by performing image processing such as area extraction and pattern matching of cards on which identification information such as specific characters and patterns are drawn. get. Various image processing techniques for acquiring the above card information already exist. For example, “Image Processing Engineering” by Ryoichi Suematsu and Hirohisa Yamada, Corona (hereinafter referred to as Non-Patent Document 1). ), "Augmented reality system based on marker tracking and its calibration" Hirokazu Kato, Mark Billinghurst, Koichi Asano, Keihachi Tachibana, basic paper TVRSJ vol4 No. 4 1999 (hereinafter, referred to as non-patent document 2) can be applied.
また、カード情報に基づいて、予め蓄積されているか又は外部から入力される動画映像と、更に色情報及び三次元座標情報を持つ頂点群の接続情報により蓄積されている三次元動映像とを射影変換、視点変換して出力し、クロマキー処理等の映像合成手法を利用して、実際にカードを撮影しているカメラ映像と合成して出力する。 Also, based on the card information, a video image stored in advance or inputted from the outside and a 3D moving image stored by connection information of vertex groups having color information and 3D coordinate information are projected. Conversion, viewpoint conversion, and output, and using a video synthesis method such as chroma key processing, the video is synthesized with the camera video actually shooting the card and output.
ここで、射影変換、視点変換については、例えば、「OpenGL Programming Guide」Jackie Neider,Tom Davis,Mason Woo著、アジソンウェスレイ(以下、非特許文献3という。)に記載されているように三次元空間を表現するためのフォーマットであるOpenGLを用いた射影変換、視点変換技術を適用することができる。また、画像の合成技術については、例えば、「C言語で学ぶ実践画像処理」(井上誠喜,八木伸行,林正樹,中須英輔,三谷公二,奥井誠人著、オーム社)(以下、非特許文献4いう。)等に記載されているクロマキー処理等の映像合成を用いることができる。 Here, projection transformation and viewpoint transformation are three-dimensional as described in, for example, “OpenGL Programming Guide” by Jackie Neider, Tom Davis, Mason Woo, Addison Wesley (hereinafter referred to as Non-Patent Document 3). Projective transformation and viewpoint transformation techniques using OpenGL, which is a format for expressing a space, can be applied. As for image synthesis technology, for example, “Practical image processing learned in C language” (Masayuki Inoue, Nobuyuki Yagi, Masaki Hayashi, Eisuke Nakasu, Koji Mitani, Masato Okui, Ohmsha) Video composition such as chroma key processing described in the above.
更に、上述の色情報とは、例えば、カードの領域が矩形で形成されている場合、その矩形の頂点(P1,P2,P3,P4)の夫々の色情報(R1,G1,B1)〜(R4,G4,B4)を示し、上述の接続情報は、例えば、上述の矩形の頂点(P1,P2,P3,P4)から形成される2つの三角形(P1,P2,P4),(P1,P3,P4)のように形成された領域における点の接続情報を示している。なお、上述の三角形(P1,P2,P4),(P1,P3,P4)の夫々の色情報を内挿することで三角形の領域内の色が設定され、これが三次元形状の面に相当する。このように色情報を用いて三次元動映像を形成する技術としては、例えば、「注解 VRML2.0リファレンスマニュアル」(Rikk Carey,Gavin Bell著 アジソンウェスレイ)(以下、非特許文献5という。)がある。 Furthermore, the above-described color information is, for example, when the card area is formed in a rectangle, each color information (R 1 , G 4 ) of the vertices (P 1 , P 2 , P 3 , P 4 ) of the rectangle. 1 , B 1 ) to (R 4 , G 4 , B 4 ), and the above-described connection information is formed from, for example, the above-described rectangular vertices (P 1 , P 2 , P 3 , P 4 ) 2 The point connection information in a region formed as two triangles (P 1 , P 2 , P 4 ) and (P 1 , P 3 , P 4 ) is shown. It should be noted that the colors in the triangular area are set by interpolating the color information of the triangles (P 1 , P 2 , P 4 ) and (P 1 , P 3 , P 4 ) described above, It corresponds to the surface of the shape. As a technique for forming a three-dimensional moving image using color information in this manner, for example, “Note VRML2.0 Reference Manual” (Rick Carey, Gavin Bell, Addison Wesley) (hereinafter referred to as Non-Patent Document 5). There is.
また、本発明では、カメラで撮影されたカードの種類、三次元位置情報、姿勢情報からなるカード情報及びカードの速度情報に基づいて、予め蓄積される音声ファイルから再生出力する音声ファイルの種類、ボリューム、パンニングを選択し、その音声ファイルを再生出力する。ここで、音声ファイルのフォーマットとしては、wav,aiff,MP3,WMA,VQ,rm,ram,mov,aac,atrac3等がある。 Further, in the present invention, based on the card type photographed by the camera, the three-dimensional position information, the card information consisting of the posture information and the card speed information, the type of the audio file reproduced and output from the pre-stored audio file, Select volume and panning, and play and output the audio file. Here, the audio file format includes wav, aiff, MP3, WMA, VQ, rm, ram, mov, aac, atrac3, and the like.
更に、本発明では、複数のカードが撮影された場合に、複数のカード同士における互いの種類、三次元位置情報、姿勢情報から前記動画映像、三次元動映像の表示、非表示、大きさ、位置、方向、及び前記音声ファイルのオン、オフ、ボリューム、パンニング、出力する音声の種類を制御する。 Furthermore, in the present invention, when a plurality of cards are photographed, from the mutual type, the three-dimensional position information, and the posture information among the plurality of cards, the moving image, the display of the three-dimensional moving image, the non-display, the size, Controls the position, direction, and on / off, volume, panning, and type of audio output of the audio file.
<実施例1:映像合成出力装置>
次に、本発明を適用した動画映像及び三次元動映像を実際に撮影されているカメラからの映像信号と合成して出力するための映像合成出力装置について図を用いて説明する。
<Example 1: Video composition output device>
Next, a video composition output apparatus for synthesizing and outputting a moving image and a three-dimensional moving image to which the present invention is applied with a video signal from a camera that is actually photographed will be described with reference to the drawings.
図2は、本発明における映像合成出力システムの一構成例を示す図である。図2の映像合成出力システムは、カード21を撮影するためのカメラ22と、カード情報取得装置23と、映像合成出力装置24とを有するよう構成されている。また、映像合成出力装置24は、速度検出部25と、動画映像出力部26と、三次元動映像出力部27と、映像合成出力部28とを有するよう構成されている。
FIG. 2 is a diagram showing a configuration example of a video composition output system according to the present invention. The video composition output system of FIG. 2 is configured to include a camera 22 for photographing the
図2に示す映像合成出力システムは、まずカードを識別するための特定の文字や模様が描かれているカード21をカメラ22により撮影する。カメラ22にて撮影されたカメラ映像信号は、カード情報取得装置23及び映像合成出力部28に出力される。なお、カード21は、例えば、ユーザにより把持されカメラ21に対して三次元座標(図1に示すx,y,z座標)での移動や回転を行う。
In the video composition output system shown in FIG. 2, first, the camera 22 photographs a
カード情報取得装置23は、カメラ22から入力されたカメラ映像信号からカード21の領域を抽出し、パターンマッチング等の画像処理を行って撮影された映像中に含まれるカードの種類、三次元位置情報、姿勢情報からなるカード情報を取得する。また、カード情報取得装置23は、取得したカード情報を速度検出部25、動画映像出力部26、及び三次元動映像出力部27に出力する。なお、カード情報取得装置23にて、カード21の領域を抽出する際には、例えば、非特許文献2に示すように図2のカード21内に矩形を描き、その描かれた角の三次元座標を取得することで、三次元位置情報や姿勢情報を取得することができる。
The card
速度検出部25は、カード情報取得装置23から逐次入力されるカードの種類、三次元位置情報、及び姿勢情報からカードの種類毎に映像信号に含まれる予め設定されるフレーム間隔での三次元位置情報及び姿勢情報を取得し、その三次元位置情報、姿勢情報の差分を計算してカード毎の方向を含めた移動速度を求め、カードの種類及び速度情報を動画映像出力部26及び三次元動映像出力部27に出力する。ここで、フレーム間隔として、例えば、1秒間に30フレームを有する映像信号であれば間隔を15フレームと設定する。
The
動画映像出力部26では、入力されるカードの種類及び移動速度から予め蓄積されている動画映像データ又は外部から入力される動画映像の中から対応する動画映像を選択し、更に、カードの三次元位置情報、姿勢情報に基づいて、出力する動画映像を射影変換及び視点変換により移動、回転させて動画映像信号として映像合成出力部28に出力する。なお、射影変換及び視点変換により出力される映像は、実際にカメラ22により撮影されたカード上に出力され、更に、向きをカードの向きに対応して調整した映像が出力されるようにする。これにより、カードの向きに対応して映像の向きを変えて表示することができる。
The moving
なお、出力される映像の位置は、本発明においてはこの限りではなく、例えば、カードから所定の位置だけ離れた位置に映像を出力させるよう設定することもできる。 Note that the position of the video to be output is not limited to this in the present invention. For example, the video can be set to be output at a position away from the card by a predetermined position.
また、三次元動映像出力部27は、予め蓄積されている三次元動映像データの中から、速度検出部25により入力された速度情報と、カード情報取得装置23により入力されたカードの種類、三次元位置情報、姿勢情報からなるカード情報、及び上述した色情報及び三次元座標情報を持つ頂点群の接続情報から対応する三次元動映像を選択する。
The 3D moving
更に、カード21の三次元位置情報、姿勢情報に基づいて、出力する三次元動映像を射影変換、視点変換して移動、回転させてOpenGL等の一般に利用可能な三次元動映像描画ソフトウェアにより描画し三次元動映像を生成し、生成した三次元動映像信号を映像合成出力部28に出力する。
Further, based on the three-dimensional position information and posture information of the
なお、三次元空間(三次元仮想現実空間)を表現するための三次元空間フォーマットとしては、OpenGLの他にVRML,DirectX,DXF等の三次元空間フォーマットを適用することができる。 As a three-dimensional space format for expressing the three-dimensional space (three-dimensional virtual reality space), a three-dimensional space format such as VRML, DirectX, DXF, etc. can be applied in addition to OpenGL.
ここで、動画映像出力部26及び三次元動映像出力部27に夫々蓄積されている映像を選択するためのデータの例について、図を用いて説明する。
Here, an example of data for selecting videos stored in the moving
図3は、動画映像出力部及び三次元動映像出力部に夫々蓄積されている映像選択データの一例を示す図である。 FIG. 3 is a diagram illustrating an example of video selection data stored in each of the moving image output unit and the 3D moving image output unit.
図3に示すデータ項目は、カードの種類を特定するカード種別と、速度検出部25から検出された速度条件と、カード種別及び速度条件に対応する映像等からなる。更に、三次元動映像出力部27に蓄積されているデータには、上述の接続情報も含まれる。
The data items shown in FIG. 3 include a card type that specifies the type of card, a speed condition detected by the
図3において、例えば、カード種別がaで、所定のフレーム間隔で測定されたカードの移動速度が7cm/sであった場合、人Aが歩いている映像が選択される。また、カード種別がaで、所定のフレーム間隔で測定されたカードの移動速度が15cm/sであった場合、人Aが走っている映像が選択される。このようにカードの移動速度に応じて選択される映像が異なる。この選択された映像に基づいて、動画映像出力部26、三次元動映像出力部27の夫々において、映像を選択しカード情報に含まれる三次元座標情報及び姿勢情報に基づいて射影変換、視点変換を行う。更に、映像を表示、非表示、大きさ、位置、方向等の制御を行い映像合成出力部28に出力する。
In FIG. 3, for example, when the card type is a and the moving speed of the card measured at a predetermined frame interval is 7 cm / s, an image in which the person A is walking is selected. Also, when the card type is a and the moving speed of the card measured at a predetermined frame interval is 15 cm / s, an image in which the person A is running is selected. As described above, the selected video differs depending on the moving speed of the card. Based on the selected video, each of the video
映像合成出力部28では、カメラ22から入力される実際に撮影されているカメラの映像と、動画映像出力部26から入力される動画映像と、三次元動映像出力部27から入力される三次元動映像信号をキー信号処理等を利用した映像合成ソフトウェアにより合成を行い、カメラ映像と、動画映像と、三次元動映像との合成信号を映像信号としてディスプレイ装置やプロジェクタ等により出力する。なお、出力される具体的な内容については後述する。
In the video
ここで、キー信号処理については、例えば、上述の非特許文献4に示すようなクロマキー信号処理等を用いることにより、映像を合成することができる。 Here, with regard to the key signal processing, for example, a video can be synthesized by using chroma key signal processing or the like as shown in Non-Patent Document 4 described above.
また、映像合成出力部28において、動画映像出力部26又は三次元動映像出力部27のどちらか一方からしか映像信号が入力されなければ、その一方から得られる映像信号と、カメラ22から入力される映像信号とを合成して出力する。
Further, in the video
このように、速度検出部25により得られる速度情報を用いることで、最適な映像を選択して表示させることができる。これにより、ユーザが動かしたカードに対してインタラクティブ性に優れた高精度な映像を出力することができる。
As described above, by using the speed information obtained by the
<実施例2:音声再生出力装置>
次に、本発明を適用した音声再生出力システムの構成について図を用いて説明する。
<Example 2: Audio reproduction output device>
Next, the configuration of an audio reproduction output system to which the present invention is applied will be described with reference to the drawings.
図4は、本発明における音声再生出力システムの一構成例を示す図である。図4に示す音声出力システムは、カード41を撮影するカメラ42と、カード情報取得装置43と、音声再生出力装置44とを有するよう構成されている。また、音声再生出力装置44は、速度検出部45と、音声再生出力部46とを有するよう構成されている。ここで、カード41は、上述のカード21と同一である。
FIG. 4 is a diagram showing an example of the configuration of an audio reproduction output system according to the present invention. The audio output system shown in FIG. 4 is configured to include a camera 42 that captures a card 41, a card
まず、カードを特定するための文字や模様等の識別情報が描かれているカード41をカメラ42により撮影する。カメラ42にて撮影されたカメラ映像信号は、カード情報取得装置43に出力される。なお、カード41は、ユーザにより把持されカメラ42に対して三次元座標(図1に示すx,y,z座標)での移動や回転を行う。
First, the camera 41 photographs a card 41 on which identification information such as characters and patterns for specifying the card is drawn. A camera video signal photographed by the camera 42 is output to the card
カード情報取得装置43は、カメラ42から入力されたカメラ映像信号からカード41の領域を抽出し、パターンマッチング等の画像処理を行って撮影された映像中に含まれるカードの種類、三次元位置情報、姿勢情報からなるカード情報を取得する。また、カード情報取得装置43は、取得したカード情報を速度検出部45、及び音声再生出力部46に出力する。
The card
速度検出部45は、カード情報取得装置43から逐次入力されるカードの種類、三次元位置情報、及び姿勢情報からカードの種類毎に映像信号に含まれる予め設定されるフレーム間隔での三次元位置情報及び姿勢情報を取得し、その三次元位置情報、姿勢情報の差分を計算してカード毎の方向を含めた移動速度を求め、カードの種類及び速度情報を音声再生出力部46に出力する。
The
音声再生出力部46では、入力されるカードの種類及び移動速度から予め蓄積されている音声ファイル又は外部から入力される音声の中から対応する音声ファイルを選択して、音声信号を再生し、スピーカ等の音声出力装置に出力する。
The audio
なお、音声出力において、例えば、複数のスピーカを用いたサラウンド再生出力が可能である場合には、速度情報、三次元位置情報及び姿勢情報に基づいて所定のスピーカに音声出力を行う。また、カードとカメラからの距離に対応させて音声のボリューム変えたり、パンニングやエフェクト、残響等の音声制御を行う。これにより臨場感のある音声を出力することができる。 In addition, in the sound output, for example, when surround playback output using a plurality of speakers is possible, the sound is output to a predetermined speaker based on the speed information, the three-dimensional position information, and the posture information. In addition, the sound volume is changed according to the distance from the card and the camera, and sound control such as panning, effects, and reverberation is performed. This makes it possible to output a realistic sound.
ここで、音声再生出力部46が有する音声を選択するためのデータ例について、図を用いて説明する。図5は、音声再生出力部が有するデータの一例を示す図である。図5に示すデータ項目は、カードの種類から得られるカード種別と、速度検出部45から得られる速度条件と、カード種別と速度条件とから音声を出力するものである。
Here, an example of data for selecting the voice of the voice
図5において、例えば、カード種別がbで、速度が2cm/sであれば、人Bの声で口笛を吹いている音声ファイルを選択する。なお、音声ファイルとしては、wav,aiff,MP3,WMA,VQ,rm,ram,mov,aac,atrac3等でフォーマットされた音声ファイルを用いることができる。 In FIG. 5, for example, if the card type is b and the speed is 2 cm / s, an audio file whistling in person B's voice is selected. As an audio file, an audio file formatted in wav, aiff, MP3, WMA, VQ, rm, ram, mov, aac, atrac3, etc. can be used.
上述したように、本発明を適用した音声再生出力装置により、速度情報に基づいて、ユーザが動かしたカードに対してインタラクティブ性に優れた高精度な音声ファイルを出力することができる。 As described above, the audio reproduction output device to which the present invention is applied can output a highly accurate audio file with excellent interactivity to the card moved by the user based on the speed information.
ここで、上述の映像合成出力装置24、音声再生出力装置44は、組み合わせた構成にすることも可能である。これにより、更に高精度な映像出力、音声出力を実現することができる。
Here, the above-described video
また、カメラに撮影されるカードは、1枚だけでなく、複数枚の場合もある。複数枚の場合には、夫々が上述の実施例で示しているように1枚で撮影されているときと同様の動作を行うこともできるが、複数撮影されている場合に夫々のカードの相対速度や相互位置に基づいて、出力される映像や音声を選択することで、より高精度な映像出力や音声出力を実現することができる。 In addition, the card photographed by the camera may be not only one but also a plurality of cards. In the case of a plurality of images, it is possible to perform the same operation as when each image is photographed as shown in the above-described embodiment. By selecting the video and audio to be output based on the speed and the mutual position, it is possible to realize more accurate video output and audio output.
ここで、上述したように複数枚のカードが撮影された場合に本発明を適用した映像合成出力装置及び音声再生出力装置について説明する。なお、後述する実施例3では、映像合成出力と、音声再生出力とを1つの装置構成にて実現する例について説明するが、上述の実施例に示すように夫々を別々の装置構成とすることもできる。 Here, a video composition output device and an audio reproduction output device to which the present invention is applied when a plurality of cards are photographed as described above will be described. In the third embodiment to be described later, an example in which video synthesis output and audio reproduction output are realized by one device configuration will be described. However, as shown in the above-described embodiments, each device has a separate device configuration. You can also.
<実施例3:映像合成・音声再生出力装置>
図6は、本発明における映像合成・音声再生出力システムの一構成例を示す図である。図6に示す映像合成・音声再生出力システムは、カード61−1,61−2を撮影するカメラ62と、カード情報取得装置63と、映像合成・音声再生出力装置64とを有するよう構成されている。
<Example 3: Video synthesis / audio reproduction output device>
FIG. 6 is a diagram showing a configuration example of a video synthesis / audio reproduction output system according to the present invention. The video synthesis / audio reproduction output system shown in FIG. 6 is configured to include a
また、映像合成・音声再生出力装置64は、速度検出部65と、相互位置姿勢検出部66と、動画映像出力部67と、三次元動映像出力部68と、音声再生出力部69と、映像合成出力部70とを有するよう構成されている。
The video synthesis / audio
ここで、図6に示す実施例では、2枚のカード61−1,61−2を用いた例について説明するが、本発明においてはこの限りではなく、3枚以上であってもよい。 Here, in the embodiment shown in FIG. 6, an example in which two cards 61-1 and 61-2 are used will be described. However, the present invention is not limited to this, and three or more cards may be used.
まず、カード61−1,61−2をカメラ62により撮影する。カメラ62にて撮影されたカメラ映像信号は、カード情報取得装置63及び映像合成出力部70に出力される。なお、カード61−1,61−2は、ユーザにより把持されカメラ62に対して三次元座標(図1に示すx,y,z座標)での移動や回転を行う。
First, the cards 61-1 and 61-2 are photographed by the
カード情報取得装置63は、カメラ62から入力されたカメラ映像信号からカード61−1,61−2の夫々の領域を抽出し、パターンマッチング等の画像処理を行って撮影された映像中に含まれるカードの種類、三次元位置情報、姿勢情報からなるカード情報を取得する。また、カード情報取得装置63は、取得したカード情報を速度検出部65、相互位置姿勢検出部66に出力する。
The card
速度検出部65は、カード情報取得装置63から逐次入力されるカードの種類、三次元位置情報、及び姿勢情報から、複数のカードの種類毎に映像信号に含まれる予め設定されるフレーム間隔での三次元位置情報及び姿勢情報を取得し、その三次元位置情報、姿勢情報の差分を計算してカード間の方向を含めた相対移動速度を求め、カードの種類、撮影された複数のカード間の相対速度情報を動画映像出力部67、三次元動映像出力部68、及び音声再生出力部69に出力する。
The speed detection unit 65 is configured to detect the card type, the three-dimensional position information, and the posture information that are sequentially input from the card
また、相互位置姿勢検出部66は、入力される夫々のカードのカード情報からカード同士が相互にどの位置でどの方向を向いているかの相互位置姿勢情報(カード間の距離や姿勢情報)を検出し、カード情報及び相互位置姿勢情報を動画映像出力部67、三次元動映像出力部68、音声再生出力部69に出力する。
Further, the mutual position /
動画映像出力部67では、入力されるカード情報、カード間の相対速度情報及び相互位置姿勢情報から、予め蓄積されている動画映像データ又は外部から入力される動画映像の中から対応する動画映像を選択し、更に、カード61−1,61−2の三次元位置情報、姿勢情報に基づいて、出力する動画映像を射影変換及び視点変換により移動、回転させて動画映像信号として映像合成出力部70に出力する。なお、射影変換及び視点変換により出力される映像は、実際にカメラ62により撮影されたカード上に出力され、更に、向きをカードの向きに対応して調整した映像が出力されるようにする。
In the moving
また、三次元動映像出力部68は、予め蓄積されている三次元動映像データの中から、速度検出部65により入力されたカード間の相対速度情報及び相互位置姿勢情報、カード情報、及び接続情報から対応する三次元動映像を選択する。更に、カード61−1,61−2の三次元位置情報、姿勢情報に基づいて、出力する三次元動映像を射影変換、視点変換して移動、回転させてOpenGL等の一般に利用可能な三次元動映像描画ソフトウェアにより描画し三次元動映像を生成し、生成した三次元動映像信号を映像合成出力部70に出力する。
Also, the 3D moving
映像合成出力部70は、カメラ62から入力される実際に撮影されているカメラの映像と、動画映像出力部67から入力される動画映像と、三次元動映像出力部68から入力される三次元動映像信号をキー信号処理等により合成を行い、カメラ映像と、動画映像と、三次元動映像との合成信号を映像信号としてディスプレイ装置やプロジェクタ等により出力する。なお、出力される具体的な内容については後述する。
The video
一方、音声再生出力部69では、入力されるカード情報、カード間の相対速度情報、及び相互位置姿勢情報から予め蓄積されている音声ファイル又は外部から入力される音声の中から対応する音声ファイルを選択して、音声信号を再生し、スピーカ等の音声出力装置に出力する。
On the other hand, in the audio
なお、音声出力において、例えば、複数のスピーカを用いたサラウンド再生出力が可能である場合には、相対速度情報、相互位置姿勢情報に基づいて所定のスピーカに音声出力を行う。これにより臨場感のある音声を出力することができる。 For example, when surround playback output using a plurality of speakers is possible in audio output, audio is output to a predetermined speaker based on relative speed information and mutual position and orientation information. This makes it possible to output a realistic sound.
ここで、動画映像出力部67、三次元動映像出力部68、及び音声再生出力部69に夫々蓄積されている映像を選択するためのデータの例と、そのデータにより、ディスプレイに出力される映像出力、及び音声出力の具体例について、図7、図8を用いて説明する。
Here, an example of data for selecting videos stored in the moving
図7は、動画映像出力部、三次元動映像出力部、音声再生出力部に蓄積されている映像を選択するためのデータの一例を示す図である。また、図8は、図7のデータ例に基づく映像出力、音声出力の一例を示す図である。 FIG. 7 is a diagram illustrating an example of data for selecting videos stored in the moving image output unit, the 3D moving image output unit, and the audio reproduction output unit. FIG. 8 is a diagram showing an example of video output and audio output based on the data example of FIG.
ここで、図7(a)は、動画映像出力部67、及び三次元動映像出力部68が備えるデータ例であり、図7(b)は、音声再生出力部69が備えるデータ例である。図7では、少なくとも2つのカード種別(カードの種類)に対応する相対速度、相互位置におけるカードの映像(図7(a))、又は音声(図7(b))の情報が蓄積されている。また、三次元動映像出力部68の場合には、上述の項目の他に接続情報も含まれる。
また、図7のデータでは、2枚のカードが撮影されている場合についてのデータ例を示しているが、本発明においてカードの枚数についてはこの限りではなく複数枚に対応させてデータを蓄積することもできる。なお、カードが1枚の場合には、図3又は図5に示すデータを参照する。更に、データ内に条件に対応する映像が複数存在する場合は、全てを選択してもよく、また複数ある映像や音声に優先順位を設けて選択することもできる。
Here, FIG. 7A is an example of data provided in the moving
The data in FIG. 7 shows an example of data when two cards are photographed. However, in the present invention, the number of cards is not limited to this, and data is stored corresponding to a plurality of cards. You can also. When there is one card, the data shown in FIG. 3 or FIG. 5 is referred to. Furthermore, when there are a plurality of videos corresponding to the condition in the data, all of them may be selected, or a plurality of videos and sounds can be selected with priority.
例えば、図8(a)に示すように、同時に撮影される2枚のカード81−1,81−2が存在し、カード81−1の種類(カード種別)をaとし,カード81−2の種類(カード種別)をbとする。ここで、カード81−1とカード81−2を互いに接近させた場合の、映像、音声の出力について説明する。 For example, as shown in FIG. 8A, there are two cards 81-1 and 81-2 that are photographed at the same time, and the type (card type) of the card 81-1 is a, The type (card type) is b. Here, output of video and audio when the card 81-1 and the card 81-2 are brought close to each other will be described.
まず、速度検出部65により得られる2枚のカードの相対移動速度が0.5cm/sで、相互位置姿勢検出部66から得られる相互位置が2cmの位置にある場合、図7(a)からカード種別aに対応する映像1として人Aがおじぎをする映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、所定の位置に映像を出力する(図8(b))。また、図7(b)から対応する音声として“コンニチハ”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から再生出力される。
First, when the relative movement speed of the two cards obtained by the speed detection unit 65 is 0.5 cm / s and the mutual position obtained from the mutual position /
一方、カード種別bに対応する映像2として図7(a)のデータから人Bがおじぎをする映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、所定の位置に映像を出力する(図8(b))。また、図7(b)からは、“ドウモ”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から再生出力される。
On the other hand, as the video 2 corresponding to the card type b, the video that the person B bows from the data in FIG. 7A is selected, and the video output from the moving
更に、速度検出部65により得られる2枚のカードの相対移動速度が0.5cm/sで、相互位置姿勢検出部66から得られる相互位置が0.2cmの位置にある場合、図7(a)からカード種別aに対応する映像1として、人Aと人Bとが握手をする映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、例えば、カード81−2よりに表示させる等の制御を行って映像を出力する(図8(c))。また、図7(b)から対応する音声として“ヨロシク”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から再生出力される。
Further, when the relative movement speed of the two cards obtained by the speed detection unit 65 is 0.5 cm / s and the mutual position obtained from the mutual position /
一方、カード種別bに対応する映像2としては、図7(a)のデータから出力される映像を表示しないよう設定されている。つまり、対応するカード種別aの映像において、人Aと人Bとが握手をしている映像を表示させるため、カード種別bは映像を表示させる必要がない。このように表示させることで、人物同士が抱き合ったり、人が自動車に乗り込むような映像等をより現実的な動作で表示することができ、より詳細な映像を高精度に表示させることができる。 On the other hand, the video 2 corresponding to the card type b is set not to display the video output from the data of FIG. That is, in the video of the corresponding card type a, the video in which the person A and the person B are shaking hands is displayed, so that the card type b does not need to display the video. By displaying in this way, it is possible to display an image such as a person embracing each other or a person getting into a car with a more realistic operation, and a more detailed image can be displayed with high accuracy.
また、図7(b)から対応する音声として“ヨロシク”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から出力される。 Also, from FIG. 7 (b), a voice file that outputs “Yoroshiku” as a corresponding voice is selected and output from a voice output device such as a speaker.
更に、速度検出部65により得られる2枚のカードの相対移動速度が15cm/sで、相互位置姿勢検出部66から得られる相互位置が0.5cmの位置にある場合、図7(a)からカード種別aに対応する映像1として人Aが転倒する映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、所定の位置に映像を出力する(図8(d))。また、図7(b)から対応する音声として“ワー”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から出力される。
Furthermore, when the relative movement speed of the two cards obtained by the speed detection unit 65 is 15 cm / s and the mutual position obtained from the mutual position /
一方、カード種別bに対応する映像2として図7(a)のデータから人Bが転倒する映像が選択され、動画映像出力部67、三次元動映像出力部68により出力される映像を実際に撮影されている映像と合成して、所定の位置に映像を出力する(図8(d))。また、図7(b)からは、“イタイ”と音声出力する音声ファイルが選択され、スピーカ等の音声出力装置から出力される。
On the other hand, as the video 2 corresponding to the card type b, the video in which the person B falls is selected from the data of FIG. 7A, and the video output by the moving
このように、相対速度情報と相互位置姿勢情報に基づいて、映像、音声を選択することで、カードが1枚の場合より多様で高精度な映像、音声を出力することができる。これにより、ユーザが動かしたカードに対してインタラクティブ性に優れた高精度な映像や音声を出力することができる。 Thus, by selecting video and audio based on the relative velocity information and the mutual position and orientation information, it is possible to output video and audio that are more diverse and highly accurate than when one card is used. This makes it possible to output highly accurate video and audio with excellent interactivity with respect to the card moved by the user.
上述したように本発明によれば、特定の文字や模様等の識別情報が描かれたカードを撮影した映像から得られるカード情報と、カードの速度情報とに基づいて動画映像、三次元動映像、音声を選択して実際に撮影された映像信号に合成することで高精度に映像出力や音声出力を実現することができる。これにより、ユーザが動かしたカードに対してインタラクティブ性に優れた高精度な映像や音声を出力することができる。 As described above, according to the present invention, a video image, a three-dimensional video image is obtained based on card information obtained from a video obtained by photographing a card on which identification information such as a specific character or pattern is drawn, and speed information of the card. By selecting the audio and synthesizing it with the actually captured video signal, video output and audio output can be realized with high accuracy. This makes it possible to output highly accurate video and audio with excellent interactivity with respect to the card moved by the user.
更に、実際に撮影された映像信号に複数のカードが存在する場合に、カード間の相対速度情報や相互位置姿勢情報に基づいて、動画映像、三次元動映像、音声を選択して実際に撮影された映像信号に合成することでより高精度に映像出力や音声出力を実現することができる。 In addition, when there are multiple cards in the video signal that was actually shot, actual video was shot by selecting video, 3D video, and audio based on the relative speed information and mutual position and orientation information between the cards. By synthesizing the generated video signal, video output and audio output can be realized with higher accuracy.
以上本発明の好ましい実施例について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。 The preferred embodiments of the present invention have been described in detail above, but the present invention is not limited to such specific embodiments, and various modifications, within the scope of the gist of the present invention described in the claims, It can be changed.
11,21,41,61,81 カード
12,22,42,62 カメラ
23,43,63 カード情報取得装置
24 映像合成出力装置
25,45,65 速度検出部
26,67 動画映像出力部
27,68 三次元動映像出力部
28,70 映像合成出力部
44 音声再生出力装置
46,68 音声再生出力部
64 映像合成・音声再生出力装置
66 相互位置姿勢検出部
11, 21, 41, 61, 81
Claims (9)
前記カメラにより撮影される映像信号の所定のフレーム間隔におけるフレーム毎に得られる前記カード情報に基づいて、カードの速度を検出する速度検出部と、
前記カード情報と前記速度検出部により得られる速度情報とに基づいて、合成する映像信号を選択して出力する映像出力部とを有することを特徴とする映像合成出力装置。 In a video composition output device for synthesizing and outputting another video signal to the video signal based on the card information consisting of the card type, three-dimensional position information, and posture information from the video signal of the camera that shoots the card ,
A speed detector that detects the speed of the card based on the card information obtained for each frame at a predetermined frame interval of the video signal captured by the camera;
A video composition output device comprising: a video output unit that selects and outputs a video signal to be synthesized based on the card information and speed information obtained by the speed detection unit.
前記カード情報と前記速度検出部により得られる速度情報とに基づいて、動画映像を選択し、前記三次元位置情報と前記姿勢情報とに基づいて、前記動画映像の表示、非表示、大きさ、位置、方向を制御して出力することを特徴とする請求項1に記載の映像合成出力装置。 The video output unit
Based on the card information and the speed information obtained by the speed detection unit, select a moving image, and based on the three-dimensional position information and the posture information, display, non-display, size of the moving image, The video composition output device according to claim 1, wherein the video composition output device controls and outputs a position and a direction.
前記カード情報と、前記速度検出部により得られる速度情報と、色情報及び前記三次元位置情報から得られる接続情報とに基づいて三次元動映像を選択し、前記三次元位置情報と前記姿勢情報とに基づいて、前記三次元動映像の表示、非表示、大きさ、位置、方向を制御して出力することを特徴とする請求項1に記載の映像合成出力装置。 The video output unit
Based on the card information, speed information obtained by the speed detector, color information and connection information obtained from the three-dimensional position information, a three-dimensional moving image is selected, and the three-dimensional position information and the posture information are selected. The video composition output device according to claim 1, wherein the display, non-display, size, position, and direction of the three-dimensional moving image are controlled based on the output.
前記速度検出部は、前記カード情報に基づいて前記複数のカード間の相対速度情報を検出することを特徴とする請求項1乃至3の何れか1項に記載の映像合成出力装置。 When there are a plurality of cards in the video signal captured by the camera,
The video composition output device according to any one of claims 1 to 3, wherein the speed detection unit detects relative speed information between the plurality of cards based on the card information.
前記相対速度情報と前記相互位置姿勢情報とに基づいて、前記動画映像及び/又は前記三次元動映像を選択して出力することを特徴とする請求項5に記載の映像合成出力装置。 The video output unit
6. The video composition output device according to claim 5, wherein the video image and / or the three-dimensional moving image is selected and output based on the relative velocity information and the mutual position and orientation information.
前記カメラにより撮影される映像信号の所定のフレーム間隔におけるフレーム毎に得られる前記カード情報に基づいて、カードの速度を検出する速度検出部と、
前記カード情報と前記速度検出部により得られる速度情報とに基づいて、音声ファイルを選択して再生出力する音声再生出力部とを有し、
前記カメラにより撮影される映像信号に複数のカードが存在する場合、前記速度検出部は、前記カード情報に基づいて前記複数のカード間の相対速度情報を検出することを特徴とする音声再生出力装置。 In an audio reproduction output device that reproduces and outputs pre-stored audio based on card information including card type, three-dimensional position information, and posture information from a video signal of a camera that shoots the card,
A speed detector that detects the speed of the card based on the card information obtained for each frame at a predetermined frame interval of the video signal captured by the camera;
Wherein based on the velocity information obtained by the card information and the speed detection unit, possess an audio reproduction output unit for reproducing and outputting selected audio file,
When there are a plurality of cards in a video signal photographed by the camera, the speed detection unit detects relative speed information between the plurality of cards based on the card information. .
前記相対速度情報と前記相互位置姿勢情報とに基づいて、前記音声ファイルを選択して出力することを特徴とする請求項8に記載の音声再生出力装置。 The audio reproduction output unit
9. The audio reproduction output device according to claim 8 , wherein the audio file is selected and output based on the relative speed information and the mutual position and orientation information.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003371798A JP4185437B2 (en) | 2003-10-31 | 2003-10-31 | Video composition output device and audio reproduction output device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003371798A JP4185437B2 (en) | 2003-10-31 | 2003-10-31 | Video composition output device and audio reproduction output device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2005136776A JP2005136776A (en) | 2005-05-26 |
| JP4185437B2 true JP4185437B2 (en) | 2008-11-26 |
Family
ID=34648353
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003371798A Expired - Fee Related JP4185437B2 (en) | 2003-10-31 | 2003-10-31 | Video composition output device and audio reproduction output device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4185437B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007206807A (en) * | 2006-01-31 | 2007-08-16 | Nippon Hoso Kyokai <Nhk> | Video composition device and video composition program |
-
2003
- 2003-10-31 JP JP2003371798A patent/JP4185437B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2005136776A (en) | 2005-05-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11100719B2 (en) | Method and apparatus for overlaying a reproduction of a real scene with virtual image and audio data, and a mobile device | |
| JP4310916B2 (en) | Video display device | |
| JP2002514875A (en) | Panoramic movie that simulates movement in multidimensional space | |
| JP2009533786A (en) | Self-realistic talking head creation system and method | |
| JPH05501184A (en) | Method and apparatus for changing the content of continuous images | |
| JP2022131778A (en) | Information processing device, information processing method, and program | |
| US20020097245A1 (en) | Sensor fusion apparatus and method for optical and magnetic motion capture systems | |
| US20190130644A1 (en) | Provision of Virtual Reality Content | |
| WO1997042601A1 (en) | Integrated interactive multimedia process | |
| JP2016053788A (en) | Information terminal device, information processing method, system, and program | |
| EP2643791B1 (en) | Method and assembly for improved audio signal presentation of sounds during a video recording | |
| US20240233297A1 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
| JP4185437B2 (en) | Video composition output device and audio reproduction output device | |
| JP2004045651A (en) | Motion picture processing method | |
| JP2010183384A (en) | Photographic camera learning apparatus and program therefor | |
| KR101773891B1 (en) | System and Computer Implemented Method for Playing Compoiste Video through Selection of Environment Object in Real Time Manner | |
| JP2003143477A (en) | Image synthesizing apparatus and method | |
| JPH10126687A (en) | Substitution editing system | |
| JP4530214B2 (en) | Simulated field of view generator | |
| JP2006048484A (en) | Design support device | |
| JP7795931B2 (en) | Information processing device, information processing method, data structure and program | |
| KR20170075321A (en) | Karaoke system for providing augmented reality | |
| KR101860215B1 (en) | Content Display System and Method based on Projector Position | |
| KR102685040B1 (en) | Video production device and method based on user movement record | |
| JP4217008B2 (en) | Camera work simulator and simulation method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060328 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080331 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080603 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080718 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080812 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080905 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110912 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120912 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130912 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140912 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |