JP3968942B2 - ビデオの内容を要約する方法 - Google Patents
ビデオの内容を要約する方法 Download PDFInfo
- Publication number
- JP3968942B2 JP3968942B2 JP2000064869A JP2000064869A JP3968942B2 JP 3968942 B2 JP3968942 B2 JP 3968942B2 JP 2000064869 A JP2000064869 A JP 2000064869A JP 2000064869 A JP2000064869 A JP 2000064869A JP 3968942 B2 JP3968942 B2 JP 3968942B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- video
- importance
- frames
- shot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
- G06V20/47—Detecting features for summarising video content
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Television Signal Processing For Recording (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、ビデオ或いは動画の要約(summary)に関する。特に、本発明は、ビデオから各々のショット或いはセグメントの重要度を決定することに関する。また本発明は、要約中の各々のセグメント或いはショットの重要度を強調するか、或いは、重要視しないような構成にパック(即ち、構成)された、ビデオ或いは動画の要約を生成或いは印刷することにも関する。更に本発明は、要約を表示するために最低コストのパッキングしか必要でないように、異なったサイズにされたフレームをビデオ要約にパック(最小の重み付けをされたリサイズ量(即ち、最少のフレームを最小の重み付けをされたリサイズ量で異なったサイズに摺ることによってパックする))するための方法に関する。また更に、ビデオブラウジングシステムへのインタフェースとして最低コストでパックされたビデオ要約を使用することに関する。
【0002】
【従来の技術】
ビデオの使用及びビデオを介してのイベントの蓄積及び通信が増加すると(インターネット通信、テレビジョン帯域(即ち、テレビジョン放送の周波数帯域)及びチャンネルの増加、ニュース放送におけるビデオの使用の増加等)、ビデオユーザ及び管理者は、最も効率的な方法で、ビデオを格納し、アクセスし、重要なシーン或いはフレームを決定し、そして要約するという付加的な作業に直面する。
【0003】
「ショット」は、時間及び視覚空間において一般的には連続的であるビデオ或いは動画のセグメントである。一般的には、カットに対応する大きなフレーム差或いはショット境界を見つけることによって、ビデオをその構成要素のショットに自動的にセグメント化する技術は存在する。多くの分野において、既存のビデオ、動画、或いは放送の要約或いは「スキム(skim)」を自動的に生成することが所望される。これは、ビデオの冗長な情報を選択的に廃棄するか或いは重要視しないこによって行うことができる。例えば、繰り返されるショットは、それらが既に示されたショットに類似している場合には、含める必要はない(すなわち、繰り返される或いは共通のシーンのような重要でない情報は廃棄する)。
【0004】
【発明が解決しようとする課題】
ATT研究所のシャラレイ(Shahraray)らは、ビデオのHTML表現のためにキーフレームを使用することを研究している。彼らは、冗長さを減らすために、キーフレームの数を減らすことについて特別な考慮なしに各ショットから一つのキーフレームを抽出している。キーフレームは一様なサイズとされ、クローズドキャプションデータから抽出されたテキストと共にコラム内に単純にレイアウトされる。彼らの研究には、パックするための努力は組み込まれていない。
【0005】
タニグチ(Taniguchi)らは、パンして得られたビデオを合成することによって形成された大きな画像である「パノラマ」の2Dパッキングを使用してビデオを要約した。彼らの方法においては、キーフレームは、全てのショットから抽出され、ビデオの内容の2D表現のために使用された。フレームは、冗長さを減らす目的では選択されなかった。彼らのパッキング手順は、幾分か準最適であり、結果として生じる合成物に白い空間を残している。
【0006】
イェン(Yeung)らは、ビデオの各ショット毎に「ドミナンススコア(dominance score)」を使用してビデオの絵で表した要約を作成したが、このようなスコアをどのように実施するか、及び、それをどのように使用するかについての詳細は、アドホック(ad hoc)である。また絵で表した要約には、フレームの時間的な順序がしばしば無視されるポスター状の表現に関してのみ使用することが可能である特定された所定の構造が用いられている。
【0007】
ビデオの内容をブラウジングするための作られた幾つかの他のツールが公知であるが、不十分な要約を提供するだけであるか、或いは、単にビデオを「そのままの」シーケンスで表示するだけである。
【0008】
【課題を解決するための手段】
本発明者らは、ビデオ要約が生成される効率を高めるためには、ショット或いはセグメントの重要度の量的な測定が必要であるということを理解した。そのような量的な測定は、ビデオのどのショット或いはセグメントが最も意味があるかを決定するために使用することができる。また、本発明者らは、計算或いは数式によって客観的に決定され、これにより、ショット或いはセグメントの選択プロセスを自動化することができる場合には量的な測定が最良であることも理解した。
【0009】
これに加えて、本発明者らは、量的な測定は、最も重要なショット或いはセグメントのみを有するビデオ要約を生成するために使用することもでき、また、代表フレーム(キーフレームとしても参照される)のサイズを増やすか減らすかのいずれかによって、要約のどのショット或いはセグメントを強調する(より重要な情報(とする))か、或いは、重要視しない(より重要でない情報(とする))かを決定する際に使用することができるということも理解した。
【0010】
更に、本発明者らは、要約のために選択された、強調された及び重要視されなかったショット或いはセグメントの各々の効率的な2D表現のためのパッキング方法を決定した。このように、ショットの重要度が決定されると、二次元の静止表現は、重要度に相関的にサイズが決められた各々のショット或いはセグメントについて代表キーフレームを効率的にパックすることによって構成することができる。
【0011】
したがって、本発明の目的は、ビデオのショット或いはセグメントの重要度を決定する方法であって、ビデオを複数のショット或いは関連する複数のフレームにセグメント化するステップと、各々のショット或いはセグメントごとに重要度の量を計算するステップとを含む方法を提供することである。セグメント化するステップは、共通の属性及び合致基準或いはアルゴリズムの少なくとも一つに基づいて、ビデオのフレームをクラスタ化するステップも含む。
【0012】
本発明の別の目的は、ビデオを要約する方法であって、ビデオの構成要素のショットの重要度を決定するステップと、それらの重要度に基づいて要約で使用されるべき構成要素のショット或いはセグメントを選択して、選択された構成要素のショットから代表フレームを抽出するステップと、代表フレームをビデオ要約中に提示するステップとを含む方法を提供することである。提示するステップは、フレームが抽出されるショットの重要度と要約の表示のための所定の限定領域の空間の量とに基づいて各々の代表フレームのサイズを決定し、代表フレームを所定の限定領域にパックするステップとを含む。
【0013】
また本発明の目的は、フレームのシーケンスを限定領域にパックするための方法であって、フレームシーケンスを限定領域に適合させるステップと、限定領域ごとに最低コストを有するフレームシーケンスを選択するステップとを含む方法を提供することである。
【0014】
また本発明の目的は、ビデオ要約を見るためのインターフェースを提供することである。インターフェースは、要約の各々のフレームについてビデオの開始点或いは(開始)部分にリンクされた参照符号と共に印刷されたビデオ要約を有する紙、或いは、ビデオの一つ以上の開始点或いは(開始)部分に対応するリンクを備えたウェブベースのインターフェースとすることができるが、これらに限定されるものではない。
本発明の第1の態様は、ビデオのセグメント重要度を決定する方法であって、
ビデオを少なくとも一つの関連するフレームにセグメント化するステップと、
各々のセグメントごとに重要度の量を計算するステップと、を含む。
本発明の第2の態様は、第1の態様において、前記セグメント化するステップは、少なくとも一つのクラスタを作り出すために、共通の属性及び合致基準の少なくとも一つに基づいてビデオのフレームをクラスタ化するステップと、ビデオを同じクラスタのフレームのセグメントに分割するステップと、を含む。
本発明の第3の態様は、第2の態様において、前記クラスタ化するステップは、ビデオの各フレームを階層的なツリーの葉に配置するステップであって、ツリーのルートノードはビデオの全てのフレームを含む最大クラスタである該ステップと、前記階層的なツリーの中間ノードであるクラスタを生成するために、共通の属性及び合致基準の少なくとも一つに基づいて関連するフレームをショットに結合するステップと、を含む。
本発明の第4の態様は、第2の態様において、前記合致基準は、各構成要素のショット間の時間の近接度、空間の近接度、色の近接度、最小距離、カラーヒストグラム距離、及び、変換係数距離の少なくとも一つを評価するステップと、評価するステップの所定の閾値に合致する構成要素のショットを結合するステップと、を含む。
本発明の第5の態様は、第1の態様において、前記計算するステップは、各クラスタの重みを計算するステップと、各々のショットの特徴及びその対応するクラスタの重みに基づいてビデオの各々の個別のショットの重要度を決定するステップと、を含む。
本発明の第6の態様は、第5の態様において、前記各クラスタの重みを計算するステップは、以下の式を含む少なくとも1つの式に基づいてクラスタの重みを決定するステップを有する。
【数2】
ここで、Wiはクラスタiの計算された重みであり、Siはクラスタiの全てのショットの全体の長さであり、Cはビデオのクラスタの数である。
本発明の第7の態様は、第6の態様において、各クラスタ内の各ショットの重要度を決定する前記ステップは、以下の式を含む少なくとも1つの式に基づいて各ショットの重要度を計算するステップ、を含む。
【数3】
ここで、Ijはショットjの重要度、Ljはショットjの長さ、Wkはショットjが属するクラスタkの計算された重みである。
本発明の第8の態様は、ビデオの内容を要約する方法であって、ビデオの構成要素のショットの重要度を決定するステップと、構成要素のショットから代表フレームを選択するステップと、代表フレームが選択される構成要素のショットの重要度に基づいて要約中の選択された代表フレームを提示するステップと、を含むビデオのセグメント重要度を決定する方法である。
本発明の第9の態様は、第8の態様において、各々の個々のショットの特性と個々のショットを含むクラスタの重みに基づいてビデオの構成要素のショットに閾値処理を行うステップを更に含む。
本発明の第10の態様は、第9の態様において、前記閾値処理を行うステップが、いずれかの選択されなかったショットより高い重要度レベルを有するショットと、少なくとも所定の重要度の値を有するショットの所定の数の少なくとも一つを選択するステップと、全ての選択されなかったショットを廃棄するステップとを含む。
本発明の第11の態様は、第8の態様において、前記選択するステップは、 各々のショットの最初のフレーム、各々のショットを特徴付けるフレーム、各々のショットの全てのフレームの図心に最も近いフレーム、顔が存在するフレーム、動きの欠如及び徴候のいずれか一方を有するフレームの少なくとも一つを含む式に基づいて各々のショットから代表フレームを選択するステップ、を含む。
本発明の第12の態様は、第8の態様において、前記提示するステップは、各フレームの重要度及び要約の表示のための所定の限定領域内の空間の量に基づいて、各代表フレームのサイズを決定するステップと、代表フレームを所定の限定領域の中にパックするステップとを含む。
本発明の第13の態様は、第12の態様において、前記サイズを決めるステップは、代表フレームが選択される構成要素のショットの重要度に基づいて各々の代表フレームのサイズを決定するステップと、各フレームのサイズを前記要約の所定の限界領域の空き空間に適合するように調整するステップと、を含む。
本発明の第14の態様は、第8の態様において、前記要約は、前記要約のプリントアウトと、各々のコードがビデオの少なくとも一つの代表フレームに関連している少なくとも一つのコードのセットと、を含む紙インターフェースを含み、各々のコードがビデオのセグメント及び開始マーカの少なくとも一つへのインデックスを供給する。
本発明の第15の態様は、第8の態様において、前記要約は、前記要約の表示と、各々のリンクが選択された代表フレームの少なくとも一つに関連している少なくとも一つのリンクのセットと、を含むウェブインターフェースを含み、各々のリンクがビデオのセグメント及び開始マーカの少なくとも一つにアクセスする。
本発明の第16の態様は、フレームセットを限定領域にパックする方法であって、フレームシーケンスを限定領域に適合させるステップと、限定領域について最小のコストを有するフレームシーケンスを選択するステップと、を含む。
本発明の第17の態様は、第16の態様において、前記適合させるステップは、行高さのセットから行高さ(r)を割り当てるステップと、限定領域を高さ(r)を有する行に分割するステップと、行高さ(r)を有する限定領域に適合するフレームシーケンスを生成するステップと、前記行高さのセットの各々について、前記割り当てるステップ、前記分割するステップ、及び、前記生成するステップを繰り返すステップと、を含む。
本発明の第18の態様は、第17の態様において、前記適合させるステップは、各々の行高さ(r)について生成された最低コストのフレームシーケンスを低コストのシーケンスのセットに配置するステップを含み、前記選択するステップは、前記低コストのフレームシーケンスのセットから最低コストのフレームシーケンスを選択するステップを含む。
本発明の第19の態様は、第17の態様において、前記分割するステップは、限定領域を、前記フレームのセットの最小フレームの高さの倍数である行高さ(r)を有するグリッドに分割するステップを含む。
本発明の第20の態様は、第16の態様において、前記適合させるステップは、限定領域を少なくとも一つのグリッドのセットに分割するステップと、最低コストのフレームシーケンスを各々のグリッドに適合させるステップとを含み、前記選択するステップは、 各々のグリッドから最低コストのフレームシーケンスに基づいて限定領域のフレームシーケンスを選択するステップを含む。
本発明の第21の態様は、第20の態様において、最低コストのフレームシーケンスを適合させる前記ステップは、前記グリッドのセットのグリッドを選択するステップと、行高さのセットから選択されたグリッドの行高さ(r)を割り当てるステップと、行高さ(r)を備えた選択されたグリッドに適合するフレームシーケンスを生成するステップと、行高さ(r)を備えた選択されたグリッドについての最低コストを有する生成されたフレームシーケンスを低コストのフレームシーケンスのセットに配置するステップと、行高さのセットの各々の残りの行高さについて前記生成するステップ及び前記配置するステップを実行するステップと、低コストのフレームシーケンスのセットから最低コストのフレームシーケンスを選択するステップと、各々の残りのグリッドについて、前記割り当てるステップ、前記生成するステップ、前記配置するステップ、前記実行するステップ、及び、最低コストのフレームシーケンスを選択するステップを繰り返すステップと、を含む。
本発明の第22の態様は、第21の態様において、前記フレームシーケンスを生成するステップは、前記フレームのセットのフレームの数及び順序に一致する最低コストのフレームシーケンスにわたってフレームの数及び順序を維持するステップを含む。
本発明の第23の態様は、第21の態様において、前記生成するステップは、フレームが生成された順序と等価な前記フレームシーケンスのフレームの順序を維持するステップ、を含む。
本発明の第24の態様は、第21の態様において、前記生成するステップは、選択されたグリッドの行の白い空間の最初の白い空間に適合させるために各々のフレームのサイズを変えるステップ、を含む。
本発明の第25の態様は、第21の態様において、前記分割するステップは、限定領域をWのグリッド間隔を有する少なくとも一つのグリッドのセットに分割するステップを含み、 前記生成するステップは、選択されたグリッドのグリッド空間の白い空間の最初の白い空間に適合させるために各々のフレームのサイズを変えるステップを含む。
本発明の第26の態様は、第21の態様において、前記配置するステップは、以下の式を使用して、前記生成するステップによって生成された各々のシーケンスのコストd(q,b,e)を計算するステップを含む。
【数4】
ここで、
qはフレームシーケンス(qiはフレームシーケンスqのi番目の要素)、
bは開始フレーム、
eは終了フレーム、
jは要約マーカ、
cはコスト関数、
fはフレームサイズ、
wは重要度関数
である。
本発明の第27の態様は、第16の態様において、選択されたフレームシーケンスをウェブページに表示するステップと、選択されたフレームシーケンスの少なくとも一つのフレームを、リンクされたフレームに関連するビデオの表示及び他の情報の少なくとも一つの表示のために、セグメント、開始ポイント、及びメニューオプションの一つにリンクさせるステップと、を更に含む。
本発明の第28の態様は、第16の態様において、選択されたフレームシーケンスを、紙及び他の媒体の少なくとも一つを有するタブレットに転送するステップと、選択されたフレームシーケンスの少なくとも一つのフレームを、リンクされたフレームに関連するコード参照情報にリンクさせるステップと、を更に含む。
【0015】
本発明の一層完全な理解及び本発明に付随する利点が容易に得られるように、添付の図面と関連して本発明を考察する際に、以下の詳細な説明を参照することによって一層良く理解される。
【0016】
【発明の実施の形態】
本発明は、ショット或いはセグメントの重要度の測定を提示する。直接の用途は、重要なショット或いはセグメントからのキーフレームは印刷されるが、重要でないものは印刷されないビデオ要約を印刷することである。本実施態様においては、重要でないキーフレームは、小さなサイズで印刷され、「コミックブック」或いは「マンガ」レイアウトになる。新規の方法は、異なったサイズにされたキーフレームを効率的にパックするために提示される。
【0017】
一般的には、カットに対応する大きなフレーム差、或いは、ショット境界を見つけることによって、自動的にビデオをその構成要素のショットにセグメント化するための多くの技術が存在する。検出されると、類似のショット(例えば、類似のカメラアングル或いは対象物)が一つのショット或いはクラスタであると見做せるように、類似性によってショットをクラスタ化することができる。例えば、カメラが二人の俳優の間を繰り返し交互に行き来するフィルムダイアログは、一般的には、各俳優について一つである二つのクラスタから成る。
【0018】
セグメント化されると、ショットは類似性によってクラスタ化することができる。ビデオをショットに予めセグメント化することなく、クラスタを決定することもできる。ここで使用された方法は、最初にビデオの各々のフレーム(或いは、サブサンプルされた表現)が独自のクラスタに割り当てられる階層的なクラスタ化である。クラスタの数は、二つのクラスタメンバフレームの全ての組み合わせの間の最小距離に基づいて、各々のステップにおいて二つの最も近いクラスタを相互に併合することによって減少する。フレーム間の距離を比較するために、カラーヒストグラム距離或いは変換係数距離のような多数の技術が利用可能である。階層的クラスタ化により、個々のフレームがツリーの葉の上にあるようなツリー構造とされた表現になる。
【0019】
ツリーのルートノードは全てのフレームから成る最大クラスタである。各々のノードの子は、ノードを形成するために併合されるサブクラスタであり、葉に至るまで細かくなる。併合されたクラスタ間の距離が各々のノードと共に格納される場合には、閾値処理によってクラスタ化の所望の数を選択するためにその距離を使用することができる。それ以下ではフレームが同じクラスタの中にあると見做される閾距離を設定することにより、一つ(ツリーのルート)と多数のフレーム(ツリーの葉)との間で数を調整することができる。
【0020】
クラスタの最適数は、ビデオのタイプ及び長さに依存する。クラスタが選択されると、各々のフレームにはその対応するクラスタのラベルが付けられる。セグメント或いはショットは、同じクラスタ内のフレームのシーケンスによって規定される。ビデオにC個のクラスタがあり、正規化されたクラスタ重みの測定値がクラスタiについてWiであるとすると、以下のように計算される。
【数5】
ここで、Siは、クラスタ内の全てのショット或いはセグメントの長さを合計することによって求められた、クラスタi内の全てのショット或いはセグメントの長さの合計である。Wiは、クラスタi内にあるビデオ全体に対するショット或いはセグメントの割合である。
【0021】
ショット或いはセグメントは、それが長く且つ稀である場合には、すなわち、それが大部分の他のショット或いはセグメントに似ていない場合には重要である。このようにショット或いはセグメントの長さをクラスタ重みの逆数で重み付けすることにより、ショット或いはセグメントの重要度の測定値が生じる。このように(クラスタkにおける)ショットjの重要度Iは、以下の通りである。
【数6】
ここで、Ljは、ショットjの長さである。
【0022】
重要度の測定値は、ショットが長い場合には大きくなり、クラスタ重みが大きい場合(ショットが一般的であることを意味する)には小さくなる。また重要度は、カラーヒストグラムの差、画素差、或いは、変換係数差として計算されたショットを開始する変化の大きさのような他の要因によっても重み付けされる。これにより、先行するショットから大きく異なっていない場合には、ショットの重要度は減少する。
【0023】
対数関数の中の定数1は、ショット長とクラスタ重みとの間のトレードオフを制御するための重み付け係数αで置き換えることができる。
【数7】
【0024】
αの値が大きいと、クラスタ重みが重要度にあまり寄与しないことを意味し、αを小さくすることは、重要度の測定値に対するクラスタ重みの寄与を増やすことである。或るショットカテゴリーを優先的に重み付けすることがしばしば必要である。例えば人物のクローズアップは、ワイドの群衆ショットよりも優先されるかもしれない。重要度の重みは、増幅係数を含ませることによって、これを反映させるために修正することができる。
【数8】
【0025】
Atは、カテゴリーtについての所定の増幅因子である(例えば、カテゴリーtは、一層優位に重み付けされるクローズアップ、或いは、一層少なく重み付けされる群衆シーン或いはモーションとすることができる)。Pt(Sj)は、ショットSjがカテゴリーtに属する確率の推定値である。式(3)及び式(4)は、以下の式(5)に示されるように、ショット長と個々のクラスタの両方の重み付けができるように、結合することができる。
【数9】
【0026】
幾つかの図面にわたって同様な参照番号が同一或いは対応する部分を示す図面、特にその図1をここで参照すると、ビデオクリップのセグメントについての計算された重要度の値を表すグラフが例示されている。ビデオクリップは、階層的クラスタ化によって、各々がグラフ上のポイントによって表される69個のセグメント或いはショットに分割された。各々のポイントについての重要度の値は、殆ど無視できるもの(例えば、ポイント24)から約0.3(ポイント18参照)の高さであるものまである。
【0027】
各々のショットについての重要度が計算されると、ビデオの要約を作り出すことができる。構成されると、代表的な静止フレーム或いはキーフレームは、各々のショットに関連する。これは、例えば、ショットの最初のフレームを抽出することによって、或いは、更に洗練された方法では、ショットの特徴を最も良く表しているフレームを見つけることによって行うことができる。例えば、最良の選択は、(上述したようなクラスタ化における距離計量を使用して)全てのショットフレームの図心に最も近いフレームとすることができる。代表的なフレームを選択するために多数の基準、例えば、顔検出器による顔の存在、動きの欠如、或いは、他の理由が利用可能である。
【0028】
ショットに重要度のラベルが付されるときには、重要度の値は、ショットの所望の数、したがって、要約についてのキーフレームを選択するための閾値に従うことができる。フレームが選択されると、ビデオシーケンスの絵で表されたアブストラクトを形成するために、フレームを一次元以上の次元にレイアウトすることができる。「コミックブック」フォーマットのような印刷された概要のためには、二次元が最も適切であろう。連続的な表現或いはオーバーレイ特性を組み込んだ他のフォーマットも同様に使用することができる。
【0029】
重要度のスコアに閾値処理を行うことにより、表示すべきフレームの所望の数を適切なレベルにすることができる。レイアウトを容易にするために、フレームは、おそらくそれらの重要度のスコアに依存して、より小さな或いはより大きなサイズで表示することができる。例えば、これにより、図2Aに示されるような結果となる。「主要な」ショットI及びJ(それらは高い重要度のスコアを有するので主要である)は、フルサイズのフレームによって表される。ショットK及びLはセクションを共有しなければならないが、これはそれらが重要でない場合には不合理ではない。
【0030】
閾値処理を行うプロセス自体は、異なった方法で実行することができる。例えば、重要度の値は、0.15以上を選択することができ、少なくとも0.15のスコアをもつセグメントが、要約のために選択される。別の方法として、ショットの最適数を、例えば4に決定することができ、四つのみのセグメントが残るまで閾値レベルを高くする(本質的に四つの最も高いスコアのセグメントを選択する)。
【0031】
これらの技術を図1のチャートに適用すると、閾値を0.15にするとビデオ要約のために単一セグメントが選択されることになる。この別の方法の技術を使用すると、要約のレイアウトのために四つのフレーム(キーフレーム)が残すために、閾値は約0.12に下げられる。
【0032】
またフレームサイズも重要度のスコアに閾値処理を行うことによって選択される。例えば、三つのフレームサイズが指定されたと仮定する。重要度のスコアが閾値よりも大きく最大スコアまでの距離の1/3より小さい場合には、最小サイズのキーフレームが使用される。最大スコアまでの距離の1/3より大きく最大スコアまでの距離の2/3より小さいセグメントについては、最小のサイズの2倍のサイズのキーフレームが選択される。最大スコアと最大スコアまでの距離の2/3との間のセグメントは最大サイズのキーフレームを使用する。
【0033】
適切な制約条件が与えられると、異なったサイズとされたキーフレームシーケンスは、ユーザの介入なしに合理的なページ(或いは、他の)レイアウトに変えることができるので、レイアウトプロセスは自動化することができる。理想的には、ユーザは、ページの数、ページ当たりのセクションの数、及び、キーフレームサイズの許容範囲のような少数のパラメータを指定することだけが必要となる。上記の例においては(図2A)、二つのキーフレームサイズのみの範囲であるが、他のパラメータの指定も勿論可能である。
【0034】
したがって、図3に示されるように全体のプロセスを例示することができる。ビデオをフレーム315に分割するためにビデオ300が分割器310に供給される。フレーム315は、セグメント1…n 325を作り出すための上述されたプロセス(クラスタ化、階層ツリー等)のいずれかを使用することができるセグメンタ320に供給される(別の方法として、ビデオ300は、構成要素のショットに分割され、次いで、セグメンター320に供給され、或いは、ビデオ300は、セグメンター320に直接供給される)。次いで、セグメント或いはショットは、各々のセグメント或いはショットごとに重要度の量を計算する重要度計算機330に供給される。次いで、セレクタ340は、各々のセグメント或いはショットから代表フレームを選択する。代表フレームが選択されると、パッキング装置350は、ディスプレイ/インターフェース355のために重要度に従ってフレームサイズを変えて効率的な配置にパックする。
【0035】
フレームをショットから選択することが可能であるとすると、空間を効率的に埋め、且つ、元のビデオシーケンスを良好に表すフレームサイズのシーケンスを見つけるというレイアウト問題が減る。一致の程度を規定するために適切なコスト関数を使用することができる。しかしながら、空間のサイズに従ってあり得るシーケンスの数は非常に大きく増加するので、最適なシーケンスを見つけることは困難である。
【0036】
最適な或いは最適に近いレイアウトを見つけるために、ダイナミックプログラミング(DP)及びグリーディ(greedy)アルゴリズムのような既存の技術を使用することができる。ダイナミックプロセッシングは、この種の問題についての最適解を見つけることが保証されているが、多大な努力と面倒な調整が必要である。グリーディアルゴリズムは、比較的簡単であるが、合理的な結果を作り出すのに失敗することがある。新規のパッキング方法がここで紹介される。それはDPよりも適用するのが簡単であり、純粋なグリーディストラテギー(strategy)よりも良好な解を供給する。
【0037】
この方法は、全体の空間の特定の「ブロック」或いはサブ領域をパックするためのフレームの最良のシーケンスを選択するので「ブロック網羅型(exhaustive)」して説明される。最良のシーケンスは、特定のブロックについてレイアウトの全ての組み合わせを探索することによって見つけられる。ブロックは、比較的少ないので、これは組み合わせは爆発せず(即ち、組み合わせの数が処理限界を超えることなく)、したがって、最適なレイアウトが単純なツリー探索を含む簡単な技術で見つけられる。
【0038】
パックされるべき空間は、グリッドの一つのユニットが最小のフレームサイズを保持するように、グリッドに分割される。これは、フレームを以下のようにレイアウトするために使用される。すなわち、一つの「行ブロック」或いはグリッドを横切る列の行が一度にパックされる。ブロックごとの一致スコアは、その高さに応じて変化する。特定のブロックごとの高さは、パッキングスコアによって決定されたような最良のパッキングを作り出す。行ブロックがフレームにパックされると、全てのフレームがパックされるまで、更なる行ブロックが相互に考慮される。
【0039】
以下のように仮定する。
・最小フレームサイズの倍数として表されたフレームサイズ(本実施態様においては、これは上記のようなショット重要度スコアから決定されるが、任意のサイズの割り当てを使用することができる)f1,f2,…,fNのシーケンスfiは、K値(s1,s2,…,sK)の一つを採る。
・M値(r1,r2,…,rM)として、ブロック行高さの許容可能な範囲を選択する。例えば、最小フレームサイズの2或いは3 倍の行高さが許容可能である場合には、M=2,r1=2,r2=3である。ブロック幅を固定された値wに設定する。
・フレームxを利用可能な残りの空間yに配置するコストである関数c(x,y)。一般的なコスト関数は、xとyのサイズ差とすることができる。例えば、フレームを2x2のサイズから1 x1のセルに適合させるために縮小する必要がある場合には、コストは1である。サイズ変更を行わない場合はコストはゼロである。コスト関数は、実際の領域差を反映するために二次にすることができ、或いは、あらゆる任意のコスト関数も使用可能である。
・空間埋め規則。一般的な規則は、列重視、すなわち、上から下、そして、左から右である。これは、フレームが優先的にパックされる順序である。図2Bに示される例は、最大ブロック高さが3であり、ブロック幅が8であるときの一般的な場合を示す。
【0040】
上記のように仮定すると、パッキング方法は、一つの行ブロックについてパッキングを最適化する三つの入れ子になったループから成る。外側ループは、全ての可能性のある行高さ(r1,r2,…,rM)にわたっている。中間ループは、行ブロックを合致するできるだけ多くのフレームにパックして、シーケンスを作る。内側ループは、全ての行高さr,可能性のあるフレームシーケンスi及びjについて、コストを累計する。これらのプロセスは、以下にステップ1〜7で説明される。
1.開始フレームsを1に設定する。
2.行高さrをM値(r1,r2,...,rM)の一つに設定する。
3.「行ブロック」に合致する全てのフレームシーケンス{q1,q2,...,qLr}を。見つける。
4.上記のシーケンスから、sとs+n1の間の元のシーケンスの一部分に合致する長さn1のシーケンスq1を見つける。ここで、
【数10】
fiは、元のシーケンスのi番目のフレームサイズを示す。qijは、シーケンスqiのj番目の要素である。wiは、付加的な重み付け係数である。
5.最良の行高さr及び長さnの対応するシーケンスqを見つけるために2及び3を繰り返す。これはこの行ブロックについての最適パッキングである。
6.sをnだけ増やす。
7.sが元のシーケンスの長さであるNに達するまで2から6を繰り返す(全てのフレームがパックされる)。
【0041】
上記のステップ2は、1)j番目の要素がK値(s1,s2,…、sK)の一つである1からrxWの長さの全てのシーケンスを網羅的に生成し、そして、2)「行ブロック」に合致しない全ての生成シーケンスを除去することによって行われる。例えば、
1)ブロック高さが2である場合には、3要素を含むシーケンスは合致せず、2)ブロック幅Wが8であり、最大行高さが3である場合には、3より長い全ての3sのシーケンスは合致しない。
考慮すべき可能性のある(rxW)Kシーケンスがあるけれども、r、W、及びKは非常に小さいので、効率は大きな問題ではない。
【0042】
図4は、上述したプロセスのフロー例を示すフローチャートである。図4 は、外側ループ405/445の初期変数を設定して、ブロックに合致させるべきフレームの開始位置を維持するステップ400を含む。内側ループ410/430は、各々の可能性のある行ブロック高さごとにフレームシーケンスを生成し、コストアルゴリズムd(qi,s,s+ni-1)は、各々の行ブロックを合致させるためのコストを決定するために使用される。各々の行高さについて最小シーケンスを決定した後に、行ブロック全体についての最小が選択され、プロセスは繰り返す。
【0043】
繰り返しプロセスは、以前の最小行ブロックに合致する最後のフレームの後のフレームから始まる。全てのフレームがパックされた後に、ステップ450でプロセスが完了する。表1は、図4のフローチャートで使用された用語を示す。
【表1】
【0044】
この「行ブロック」パッキング手続きの結果の例が図5に図示される。図の上部における矩形1a〜5aは、重要度によってサイズが変えられた元のフレームシーケンスを示す。図の下部は、高さが3で幅が8の行ブロックにパックされたフレームを示す(ここでは、矩形1b〜5bとして図示される)。フレーム5bのサイズは、最小の白空間でより良好なパッキングを行うために(影が付された矩形で示された)元のものより拡大される。
【0045】
【実施例】
本発明者らは、ビデオテープに記録されたスタッフミーティングに対して上述された方法をテストした。ビデオは、約50分の長さで、実際のカメラ切り換えの間をカウントすると、49個の実際のショットから成る。15秒毎にビデオから静止フレームが抽出され、計量距離として、高分散DCT係数のユークリッド距離を使用して、51個のクラスタにクラスタ化された。時折、同じショットからのフレームが、カメラの移動や室内光の変化のような大きな変化のために、異なったクラスタに分割された。結果として、ビデオ全体は、92個のセグメントに分割された。上述したように、各々のセグメントについて、重要度の測定値が、その長さ及びクラスタ重みに基づいて計算された。
【0046】
静止概要を生成するために、高い重要度スコアを有するビデオセグメントが選択された。(式2の重み付けしない計算を使用して)最大スコアの8分の1より高いスコアを有するセグメントが選択された。減らされたDCT係数のユークリッド距離を再度使用して、選択された各々のセグメント毎に、セグメント平均に最も近いフレームが代表フレームとして抽出された。フレームは、それらの元のセグメントの重要度の測定値に従ってサイズが決定されるので、高い重要度のフレームは大きかった。
【0047】
現在の実施態様においては、所与のフレームの重要度が最大の8分の1と4分の1の間であった場合には、最小フレームサイズが割り当てられる。最大の4分の1より大きく半分より小さいスコアのフレームは、最小サイズの2倍のサイズにされ、2分の1より大きいスコアのフレームは、最小サイズの3倍の大きさのサイズにされた。概略のフレームサイズのパーセンテージは、経験的に決定される閾値によって設定することができる。例えば、全ての表示されたフレームの半分が最大サイズであることが望まれる場合には、上側閾値は、(幾つかのフレームはパッキング方法によってサイズが変更されることになるが)累計重要度スコアから決定することができる。
【0048】
フレームサイズを割り当てた後に、冗長なフレームを更に除去するために、以下の二つの手続きが適用される。二つの手続きは、除去がなくなるまで繰り返して適用される。
【0049】
[トリミング分岐]
2つの連続するフレームが同じクラスタからのものである場合には、より小さなフレームが除去される。両方のフレームが同じサイズを有する場合には、後に現れるフレームが除去され、先に現れるフレームが拡大される。
【0050】
[孤立部の除去]
各々1フレームだけ離れた同じクラスタからの三つのフレームが見つかった場合には、中間のフレームが最小のフレームであり、中間のフレームが除去される。
【0051】
我々のサンプルビデオの場合には、サイズ1,2,3の抽出されたフレームの数は、それぞれ、9個,13個,2個であった。我々は重要度スコアに対して簡単なフレームサイズの割り当てを選択したが、連続可変サイズを含む多くの他の割り当てが可能である。異なったサイズとされたフレームが、前述された方法を使用してパックされた。結果は図6に示されており、このパッキングについては、24個のフレームの中の6個のみがサイズの調整が必要であった。上記の要約は、テキスト注釈、タイトル、或いは、フレームと一緒にトランスクリプション(transcription)を表示することのような、任意の数の方法で強化することができる。テキストは、見だし或いは台詞の吹き出しとして各々のフレームにスーパーインポーズして表示することができる。フレームは、例えば、色が付いた境界を使用して、特別な時間或いはインデックスマークを示すために、ハイライトすることができる。フレームは、例えば、弱いコントラスト(退色した)或いは色(グレイスケール)で表示することにより、重要度或いは他のスコアによって、重要視しない様にすることができる。
【0052】
[ビデオの紙インターフェース]
上述された方法は、紙ユーザインターフェースを使用するビデオデータベースシステムに容易に適用することができる。ビデオデータベースの各々のビデオは、説明された方法を使用して要約され、元のビデオを示すコード化された情報と共に印刷される。図7は、各々の印刷されたフレーム(例えば、610)、及び対応するコード化された情報615についての紙インターフェースを例示する。
【0053】
情報は、テキスト、グリフ(gryph)コード或いはバーコードを含む多くの方法のいずれかを使用してコード化することができる。また、要約のフレームは、フレームによって表されたショットの開始時間を示すタイムコードでラベルをつけることができる。各々のフレームについてのタイムコードは、各フレームの下方、或いは、実際のフレーム画像の中にコード化されて、対応するどこにでも配置することができ,或いは、呼び出し或いは図形的な指示を有することもできることは明らかである。
【0054】
図8は、システムの一般的な実施態様を例示する。基本的な構成要素は、ハンドヘルドグリフスキャナ700、グリフデコードユニット710及びビデオ記録装置720及び再生装置730である。ユーザは、紙要約に印刷されたグリフコードを走査することによって所望のビデオを選択する。次いで、そのビデオからの特定のショットは、代表フレームに添付されたグリフを走査することによって選択することができる。別方として、グリフは、ビデオとショットの両方をコード化することができる。デコーダは、走査されたグラフコードをデコードし、デコーダからの出力はビデオデータベースに送られ、ビデオが検索されて指定された位置から再生される。ビデオは、選択されたキーフレームが提示しているセグメントの最初から始めることができ、或いは、選択された代表フレームが抽出されたポイントにおいて始めることができる。他の印刷されたグリフは、例えば、音量或いは再生のような他の表現態様を制御することができる。
【0055】
ビデオは、ショット重要度の測定値を強調するために再生のしながら修正することができる。例えば、音量を下げたり再生速度を上げたりすることによって、より重要でないショットを重要視しないようにすることができる。特定の閾値より重要度の低いショットは全体的にスキップすることができ、要約或いは「ビデオスキム」になる。複数のフレーム及びそれらの対応するショットは、個人的なビデオ要約を生成するためにユーザによって選択することができる。この動作のために、ユーザは、フレームを選択する前後に専用のコードを走査しなければならないかもしれない。この手順は、システムのボタンを押すことによって置き換えることができる。スキャナがハンドヘルドであることは必須ではなく、代わりにフラットベッドスキャナを使用することができる。その場合には、グリフコードの代わりにチェックボックスをフレームに添付することができ、ユーザは、一つ以上のチェックボックスをマーキングすることによってショットを特定することになる。(例図7)
【0056】
[ウェブベースのインターフェース]
紙に加えて、上記の機能の多くはウェブベースのビデオユーザインターフェースのために使用することができる。ビデオ要約は前記の通り構成することができるが、紙よりはむしろハイパーテキストの形態で表現される。ユーザは、列記されたビデオの名称或いは機能的に等価な表現をクリックすることによってビデオ要約を生成することができる。要約におけるフレームのサイズ及び数のような種々のパラメータは、要求に応じて指定することができる。生成された要約は、ウェブブラウザでの表示のためにクライアントに送り返され、或いは、紙の形態で印刷される。これは少なくとも二つの方法で行うことができる。一つの方法は、サーバにおいて完全なビットマップとされた画像を生成して、それをクライアントに送ることである。別の方法は、サーバから画像ファイルとレイアウト情報を送って、クライアントに要約を組み立てさせることである。
【0057】
またサーバは、開始時間及び期間、キーフレームインデックス、及び、レイアウト情報のような全ての適切なショット情報を含むテーブルを生成することもできる。このテーブルは、サーバ側或いはクライアント側のどちらでも保持することができる。要約上でマウスクリックが検出されたときには、クリック位置をテーブルを介してマッピングすることによって指定されたビデオ及びショットを決定することができる。次いで、開始時間を決定することができ、ビデオプレイヤを起動するために使用することができる。このように、ユーザは、要約を見ることによってビデオの内容を通してスキミングし、クリックされたフレームに対応するビデオの位置或いはセグメントから再生されるべきビデオについてのトリガである要約中の任意のフレームをクリックすることによって詳細に入り始める(即ち、詳細を見る)ことができる。
【0058】
前述の紙インターフェースと同様な外見を有するウェブインターフェースの例が図9に示される。
【0059】
本発明は、コンピュータ技術分野の当業者にとって明らかであるように、本開示の教示に従ってプログラムされた従来の汎用或いは専用デジタルコンピュータ或いはマイクロプロセッサを使用して簡便に実施することができる。
【0060】
適切なソフトウェアコーディングは、ソフトウェア技術分野の当業者にとって明らかであるように、本開示の教示に基づいて、熟練したプログラマによって容易に用意することができる。また本発明は、当業者にとって容易に明らかであるように、用途特定集積回路の用意によって、或いは、従来の構成要素回路の適切なネットワークの相互接続によって、実施することもできる。
【0061】
本発明は、本発明のプロセスのいずれかを実行するようにコンピュータをプログラムするために使用することができる、その内部に格納された命令を有する一つの(或いは複数の)記憶媒体であるコンピュータプログラム製品を含む。蓄積媒体は、フロッピディスク、光ディスク、DVD、CD−ROM、マイクロドライブ、及び光磁気ディスクを含む任意のタイプのディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリ装置、磁気或いは光カード、(分子(molecular)ICを含む)ナノシステム、或いは、命令及び/又はデータを格納するのに適した任意のタイプの媒体或いはデバイスを含むことができるが、これらに限定されるものではない。
【0062】
本発明は、コンピュータが読み取り可能な一つの(或いは複数の)媒体のいずれか一つに格納されて、汎用/専用コンピュータ或いはマイクロプロセッサのハードウェアの両方を制御するための、また、コンピュータあるいはマイクロプロセッサが、本発明の結果を使用して、人間であるユーザ或いは他のメカニズムと相互作用できるようにようにするためのソフトウェアを含む。そのようなソフトウェアは、デバイスドライバ、オペレイティングシステム、及び、ユーザアプリケーションを含むことができるが、これらに限定されるものではない。最後に、そのようなコンピュータが読み取り可能な媒体は、更に、上述したように、本発明を実行するためのソフトウェアを含む。
【0063】
汎用/専用コンピュータ或いはマイクロプロセッサのプログラミング(ソフトウェア)に含まれるのは、ビデオのセグメント化、ショットの重要度の計算、クラスタ化、パッキング、及び、本発明のプロセスに従った結果の表示、記憶、或いは、通信を含む本発明の教示を実施するためのソフトウェアモジュールであるが、これに限定されるものではない。
【0064】
明らかに、本発明の修正及び変形が上記の教示を考慮して可能である。したがって、それは添付の特許請求の範囲内であることが理解されるべきであり、本発明は、ここに特に説明されたものとはべつのもので実施することができる。
【図面の簡単な説明】
【図1】 ビデオ提示における各々のセグメント或いはショットごとの重要度計算のグラフである。
【図2】 (A)は重要度に基づいてサイズが決定されパックされたフレームを示し、(B)はパッキングのための行ブロックの例を示す。
【図3】 セグメント化、クラスタ化、及びパッキング装置のブロック図である。
【図4】 パッキングプロセスを説明するフローチャートである。
【図5】 白空間を最小化するための再サイズ決定によるパックされたフレームシーケンスの例示である。
【図6】 重要度に基づいたパッキングから得られるビデオ要約製品である。
【図7】 本発明に従ってレイアウトされたビデオフレームの紙要約である。
【図8】 ビデオ紙要約を使用するための装置レイアウトの例示である。
【図9】 本発明に従ったビデオ要約ウェブインターフェースの例示である。
【符号の説明】
300 ビデオ
310 分割器
320 セグメンター
300 重要度計算機
340 セレクタ
350 パッキング装置
355 表示/インターフェース
Claims (1)
- ビデオの内容を要約する方法であって、
複数のフレームのシーケンスからなるビデオを少なくとも一つのフレームを含むセグメントにセグメント化するステップと、
各々のセグメントごとに重要度を計算するステップと、
セグメントの重要度に基づいて重要なセグメントを決定するステップと、
重要なセグメントから代表フレームを選択するステップと、
重要なセグメントの重要度に基づく代表フレームの重要度及び要約の表示のための所定の限定領域の空き領域のサイズに基づいて、各代表フレームのサイズを決定するステップと、
代表フレームのシーケンスを当該シーケンスに対応した並びを維持した状態で前記所定の限定領域の中にパックするステップと、
パックされた限定領域の内容を要約として表示するステップと、
を含み、
さらに、前記セグメントの関連するセグメントをクラスタにクラスタ化するステップを含み、
前記計算するステップは、
クラスタ内にある全てのセグメントのビデオ全体に対する割合を示すクラスタの重みをクラスタの各々について計算するステップと、
各々のセグメントの長さに比例し、該セグメントに対応するクラスタの重みの対数に反比例するように、ビデオの各々の個別のセグメントの重要度を決定するステップと、
を含む、
ビデオの内容を要約する方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US09/267,529 US6535639B1 (en) | 1999-03-12 | 1999-03-12 | Automatic video summarization using a measure of shot importance and a frame-packing method |
| US267529 | 1999-03-12 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007074829A Division JP4321613B2 (ja) | 1999-03-12 | 2007-03-22 | ビデオの内容を要約する方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000308008A JP2000308008A (ja) | 2000-11-02 |
| JP3968942B2 true JP3968942B2 (ja) | 2007-08-29 |
Family
ID=23019167
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2000064869A Expired - Fee Related JP3968942B2 (ja) | 1999-03-12 | 2000-03-09 | ビデオの内容を要約する方法 |
| JP2007074829A Expired - Lifetime JP4321613B2 (ja) | 1999-03-12 | 2007-03-22 | ビデオの内容を要約する方法 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007074829A Expired - Lifetime JP4321613B2 (ja) | 1999-03-12 | 2007-03-22 | ビデオの内容を要約する方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US6535639B1 (ja) |
| JP (2) | JP3968942B2 (ja) |
Families Citing this family (200)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7596755B2 (en) | 1997-12-22 | 2009-09-29 | Ricoh Company, Ltd. | Multimedia visualization and integration environment |
| US7954056B2 (en) * | 1997-12-22 | 2011-05-31 | Ricoh Company, Ltd. | Television-based visualization and navigation interface |
| US7134074B2 (en) * | 1998-12-25 | 2006-11-07 | Matsushita Electric Industrial Co., Ltd. | Data processing method and storage medium, and program for causing computer to execute the data processing method |
| US6236395B1 (en) * | 1999-02-01 | 2001-05-22 | Sharp Laboratories Of America, Inc. | Audiovisual information management system |
| WO2001003429A2 (en) * | 1999-07-06 | 2001-01-11 | Koninklijke Philips Electronics N.V. | Automatic extraction method of the structure of a video sequence |
| US7293280B1 (en) | 1999-07-08 | 2007-11-06 | Microsoft Corporation | Skimming continuous multimedia content |
| US7313808B1 (en) | 1999-07-08 | 2007-12-25 | Microsoft Corporation | Browsing continuous multimedia content |
| US7509580B2 (en) * | 1999-09-16 | 2009-03-24 | Sharp Laboratories Of America, Inc. | Audiovisual information management system with preferences descriptions |
| US6677961B1 (en) * | 1999-09-24 | 2004-01-13 | Lg Electronics, Inc. | Method and apparatus for identifying a predetermined number of representative data pieces from within a selected data segment |
| WO2001028238A2 (en) * | 1999-10-08 | 2001-04-19 | Sarnoff Corporation | Method and apparatus for enhancing and indexing video and audio signals |
| US7020351B1 (en) * | 1999-10-08 | 2006-03-28 | Sarnoff Corporation | Method and apparatus for enhancing and indexing video and audio signals |
| US6976032B1 (en) * | 1999-11-17 | 2005-12-13 | Ricoh Company, Ltd. | Networked peripheral for visitor greeting, identification, biographical lookup and tracking |
| US7653925B2 (en) * | 1999-11-17 | 2010-01-26 | Ricoh Company, Ltd. | Techniques for receiving information during multimedia presentations and communicating the information |
| US7299405B1 (en) | 2000-03-08 | 2007-11-20 | Ricoh Company, Ltd. | Method and system for information management to facilitate the exchange of ideas during a collaborative effort |
| US7016540B1 (en) * | 1999-11-24 | 2006-03-21 | Nec Corporation | Method and system for segmentation, classification, and summarization of video images |
| KR100371513B1 (ko) * | 1999-12-06 | 2003-02-07 | 주식회사 팬택앤큐리텔 | 계층적 동영상 트리구조에서의 에지에 저장하는 키프레임의 충실도를 이용한 효율적인 동영상 요약 및 브라우징 장치 및 방법 |
| US7286724B2 (en) * | 1999-12-06 | 2007-10-23 | Hyundai Curitel, Inc. | Method and apparatus for searching, browsing and summarizing moving image data using fidelity for tree-structure moving image hierarchy |
| AUPQ464099A0 (en) * | 1999-12-14 | 2000-01-13 | Canon Kabushiki Kaisha | Emotive editing system |
| US6868440B1 (en) * | 2000-02-04 | 2005-03-15 | Microsoft Corporation | Multi-level skimming of multimedia content using playlists |
| JP3810268B2 (ja) * | 2000-04-07 | 2006-08-16 | シャープ株式会社 | オーディオビジュアルシステム |
| US8028314B1 (en) | 2000-05-26 | 2011-09-27 | Sharp Laboratories Of America, Inc. | Audiovisual information management system |
| US7051271B1 (en) * | 2000-05-31 | 2006-05-23 | Fuji Xerox Co., Ltd. | Method, system and article of manufacture for linking a video to a scanned document |
| US6697523B1 (en) * | 2000-08-09 | 2004-02-24 | Mitsubishi Electric Research Laboratories, Inc. | Method for summarizing a video using motion and color descriptors |
| US8020183B2 (en) * | 2000-09-14 | 2011-09-13 | Sharp Laboratories Of America, Inc. | Audiovisual management system |
| US7253919B2 (en) * | 2000-11-30 | 2007-08-07 | Ricoh Co., Ltd. | Printer with embedded retrieval and publishing interface |
| US20020083471A1 (en) * | 2000-12-21 | 2002-06-27 | Philips Electronics North America Corporation | System and method for providing a multimedia summary of a video program |
| GB2372658A (en) * | 2001-02-23 | 2002-08-28 | Hewlett Packard Co | A method of creating moving video data from a static image |
| US20030061610A1 (en) * | 2001-03-27 | 2003-03-27 | Errico James H. | Audiovisual management system |
| US6907570B2 (en) * | 2001-03-29 | 2005-06-14 | International Business Machines Corporation | Video and multimedia browsing while switching between views |
| US7904814B2 (en) * | 2001-04-19 | 2011-03-08 | Sharp Laboratories Of America, Inc. | System for presenting audio-video content |
| US8479238B2 (en) | 2001-05-14 | 2013-07-02 | At&T Intellectual Property Ii, L.P. | Method for content-based non-linear control of multimedia playback |
| FR2825814B1 (fr) * | 2001-06-07 | 2003-09-19 | Commissariat Energie Atomique | Procede de creation automatique d'une base de donnees images interrogeable par son contenu semantique |
| JP4546682B2 (ja) * | 2001-06-26 | 2010-09-15 | パイオニア株式会社 | 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム |
| US20030121040A1 (en) * | 2001-07-02 | 2003-06-26 | Ferman A. Mufit | Audiovisual management system |
| US7296231B2 (en) * | 2001-08-09 | 2007-11-13 | Eastman Kodak Company | Video structuring by probabilistic merging of video segments |
| KR20030026529A (ko) * | 2001-09-26 | 2003-04-03 | 엘지전자 주식회사 | 키프레임 기반 비디오 요약 시스템 |
| US7474698B2 (en) * | 2001-10-19 | 2009-01-06 | Sharp Laboratories Of America, Inc. | Identification of replay segments |
| US7203380B2 (en) * | 2001-11-16 | 2007-04-10 | Fuji Xerox Co., Ltd. | Video production and compaction with collage picture frame user interface |
| US7149957B2 (en) | 2001-11-19 | 2006-12-12 | Ricoh Company, Ltd. | Techniques for retrieving multimedia information using a paper-based interface |
| US7495795B2 (en) | 2002-02-21 | 2009-02-24 | Ricoh Company, Ltd. | Interface for printing multimedia information |
| US8539344B2 (en) * | 2001-11-19 | 2013-09-17 | Ricoh Company, Ltd. | Paper-based interface for multimedia information stored by multiple multimedia documents |
| US7861169B2 (en) * | 2001-11-19 | 2010-12-28 | Ricoh Co. Ltd. | Multimedia print driver dialog interfaces |
| US8635531B2 (en) * | 2002-02-21 | 2014-01-21 | Ricoh Company, Ltd. | Techniques for displaying information stored in multiple multimedia documents |
| US7747655B2 (en) * | 2001-11-19 | 2010-06-29 | Ricoh Co. Ltd. | Printable representations for time-based media |
| US7424129B2 (en) * | 2001-11-19 | 2008-09-09 | Ricoh Company, Ltd | Printing system with embedded audio/video content recognition and processing |
| US7743347B2 (en) * | 2001-11-19 | 2010-06-22 | Ricoh Company, Ltd. | Paper-based interface for specifying ranges |
| US7314994B2 (en) | 2001-11-19 | 2008-01-01 | Ricoh Company, Ltd. | Music processing printer |
| US20040181815A1 (en) * | 2001-11-19 | 2004-09-16 | Hull Jonathan J. | Printer with radio or television program extraction and formating |
| US7415670B2 (en) * | 2001-11-19 | 2008-08-19 | Ricoh Co., Ltd. | Printer with audio/video localization |
| US7788080B2 (en) * | 2001-11-19 | 2010-08-31 | Ricoh Company, Ltd. | Paper interface for simulation environments |
| US7703044B2 (en) | 2001-11-19 | 2010-04-20 | Ricoh Company, Ltd. | Techniques for generating a static representation for time-based media information |
| US8214741B2 (en) * | 2002-03-19 | 2012-07-03 | Sharp Laboratories Of America, Inc. | Synchronization of video and data |
| US7035435B2 (en) * | 2002-05-07 | 2006-04-25 | Hewlett-Packard Development Company, L.P. | Scalable video summarization and navigation system and method |
| US7047494B2 (en) * | 2002-05-07 | 2006-05-16 | Hewlett-Packard Development Company, L.P. | Scalable video summarization |
| US7222300B2 (en) | 2002-06-19 | 2007-05-22 | Microsoft Corporation | System and method for automatically authoring video compositions using video cliplets |
| FR2841423A1 (fr) * | 2002-06-25 | 2003-12-26 | Koninkl Philips Electronics Nv | Procede de detection d'artefacts de bloc |
| US7657907B2 (en) * | 2002-09-30 | 2010-02-02 | Sharp Laboratories Of America, Inc. | Automatic user profiling |
| JP4112968B2 (ja) * | 2002-12-26 | 2008-07-02 | 富士通株式会社 | ビデオテキスト処理装置 |
| US7006945B2 (en) | 2003-01-10 | 2006-02-28 | Sharp Laboratories Of America, Inc. | Processing of video content |
| US7275210B2 (en) * | 2003-03-21 | 2007-09-25 | Fuji Xerox Co., Ltd. | Systems and methods for generating video summary image layouts |
| US20040197088A1 (en) * | 2003-03-31 | 2004-10-07 | Ferman Ahmet Mufit | System for presenting audio-video content |
| US7266568B1 (en) * | 2003-04-11 | 2007-09-04 | Ricoh Company, Ltd. | Techniques for storing multimedia information with source documents |
| US7206773B2 (en) | 2003-04-11 | 2007-04-17 | Ricoh Company, Ltd | Techniques for accessing information captured during a presentation using a paper document handout for the presentation |
| KR100609154B1 (ko) * | 2003-05-23 | 2006-08-02 | 엘지전자 주식회사 | 비디오 콘텐츠 재생 방법 및 장치 |
| KR100708337B1 (ko) * | 2003-06-27 | 2007-04-17 | 주식회사 케이티 | 퍼지 기반 oc―svm을 이용한 동영상 자동 요약 장치및 방법 |
| JP4415591B2 (ja) * | 2003-07-16 | 2010-02-17 | カシオ計算機株式会社 | 画像印刷装置及びプログラム |
| US7275159B2 (en) * | 2003-08-11 | 2007-09-25 | Ricoh Company, Ltd. | Multimedia output device having embedded encryption functionality |
| US20050071763A1 (en) * | 2003-09-25 | 2005-03-31 | Hart Peter E. | Stand alone multimedia printer capable of sharing media processing tasks |
| US7440126B2 (en) * | 2003-09-25 | 2008-10-21 | Ricoh Co., Ltd | Printer with document-triggered processing |
| US7864352B2 (en) * | 2003-09-25 | 2011-01-04 | Ricoh Co. Ltd. | Printer with multimedia server |
| US8077341B2 (en) * | 2003-09-25 | 2011-12-13 | Ricoh Co., Ltd. | Printer with audio or video receiver, recorder, and real-time content-based processing logic |
| US7528977B2 (en) | 2003-09-25 | 2009-05-05 | Ricoh Co., Ltd. | Printer with hardware and software interfaces for peripheral devices |
| US7511846B2 (en) * | 2003-09-25 | 2009-03-31 | Ricoh Co., Ltd. | Printer having embedded functionality for printing time-based media |
| US7505163B2 (en) * | 2003-09-25 | 2009-03-17 | Ricoh Co., Ltd. | User interface for networked printer |
| US7528976B2 (en) * | 2003-09-25 | 2009-05-05 | Ricoh Co., Ltd. | Stand alone printer with hardware/software interfaces for sharing multimedia processing |
| US7508535B2 (en) * | 2003-09-25 | 2009-03-24 | Ricoh Co., Ltd. | Stand alone multimedia printer with user interface for allocating processing |
| US7570380B2 (en) * | 2003-09-25 | 2009-08-04 | Ricoh Company, Ltd. | Printer user interface |
| JP2005108230A (ja) * | 2003-09-25 | 2005-04-21 | Ricoh Co Ltd | オーディオ/ビデオコンテンツ認識・処理機能内蔵印刷システム |
| US7372991B2 (en) * | 2003-09-26 | 2008-05-13 | Seiko Epson Corporation | Method and apparatus for summarizing and indexing the contents of an audio-visual presentation |
| US20050111041A1 (en) * | 2003-11-25 | 2005-05-26 | Nokia Corporation | Rendering electronic presentations to printed surface |
| US7689712B2 (en) | 2003-11-26 | 2010-03-30 | Ricoh Company, Ltd. | Techniques for integrating note-taking and multimedia information |
| EP1538536A1 (en) * | 2003-12-05 | 2005-06-08 | Sony International (Europe) GmbH | Visualization and control techniques for multimedia digital content |
| US7079142B2 (en) * | 2004-01-14 | 2006-07-18 | Fuji Xerox Co., Ltd. | Systems and methods for creating and updating an interactive 3D visualization of media indices |
| EP1557837A1 (en) * | 2004-01-26 | 2005-07-27 | Sony International (Europe) GmbH | Redundancy elimination in a content-adaptive video preview system |
| US7340678B2 (en) * | 2004-02-12 | 2008-03-04 | Fuji Xerox Co., Ltd. | Systems and methods for creating an interactive 3D visualization of indexed media |
| KR100590537B1 (ko) * | 2004-02-18 | 2006-06-15 | 삼성전자주식회사 | 복수 영상의 요약 방법 및 장치 |
| US7594245B2 (en) * | 2004-03-04 | 2009-09-22 | Sharp Laboratories Of America, Inc. | Networked video devices |
| US8949899B2 (en) * | 2005-03-04 | 2015-02-03 | Sharp Laboratories Of America, Inc. | Collaborative recommendation system |
| US8356317B2 (en) | 2004-03-04 | 2013-01-15 | Sharp Laboratories Of America, Inc. | Presence based technology |
| JP2005277531A (ja) * | 2004-03-23 | 2005-10-06 | Seiko Epson Corp | 動画像処理装置 |
| JP2005277981A (ja) * | 2004-03-26 | 2005-10-06 | Seiko Epson Corp | 画像処理のための対象画像の選択 |
| US8274666B2 (en) * | 2004-03-30 | 2012-09-25 | Ricoh Co., Ltd. | Projector/printer for displaying or printing of documents |
| US7603615B2 (en) * | 2004-03-30 | 2009-10-13 | Ricoh Co., Ltd. | Multimedia projector-printer |
| US7697785B2 (en) * | 2004-03-31 | 2010-04-13 | Fuji Xerox Co., Ltd. | Generating a highly condensed visual summary |
| US7818444B2 (en) | 2004-04-30 | 2010-10-19 | Move Networks, Inc. | Apparatus, system, and method for multi-bitrate content streaming |
| KR20070026627A (ko) * | 2004-06-22 | 2007-03-08 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 멀티미디어 항목의 선택을 위한 방법 및 디바이스, 휴대용선호 저장 디바이스 |
| FR2875662A1 (fr) * | 2004-09-17 | 2006-03-24 | Thomson Licensing Sa | Procede de visualisation de document audiovisuels au niveau d'un recepteur, et recepteur apte a les visualiser |
| US7783106B2 (en) * | 2004-11-12 | 2010-08-24 | Fuji Xerox Co., Ltd. | Video segmentation combining similarity analysis and classification |
| US7555718B2 (en) * | 2004-11-12 | 2009-06-30 | Fuji Xerox Co., Ltd. | System and method for presenting video search results |
| US7551312B1 (en) * | 2005-03-17 | 2009-06-23 | Ricoh Co., Ltd. | Annotable document printer |
| US7760956B2 (en) * | 2005-05-12 | 2010-07-20 | Hewlett-Packard Development Company, L.P. | System and method for producing a page using frames of a video stream |
| US8089563B2 (en) * | 2005-06-17 | 2012-01-03 | Fuji Xerox Co., Ltd. | Method and system for analyzing fixed-camera video via the selection, visualization, and interaction with storyboard keyframes |
| US7623677B2 (en) * | 2005-06-17 | 2009-11-24 | Fuji Xerox Co., Ltd. | Methods and interfaces for visualizing activity across video frames in an action keyframe |
| JP4682928B2 (ja) * | 2005-06-17 | 2011-05-11 | 富士ゼロックス株式会社 | アクションキーフレーム内における複数のビデオフレーム全体にわたる動作を視覚化する装置とそのためのプログラム |
| US7996771B2 (en) * | 2005-06-17 | 2011-08-09 | Fuji Xerox Co., Ltd. | Methods and interfaces for event timeline and logs of video streams |
| US7554576B2 (en) * | 2005-06-20 | 2009-06-30 | Ricoh Company, Ltd. | Information capture and recording system for controlling capture devices |
| US8805929B2 (en) * | 2005-06-20 | 2014-08-12 | Ricoh Company, Ltd. | Event-driven annotation techniques |
| JP4830379B2 (ja) | 2005-07-13 | 2011-12-07 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
| KR100703801B1 (ko) * | 2005-10-21 | 2007-04-06 | 삼성전자주식회사 | Av 태스크 계산 방법, av 태스크 계산을 위한 요약정보 제공 방법 및 이를 위한 장치 |
| US20070226624A1 (en) * | 2006-02-23 | 2007-09-27 | Peker Kadir A | Content-based video summarization using spectral clustering |
| JP4808512B2 (ja) * | 2006-03-01 | 2011-11-02 | 富士フイルム株式会社 | カテゴリ重要度設定装置および方法、画像重要度設定装置および方法並びにプログラム |
| US8689253B2 (en) * | 2006-03-03 | 2014-04-01 | Sharp Laboratories Of America, Inc. | Method and system for configuring media-playing sets |
| BRPI0708456A2 (pt) * | 2006-03-03 | 2011-05-31 | Koninkl Philips Electronics Nv | método para prover um sumário de diversas imagens, dispositivo adaptado para gerar um sumário de diversas imagens, sistema, código de programa executável por computador, e, portador de dados |
| US8699806B2 (en) * | 2006-04-12 | 2014-04-15 | Google Inc. | Method and apparatus for automatically summarizing video |
| JP2008003968A (ja) * | 2006-06-23 | 2008-01-10 | Fuji Xerox Co Ltd | 情報処理システム、情報処理方法及びプログラム |
| US20080019669A1 (en) * | 2006-07-18 | 2008-01-24 | Sahra Reza Girshick | Automatically editing video data |
| US20080019661A1 (en) * | 2006-07-18 | 2008-01-24 | Pere Obrador | Producing output video from multiple media sources including multiple video sources |
| US8229156B1 (en) | 2006-08-08 | 2012-07-24 | Google Inc. | Using curve invariants to automatically characterize videos |
| EP2057631A2 (en) * | 2006-08-25 | 2009-05-13 | Koninklijke Philips Electronics N.V. | Method and apparatus for automatically generating a summary of a multimedia content item |
| US20100111498A1 (en) * | 2006-09-27 | 2010-05-06 | Koninklijke Philips Electronics N.V. | Method of creating a summary |
| US8000533B2 (en) * | 2006-11-14 | 2011-08-16 | Microsoft Corporation | Space-time video montage |
| US8788938B2 (en) * | 2007-01-19 | 2014-07-22 | Hewlett-Packard Development Company, L.P. | Web-based video browsing |
| US8918714B2 (en) * | 2007-04-11 | 2014-12-23 | Adobe Systems Incorporated | Printing a document containing a video or animations |
| CN101079065B (zh) * | 2007-06-25 | 2012-07-04 | 腾讯科技(深圳)有限公司 | 一种显示含有组图的图片的方法及系统 |
| US8503523B2 (en) * | 2007-06-29 | 2013-08-06 | Microsoft Corporation | Forming a representation of a video item and use thereof |
| JP4811433B2 (ja) * | 2007-09-05 | 2011-11-09 | ソニー株式会社 | 画像選択装置、画像選択方法、およびプログラム |
| US20090133060A1 (en) * | 2007-11-21 | 2009-05-21 | Microsoft Corporation | Still-Frame Content Navigation |
| US8630497B2 (en) * | 2007-11-27 | 2014-01-14 | Intelliview Technologies Inc. | Analyzing a segment of video |
| US8150169B2 (en) * | 2008-09-16 | 2012-04-03 | Viewdle Inc. | System and method for object clustering and identification in video |
| US8380866B2 (en) * | 2009-03-20 | 2013-02-19 | Ricoh Company, Ltd. | Techniques for facilitating annotations |
| US9190110B2 (en) | 2009-05-12 | 2015-11-17 | JBF Interlude 2009 LTD | System and method for assembling a recorded composition |
| US8861935B2 (en) * | 2009-08-26 | 2014-10-14 | Verizon Patent And Licensing Inc. | Systems and methods for enhancing utilization of recorded media content programs |
| JP5566120B2 (ja) * | 2010-01-20 | 2014-08-06 | キヤノン株式会社 | 表示制御装置、方法及びプログラム並びに記録媒体 |
| US11232458B2 (en) | 2010-02-17 | 2022-01-25 | JBF Interlude 2009 LTD | System and method for data mining within interactive multimedia |
| US8599316B2 (en) * | 2010-05-25 | 2013-12-03 | Intellectual Ventures Fund 83 Llc | Method for determining key video frames |
| US8786597B2 (en) | 2010-06-30 | 2014-07-22 | International Business Machines Corporation | Management of a history of a meeting |
| US9171578B2 (en) * | 2010-08-06 | 2015-10-27 | Futurewei Technologies, Inc. | Video skimming methods and systems |
| JP4973771B2 (ja) * | 2010-09-17 | 2012-07-11 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
| US8687941B2 (en) | 2010-10-29 | 2014-04-01 | International Business Machines Corporation | Automatic static video summarization |
| US9271035B2 (en) | 2011-04-12 | 2016-02-23 | Microsoft Technology Licensing, Llc | Detecting key roles and their relationships from video |
| RU2484529C1 (ru) * | 2012-03-21 | 2013-06-10 | Общество с ограниченной ответственностью "Синезис" | Способ ранжирования видеоданных |
| US9246741B2 (en) * | 2012-04-11 | 2016-01-26 | Google Inc. | Scalable, live transcoding with support for adaptive streaming and failover |
| US8914452B2 (en) | 2012-05-31 | 2014-12-16 | International Business Machines Corporation | Automatically generating a personalized digest of meetings |
| US9116924B2 (en) | 2013-01-14 | 2015-08-25 | Xerox Corporation | System and method for image selection using multivariate time series analysis |
| WO2014110642A1 (en) | 2013-01-15 | 2014-07-24 | Imax Corporation | Image frames multiplexing method and system |
| US9491366B2 (en) | 2013-02-01 | 2016-11-08 | Htc Corporation | Electronic device and image composition method thereof |
| US20160029106A1 (en) * | 2013-03-06 | 2016-01-28 | Zhibo Chen | Pictorial summary of a video |
| US10373470B2 (en) | 2013-04-29 | 2019-08-06 | Intelliview Technologies, Inc. | Object detection |
| USD751587S1 (en) * | 2013-04-30 | 2016-03-15 | Microsoft Corporation | Display screen with graphical user interface |
| US9159367B2 (en) | 2013-08-19 | 2015-10-13 | Nvidia Corporation | Automatic playback of one or more excerpt(s) of a video sequence on a data processing device |
| US20150055832A1 (en) * | 2013-08-25 | 2015-02-26 | Nikolay Vadimovich PTITSYN | Method for video data ranking |
| US9330171B1 (en) * | 2013-10-17 | 2016-05-03 | Google Inc. | Video annotation using deep network architectures |
| JP6160480B2 (ja) | 2013-12-27 | 2017-07-12 | 富士ゼロックス株式会社 | 代表フレーム選定システム、代表フレーム選定プログラム |
| KR101536930B1 (ko) * | 2014-01-07 | 2015-07-15 | 서울과학기술대학교 산학협력단 | 동영상을 요약하는 방법 및 동영상 요약기, 그리고 이를 이용한 동영상 만화 정보 서비스 방법 |
| JPWO2015125815A1 (ja) * | 2014-02-20 | 2017-03-30 | シャープ株式会社 | 映像編集装置 |
| CA2847707C (en) | 2014-03-28 | 2021-03-30 | Intelliview Technologies Inc. | Leak detection |
| US9653115B2 (en) | 2014-04-10 | 2017-05-16 | JBF Interlude 2009 LTD | Systems and methods for creating linear video from branched video |
| US10943357B2 (en) | 2014-08-19 | 2021-03-09 | Intelliview Technologies Inc. | Video based indoor leak detection |
| CN107077595A (zh) | 2014-09-08 | 2017-08-18 | 谷歌公司 | 选择和呈现代表性帧以用于视频预览 |
| US9792957B2 (en) | 2014-10-08 | 2017-10-17 | JBF Interlude 2009 LTD | Systems and methods for dynamic video bookmarking |
| US9626584B2 (en) * | 2014-10-09 | 2017-04-18 | Adobe Systems Incorporated | Image cropping suggestion using multiple saliency maps |
| US11412276B2 (en) | 2014-10-10 | 2022-08-09 | JBF Interlude 2009 LTD | Systems and methods for parallel track transitions |
| US20160127807A1 (en) * | 2014-10-29 | 2016-05-05 | EchoStar Technologies, L.L.C. | Dynamically determined audiovisual content guidebook |
| JP6583285B2 (ja) * | 2014-12-15 | 2019-10-02 | ソニー株式会社 | 情報処理方法、映像処理装置及びプログラム |
| KR102306538B1 (ko) * | 2015-01-20 | 2021-09-29 | 삼성전자주식회사 | 콘텐트 편집 장치 및 방법 |
| KR101650153B1 (ko) * | 2015-03-19 | 2016-08-23 | 네이버 주식회사 | 만화 데이터 편집 방법 및 만화 데이터 편집 장치 |
| JP2016189507A (ja) * | 2015-03-30 | 2016-11-04 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
| US10582265B2 (en) | 2015-04-30 | 2020-03-03 | JBF Interlude 2009 LTD | Systems and methods for nonlinear video playback using linear real-time video players |
| US10235466B2 (en) * | 2015-06-24 | 2019-03-19 | International Business Machines Corporation | Profile driven presentation content displaying and filtering |
| US10460765B2 (en) | 2015-08-26 | 2019-10-29 | JBF Interlude 2009 LTD | Systems and methods for adaptive and responsive video |
| US10248864B2 (en) | 2015-09-14 | 2019-04-02 | Disney Enterprises, Inc. | Systems and methods for contextual video shot aggregation |
| JP6973567B2 (ja) * | 2015-09-16 | 2021-12-01 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
| US9805269B2 (en) | 2015-11-20 | 2017-10-31 | Adobe Systems Incorporated | Techniques for enhancing content memorability of user generated video content |
| US11164548B2 (en) | 2015-12-22 | 2021-11-02 | JBF Interlude 2009 LTD | Intelligent buffering of large-scale video |
| US11128853B2 (en) | 2015-12-22 | 2021-09-21 | JBF Interlude 2009 LTD | Seamless transitions in large-scale video |
| KR20170098079A (ko) * | 2016-02-19 | 2017-08-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서의 비디오 녹화 방법 |
| US11856271B2 (en) | 2016-04-12 | 2023-12-26 | JBF Interlude 2009 LTD | Symbiotic interactive video |
| US11050809B2 (en) * | 2016-12-30 | 2021-06-29 | JBF Interlude 2009 LTD | Systems and methods for dynamic weighting of branched video paths |
| JP7265543B2 (ja) | 2017-10-17 | 2023-04-26 | ヴェリリー ライフ サイエンシズ エルエルシー | 外科用ビデオをセグメント化するためのシステムおよび方法 |
| US10497397B2 (en) * | 2017-12-01 | 2019-12-03 | International Business Machines Corporation | Generating video-notes from videos using machine learning |
| JP7192792B2 (ja) * | 2017-12-22 | 2022-12-20 | ソニーグループ株式会社 | 情報処理装置、情報処理方法及びプログラム |
| US10257578B1 (en) | 2018-01-05 | 2019-04-09 | JBF Interlude 2009 LTD | Dynamic library display for interactive videos |
| KR102542788B1 (ko) * | 2018-01-08 | 2023-06-14 | 삼성전자주식회사 | 전자장치, 그 제어방법 및 컴퓨터프로그램제품 |
| US10311913B1 (en) * | 2018-02-22 | 2019-06-04 | Adobe Inc. | Summarizing video content based on memorability of the video content |
| US10777228B1 (en) * | 2018-03-22 | 2020-09-15 | Gopro, Inc. | Systems and methods for creating video edits |
| US10679069B2 (en) | 2018-03-27 | 2020-06-09 | International Business Machines Corporation | Automatic video summary generation |
| US11601721B2 (en) | 2018-06-04 | 2023-03-07 | JBF Interlude 2009 LTD | Interactive video dynamic adaptation and user profiling |
| US11348235B2 (en) | 2019-03-22 | 2022-05-31 | Verily Life Sciences Llc | Improving surgical video consumption by identifying useful segments in surgical videos |
| US11490047B2 (en) | 2019-10-02 | 2022-11-01 | JBF Interlude 2009 LTD | Systems and methods for dynamically adjusting video aspect ratios |
| CN111310657B (zh) * | 2020-02-14 | 2023-07-07 | 北京远特科技股份有限公司 | 驾驶员人脸监控方法、装置、终端和计算机可读存储介质 |
| US12096081B2 (en) | 2020-02-18 | 2024-09-17 | JBF Interlude 2009 LTD | Dynamic adaptation of interactive video players using behavioral analytics |
| US11245961B2 (en) | 2020-02-18 | 2022-02-08 | JBF Interlude 2009 LTD | System and methods for detecting anomalous activities for interactive videos |
| US12047637B2 (en) | 2020-07-07 | 2024-07-23 | JBF Interlude 2009 LTD | Systems and methods for seamless audio and video endpoint transitions |
| JP2022169009A (ja) * | 2021-04-27 | 2022-11-09 | 国立大学法人 東京大学 | プログラム、情報処理方法及び情報処理装置 |
| US11882337B2 (en) | 2021-05-28 | 2024-01-23 | JBF Interlude 2009 LTD | Automated platform for generating interactive videos |
| US12155897B2 (en) | 2021-08-31 | 2024-11-26 | JBF Interlude 2009 LTD | Shader-based dynamic video manipulation |
| US12549818B2 (en) | 2021-08-31 | 2026-02-10 | JBF Interlude 2009 LTD | Shader-based dynamic video manipulation |
| US11934477B2 (en) | 2021-09-24 | 2024-03-19 | JBF Interlude 2009 LTD | Video player integration within websites |
| US12260639B2 (en) | 2021-11-12 | 2025-03-25 | International Business Machines Corporation | Annotating a video with a personalized recap video based on relevancy and watch history |
| US12541948B2 (en) * | 2023-10-12 | 2026-02-03 | Roku, Inc. | Frame classification to generate target media content |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5210799A (en) * | 1991-03-28 | 1993-05-11 | Texas Instruments Incorporated | System and method for ranking and extracting salient contours for target recognition |
| US5243149A (en) * | 1992-04-10 | 1993-09-07 | International Business Machines Corp. | Method and apparatus for improving the paper interface to computing systems |
| US5325449A (en) * | 1992-05-15 | 1994-06-28 | David Sarnoff Research Center, Inc. | Method for fusing images and apparatus therefor |
| US5606655A (en) * | 1994-03-31 | 1997-02-25 | Siemens Corporate Research, Inc. | Method for representing contents of a single video shot using frames |
| US5664227A (en) | 1994-10-14 | 1997-09-02 | Carnegie Mellon University | System and method for skimming digital audio/video data |
| US5708767A (en) | 1995-02-03 | 1998-01-13 | The Trustees Of Princeton University | Method and apparatus for video browsing based on content and structure |
| US5821945A (en) * | 1995-02-03 | 1998-10-13 | The Trustees Of Princeton University | Method and apparatus for video browsing based on content and structure |
| US5920856A (en) * | 1997-06-09 | 1999-07-06 | Xerox Corporation | System for selecting multimedia databases over networks |
| US6282454B1 (en) * | 1997-09-10 | 2001-08-28 | Schneider Automation Inc. | Web interface to a programmable controller |
-
1999
- 1999-03-12 US US09/267,529 patent/US6535639B1/en not_active Expired - Lifetime
-
2000
- 2000-03-09 JP JP2000064869A patent/JP3968942B2/ja not_active Expired - Fee Related
-
2007
- 2007-03-22 JP JP2007074829A patent/JP4321613B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JP2000308008A (ja) | 2000-11-02 |
| JP2007228604A (ja) | 2007-09-06 |
| US6535639B1 (en) | 2003-03-18 |
| JP4321613B2 (ja) | 2009-08-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3968942B2 (ja) | ビデオの内容を要約する方法 | |
| Girgensohn et al. | A semi-automatic approach to home video editing | |
| US5821945A (en) | Method and apparatus for video browsing based on content and structure | |
| US7600183B2 (en) | System and method for data publication through web pages | |
| US5708767A (en) | Method and apparatus for video browsing based on content and structure | |
| US7471827B2 (en) | Automatic browsing path generation to present image areas with high attention value as a function of space and time | |
| JP4269473B2 (ja) | オーディオ・ビジュアル記録物をセグメント化する方法およびコンピュータ記憶媒体、並びにコンピュータシステム | |
| US8301669B2 (en) | Concurrent presentation of video segments enabling rapid video file comprehension | |
| DE102008056603B4 (de) | Verfahren und Vorrichtungen zur Messung von Markenexposition in Medienstreams und zur Festlegung von Interessenbereichen in zugeordneten Videoframes | |
| JP5691289B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
| US20100182501A1 (en) | Information processing apparatus, information processing method, and program | |
| US7916894B1 (en) | Summary of a video using faces | |
| US7904815B2 (en) | Content-based dynamic photo-to-video methods and apparatuses | |
| US7487524B2 (en) | Method and apparatus for presenting content of images | |
| JP2000322450A (ja) | ビデオの類似性探索方法、ビデオブラウザ内にビデオを提示する方法、ウェブベースのインタフェース内にビデオを提示する方法、及びコンピュータ読取り可能記録媒体、並びにコンピュータシステム | |
| US20020051081A1 (en) | Special reproduction control information describing method, special reproduction control information creating apparatus and method therefor, and video reproduction apparatus and method therefor | |
| JP2000311180A (ja) | 特徴セット選択方法、ビデオ画像クラス統計モデルの生成方法、ビデオフレームの分類及びセグメント化方法、ビデオフレームの類似性決定方法、およびコンピュータ可読媒体、並びにコンピュータシステム | |
| US20040088289A1 (en) | Image processing | |
| US20090003712A1 (en) | Video Collage Presentation | |
| JP6016489B2 (ja) | 画像処理装置、画像処理装置の制御方法、プログラム | |
| US20120013640A1 (en) | Graphical representation of events | |
| JP2001503895A (ja) | ビデオ情報を効果的に表示、保存、およびアクセスするための方法および装置 | |
| US11880918B2 (en) | Method for dynamic creation of collages from mobile video | |
| US9961275B2 (en) | Method, system, and apparatus for operating a kinetic typography service | |
| JP2012038286A (ja) | コンテンツ解析装置、方法およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040126 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060328 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060418 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060619 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060822 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061023 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070123 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070322 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070418 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070515 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070528 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110615 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110615 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120615 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130615 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130615 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140615 Year of fee payment: 7 |
|
| LAPS | Cancellation because of no payment of annual fees |