JP7682525B2 - Content similarity calculation system and content search and recommendation system - Google Patents
Content similarity calculation system and content search and recommendation system Download PDFInfo
- Publication number
- JP7682525B2 JP7682525B2 JP2021112077A JP2021112077A JP7682525B2 JP 7682525 B2 JP7682525 B2 JP 7682525B2 JP 2021112077 A JP2021112077 A JP 2021112077A JP 2021112077 A JP2021112077 A JP 2021112077A JP 7682525 B2 JP7682525 B2 JP 7682525B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- semantic
- media content
- media
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、コンテンツの類似を計算する技術に関し、特に、時系列で変化する展開や筋を有するメディアコンテンツの類似度を計算するコンテンツ類似システムおよびコンテンツ検索・推奨システムに適用して有効な技術に関するものである。 The present invention relates to a technology for calculating content similarity, and in particular to a technology that is useful when applied to a content similarity system and a content search and recommendation system that calculates the similarity of media content that has a development or plot that changes over time.
近年、インターネット上のいたるところにデジタルのメディアコンテンツ(例えば、小説、音楽、映画、動画等)が大量に存在しており、ユーザーがこれらを楽しむ機会が増えている。ここでは、ユーザーの趣味・嗜好や意図に合致するコンテンツを効果的に取得して推奨する手法を確立することが重要となる。特に、単なるパターンマッチングではなく、いわゆる感性検索の一つとして、メディアコンテンツの意味や印象といった内容に基づいて検索・推奨する手法を確立することが必要である。 In recent years, a huge amount of digital media content (e.g., novels, music, movies, videos, etc.) has been available all over the Internet, and users have more opportunities to enjoy this content. It is important to establish a method to effectively acquire and recommend content that matches the user's hobbies, tastes, and intentions. In particular, it is necessary to establish a method that searches and recommends content based on the meaning and impression of media content, as a type of so-called emotional search, rather than simply pattern matching.
一般的に、これらのメディアコンテンツは、時系列で変化する展開や筋を有し、その意味や印象が時間とともに遷移する。例えば、小説などでは、表現方法や手法は相違していても、似通った展開や筋を有する作品があり、展開や筋から作者のバックグラウンドを推測することができる場合もある。メディアコンテンツの意味的な特徴は、メディアコンテンツそのものの特徴によってだけでなく、時系列での特徴の変化によっても表現されているのであり、メディアコンテンツとして表現された作品を評価する場合は、全体での意味や印象だけでなく、各シーンで呼び起こされる意味や印象についても検証することが重要である。 Generally, these media contents have developments and plots that change over time, and their meanings and impressions change over time. For example, novels and other works may have similar developments and plots even if the expression methods and techniques differ, and it may be possible to infer the author's background from the development and plot. The semantic characteristics of media content are expressed not only by the characteristics of the media content itself, but also by changes in characteristics over time. When evaluating a work expressed as media content, it is important to examine not only the meaning and impression as a whole, but also the meaning and impression evoked by each scene.
一般的な時系列データの分析においては、2つの時系列データ間の類似を概念的に把握するための適切な手法を用いることが重要である。これには大きく分けて、時系列データ間の類似を直接的に計算する手法と、時系列データを周波数データに変換して類似を計算する手法とがある。 In general time series data analysis, it is important to use an appropriate method to conceptually grasp the similarity between two pieces of time series data. Broadly speaking, there are two methods: one that directly calculates the similarity between time series data, and one that converts the time series data into frequency data and then calculates the similarity.
前者の直接的に計算する手法としては、例えば、DTW(Dynamic Time Warping:動的時間伸縮法)や、ERP(Edit distance with Real Penalty)、LCS(Longest Common Subsequence:最長共通部分列問題)、EDR(Edit Distance on Real sequence)、FTSE(Fast Time Series Evaluation)など、各種の手法が知られている。また、後者の周波数データに変換して計算する手法としては、フーリエ変換を用いた手法(非特許文献1、非特許文献2など)や、ハールウェーブレットを用いた手法がある。
There are various known methods for directly calculating the former, such as Dynamic Time Warping (DTW), Edit distance with Real Penalty (ERP), Longest Common Subsequence (LCS), Edit Distance on Real sequence (EDR), and Fast Time Series Evaluation (FTSE). In addition, there are methods for converting the latter to frequency data and calculating the latter, such as a method using the Fourier transform (
また、単なるパターンマッチングではなく、コンテンツの時系列での意味内容の変化を考慮する技術として、例えば、特開2021-9633号公報(特許文献1)には、検索対象データのコンテンツを解析して、各感動項目とその感動量とが対応づけられた感動ベクトルを算出するとともに、基準試料に対する利用者の応答内容に基づいて、利用者が要求する事象についての感動ベクトルを算出し、検索対象データについて算出された感動ベクトルと、利用者について算出された感動ベクトルとを比較演算することにより、利用者について算出された感動ベクトルに近い感動ベクトルを示す検索対象データを抽出する情報検索方法が記載されている。感動項目に、複数の特定の条件が時系列に充足されると判定された場合に感動量が増加される項目を含むことで、時系列のストーリー性を考慮することができるとされている。 As a technique that takes into account changes in the meaning of content over time rather than simply pattern matching, for example, JP 2021-9633 A (Patent Document 1) describes an information retrieval method that analyzes the content of search target data to calculate an emotion vector in which each emotion item and its emotion amount are associated, calculates an emotion vector for an event requested by a user based on the user's response to a reference sample, and extracts search target data that shows an emotion vector close to the emotion vector calculated for the user by performing a comparative calculation between the emotion vector calculated for the search target data and the emotion vector calculated for the user. It is said that the story-like nature of the time series can be taken into account by including in the emotion items an item whose emotion amount is increased when it is determined that multiple specific conditions are satisfied in time series.
例えば、非特許文献1、2なども含む、従来の時系列データの類似の計算手法をメディアコンテンツに適用することで、メディアコンテンツのデータ自体の類似を評価することが可能である。しかしながら、メディアコンテンツにおける意味や印象の時系列での遷移といった意味内容を考慮した類似の評価をすることは困難である。
For example, by applying conventional methods for calculating similarity of time-series data, including those described in
一方、特許文献1に記載されたような技術では、コンテンツの意味内容の時系列での変化について一定程度考慮することができる。しかしながら、時系列といっても項目の出現順序や頻度を考慮できるにとどまり、意味内容が変化する時間的な間隔まで考慮することはできない。
On the other hand, the technology described in
そこで本発明の目的は、メディアコンテンツの意味や印象の変化、遷移を時間軸、時系列で把握して、メディアコンテンツの展開や筋に基づく類似度を計算するコンテンツ類似計算システム、およびこれを用いたコンテンツ検索・推奨システムを提供することにある。 The object of the present invention is to provide a content similarity calculation system that grasps the changes and transitions in the meaning and impression of media content on a time axis and in a chronological order, and calculates the similarity based on the development and plot of the media content, and a content search and recommendation system that uses the same.
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。 The above and other objects and novel features of the present invention will become apparent from the description of this specification and the accompanying drawings.
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、以下のとおりである。 The following is a brief summary of the representative inventions disclosed in this application:
本発明の代表的な実施の形態によるコンテンツ類似計算システムは、時系列で内容が変化するメディアコンテンツ間の類似度を計算するコンテンツ類似計算システムであって、入力された2以上のメディアコンテンツについて、それぞれ複数の意味項目についてその影響の程度の変化を抽出して意味波形のデータとして出力する意味波形抽出部と、前記各メディアコンテンツの前記各意味波形のデータからフーリエ変換により意味周波数スペクトルを取得して出力する時間・周波数領域変換部と、前記各メディアコンテンツについて、それぞれ、前記各意味周波数スペクトルのデータを要素とする意味周波数スペクトルベクトルを生成し、前記意味周波数スペクトルベクトル間のコサイン類似度を計算して出力する類似計算部と、を有する。 A content similarity calculation system according to a representative embodiment of the present invention is a content similarity calculation system that calculates the similarity between media contents whose contents change over time, and includes a semantic waveform extraction unit that extracts changes in the degree of influence of multiple semantic items for two or more input media contents and outputs them as semantic waveform data, a time-frequency domain conversion unit that obtains and outputs a semantic frequency spectrum from the semantic waveform data of each of the media contents by Fourier transform, and a similarity calculation unit that generates a semantic frequency spectrum vector for each of the media contents, whose elements are the data of each of the semantic frequency spectrums, and calculates and outputs the cosine similarity between the semantic frequency spectrum vectors.
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。 The effects achieved by the representative inventions disclosed in this application can be briefly explained as follows:
すなわち、本発明の代表的な実施の形態によれば、メディアコンテンツの意味や印象の変化、遷移を時間軸、時系列で把握して、メディアコンテンツの展開や筋に基づく類似度を計算することが可能となる。 In other words, according to a representative embodiment of the present invention, it is possible to grasp the changes and transitions in the meaning and impression of media content on a time axis and in a chronological order, and calculate the similarity based on the development and plot of the media content.
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一の符号を付し、その繰り返しの説明は省略する。一方で、ある図において符号を付して説明した部位について、他の図の説明の際に再度の図示はしないが同一の符号を付して言及する場合がある。 The following describes in detail an embodiment of the present invention with reference to the drawings. In all drawings used to explain the embodiment, the same parts are generally given the same reference numerals, and repeated explanations will be omitted. However, there are cases where parts that have been described with reference numerals in one drawing will be referred to with the same reference numerals when explaining other drawings, although they will not be shown again.
(実施の形態1)
<概要>
本発明の実施の形態1であるコンテンツ類似計算システムは、時系列で内容が変化するメディアコンテンツについて、その意味や印象の時系列での変化や遷移(意味的遷移)を把握し、これを波形として表現した意味波形を抽出する。そして、メディアコンテンツにおける複数の意味項目についてそれぞれ抽出された意味波形をフーリエ変換により周波数領域に変換して周波数スペクトルを取得し、これをベクトルとして表現する。そして、各メディアコンテンツにおいてそれぞれ得られたこのベクトルについて、ベクトル間のコサイン類似度を計算することで、意味的遷移に基づいてメディアコンテンツ間の類似度を計算する情報処理システムである。
(Embodiment 1)
<Overview>
The content similarity calculation system according to the first embodiment of the present invention grasps the time-series changes and transitions (semantic transitions) in the meanings and impressions of media content whose contents change over time, and extracts semantic waveforms that express these as waveforms.The semantic waveforms extracted for each of the multiple semantic items in the media content are then converted to the frequency domain by Fourier transform to obtain frequency spectra, which are then expressed as vectors.The information processing system then calculates the cosine similarity between the vectors obtained for each of the media contents, thereby calculating the similarity between the media content based on the semantic transitions.
<システム構成>
図1は、本発明の実施の形態1であるコンテンツ類似計算システム1の構成例について概要を示した図である。コンテンツ類似計算システム1は、例えば、サーバ機器やクラウドコンピューティングサービス上に構築された仮想サーバ等のサーバシステム、もしくはPC(Personal Computer)等のコンピュータシステムにより構成される。そして、図示しないCPU(Central Processing Unit)により、HDD(Hard Disk Drive)等の記録装置からメモリ上に展開したOS(Operating System)やDBMS(DataBase Management System)、Webサーバプログラム等のミドルウェアや、その上で稼働するソフトウェアを実行することで、メディアコンテンツの類似計算に係る後述する各種機能を実現する。
<System Configuration>
1 is a diagram showing an overview of a configuration example of a content
コンテンツ類似計算システム1は、例えば、ソフトウェアとして実装されたコンテンツ入力部11、意味波形抽出部12、時間・周波数領域変換部13、および類似計算部14等の各部を有する。
The content
コンテンツ入力部11は、類似度を計算する対象となるメディアコンテンツの入力を受け付ける機能を有する。図示しない入出力デバイスを介してメディアコンテンツのデータファイルの入力を直接受け付けてもよいし、インターネット等のネットワーク2を介してアップロードにより入力を受け付けてもよい。類似計算の対象となるメディアコンテンツは、必ずしも同じ種類のもの(例えば、小説同士、映画同士等)である必要はない。本実施の形態では、類似計算の際にメディアコンテンツのデータ同士を直接対比させるのではなく、意味波形を抽出した上で周波数領域に変換して類似計算することから、異なる種類のメディアコンテンツであっても類似計算することができる。
The
意味波形抽出部12は、コンテンツ入力部11を介して入力されたメディアコンテンツから、複数の特徴項目について、それぞれの時間軸・時系列での変化を抽出し、これに基づいて、コンテンツの意味や印象を表す複数の意味項目について、それぞれの影響の程度についての時間軸・時系列での遷移を示す意味波形のデータとして出力する機能を有する。意味波形抽出部12の機能や処理内容については後述する。
The semantic
時間・周波数領域変換部13は、意味波形抽出部12から出力された各意味項目に係る意味波形のデータに対して、それぞれフーリエ変換を行って時間領域のデータから周波数領域のデータに変換することで意味周波数スペクトルを取得して出力する機能を有する。時間・周波数領域変換部13の機能や処理内容についても後述する。
The time-to-frequency
類似計算部14は、類似度を計算する対象の各メディアコンテンツについて、それぞれ時間・周波数領域変換部13から出力された意味周波数スペクトルのデータに基づいて、当該メディアコンテンツ間の類似度を計算して出力する機能を有する。意味周波数スペクトルのデータに基づく類似度の計算については特に限定されないが、例えば、計算対象の各メディアコンテンツについて、それぞれ、各意味項目についての意味周波数スペクトルのデータを要素とするベクトル(意味周波数スペクトルベクトル)を生成し、これらのベクトル間のコサイン類似度を計算する手法などをとることができる。
The
<コンテンツ類似計算処理の内容>
図2は、本発明の実施の形態1におけるコンテンツ類似計算処理の概要について説明した図である。コンテンツ入力部11を介して入力された、計算対象の複数のメディアコンテンツA(41a)およびメディアコンテンツB(41b)について、それぞれ、意味波形抽出部12により意味波形抽出処理(S1a、S1b)を行うことで、意味波形A(42a)および意味波形B(42b)を得る。
<Contents of content similarity calculation processing>
2 is a diagram illustrating an overview of the content similarity calculation process in the first embodiment of the present invention. For a plurality of media contents A (41a) and B (41b) to be calculated, which are input via the
この意味波形A(42a)、意味波形B(42b)に対してそれぞれ、時間・周波数領域変換部13により時間・周波数領域変換処理(S2a、S2b)を行うことで、意味周波数スペクトルA(43a)および意味周波数スペクトルB(43b)を得る。そして、この意味周波数スペクトルA(43a)、意味周波数スペクトルB(43b)のデータについて、類似計算部14により、それぞれベクトル化して意味周波数スペクトルベクトルとし、これらのベクトル間のコサイン類似度を計算する類似計算処理(S3)を行うことで、メディアコンテンツA(41a)とメディアコンテンツB(41b)との間の類似度45を計算する。
The time-frequency
以下では、各処理の内容について説明する。 The details of each process are explained below.
<意味波形抽出処理>
図3は、本発明の実施の形態1における意味波形抽出処理の概要について説明した図である。本実施の形態では、展開や筋を有する、すなわち時間tの経過によって意味や印象などが変化するメディアコンテンツ41から、意味項目毎に複数の意味波形42を抽出する。図3の例では、「喜び」と「悲しみ」という2つの意味項目についてそれぞれ意味波形42を抽出したことを示している。このように、本実施の形態では、抽出される意味波形42の数は、評価する意味項目(意味や印象の観点)の数と同じである。
<Semantic Waveform Extraction Processing>
3 is a diagram illustrating an outline of the semantic waveform extraction process in the first embodiment of the present invention. In this embodiment, a plurality of
意味波形抽出処理では、まず、メディアコンテンツ41を所定の時間幅で区切った複数のウィンドウ51に分割する(ステップ1)。ここでは、意味を表現することができる最小の時間幅をウィンドウサイズとし、対象のメディアコンテンツ41の先頭から(もしくは指定された位置から)設定されたウィンドウサイズ毎に複数のウィンドウ51に分割する。
In the semantic waveform extraction process, first, the
そして、複数のウィンドウ51に分割されたメディアコンテンツ41から、複数の特徴項目をそれぞれ抽出する(ステップ2)。これにより、ウィンドウ51毎に現れる特徴項目の時系列での変化を得ることができる。なお、ここでの特徴項目は、例えば、メディアコンテンツ41中に直接的に現れる、意味や印象に関連する文章や単語、画像、音楽等とすることができる。その後、ウィンドウ51毎の各特徴項目を、意味項目(例えば、「喜び」や「悲しみ」等)に変換する(ステップ3)。
Then, multiple feature items are extracted from the
そして、各意味項目の影響の大きさ・程度をウィンドウ51毎に数値化して(ステップ4)、その時系列での変化を波形として表した意味波形42を得る(ステップ5)。図3の例では、メディアコンテンツ41における「喜び」と「悲しみ」の2つの意味項目について得られた意味波形42の例を示している。
Then, the magnitude and degree of the influence of each semantic item is quantified for each window 51 (step 4), and a
上記のステップ2およびステップ3の処理における、特徴項目を意味項目に変換する手法としては、例えば、文章や単語に対するネガポジ判定や感性判定等の既存の一般的な感性・感情分析の手法を用いることができる。また、例えば、文章の統計的潜在意味解析の手法として知られているトピックモデルを用いて、メディアコンテンツ41中におけるトピック(意味項目)の時系列でのシェアの変化を把握する手法を用いることも可能である。
In the above processing of
また、例えば、文献(T.Kitagawa and Y.Kiyoki,Y, "Fundamental framework for media data retrieval system using media lexicon transformation operator", Information Modeling and Knowledge Bases, vol.12, pp.316-326, 2001)において提案されている、メディアコンテンツから印象語を抽出するフレームワークであるMedia-lexicon Transformation Operatorを利用することも可能である。このMedia-lexicon Transformation Operatorは、対象とするメディアコンテンツに関する分野の専門家による研究や評論、統計などを用いることにより、人間がそのメディアコンテンツから受ける印象語の抽出を実現する機構である。 It is also possible to use the Media-lexicon Transformation Operator, a framework for extracting impression words from media content, proposed in the literature (T. Kitagawa and Y. Kiyoki, Y, "Fundamental framework for media data retrieval system using media lexicon transformation operator", Information Modeling and Knowledge Bases, vol.12, pp.316-326, 2001). The Media-lexicon Transformation Operator is a mechanism that uses research, reviews, statistics, etc. by experts in the field related to the target media content to extract impression words that humans get from that media content.
図4は、本発明の実施の形態1におけるメディアコンテンツ41から時系列で特徴を抽出する例について概要を示した図である。本実施の形態では、上記のMedia-lexicon Transformation Operatorが本来静的な一次元のデータを対象としているところ、これを時間軸に拡張して用いる。例えば、メディアンコンテンツ41中のウィンドウ51毎に現れる特徴項目に係る単語(w1、w2、…、wm)の出現頻度と、各ウィンドウ51の時間(t1、t2、…)(例えば、メディアコンテンツ41の開始からの経過時間により把握)との対応関係から得られる単語行列Yを求め、これを、単語(w1、w2、…、wm)と、意味や印象を示す意味項目(x1、x2、…、xn)との関係からなる変換行列T(予め辞書データ的に用意される)を用いて、変換行列Tと、意味項目(x1、x2、…、xn)と各ウィンドウ51の時間(t1、t2、…)との関係からなるメディアコンテンツ行列Xとの積に変換する。このメディアコンテンツ行列Xにより、各意味項目の時系列での遷移を把握することができる。
4 is a diagram showing an overview of an example of extracting features in a time series from
<時間・周波数領域変換処理>
図5は、本発明の実施の形態1における時間・周波数領域変換処理の概要について説明した図である。ここでは、各意味項目(図5の例では「喜び」と「悲しみ」)の意味波形42のデータに対して、それぞれ高速フーリエ変換(Fast Fourier Transform:FFT)アルゴリズムにより離散フーリエ変換を行って時間領域から周波数領域に変換することで、意味項目毎の意味周波数スペクトル(図5の例では「喜び」の意味周波数スペクトル43aと「悲しみ」の意味周波数スペクトル43b)を得る。
<Time-frequency domain transformation processing>
5 is a diagram illustrating an overview of the time-frequency domain conversion process in the first embodiment of the present invention. Here, the data of the
<類似計算処理>
類似計算処理では、メディアコンテンツ41毎に、上記の一連の処理で得られた意味項目毎の意味周波数スペクトルを1列の要素としてベクトル化して意味周波数スペクトルベクトル44を取得する。そして、メディアコンテンツ41毎の意味周波数スペクトルベクトル44のコサイン類似度を計算することで類似度を得る。類似度については、コサイン類似度の値をそのまま用いてもよいし、この値を所定の基準値と比較することで、類似している/していないという判定や、段階的な類似の程度を評価をするものであってもよい。
<Similar calculation processing>
In the similarity calculation process, for each
<結語>
以上に示したように、本発明の実施の形態1であるコンテンツ類似計算システム1によれば、メディアコンテンツ41における意味や印象の遷移を時間軸、時系列で把握して、メディアコンテンツ41の展開や筋に基づいて、コンテンツ間の類似度を計算することが可能である。
<Conclusion>
As described above, according to the content
また、類似計算の際にメディアコンテンツ41のデータ同士を直接対比させるのではなく、メディアコンテンツ41から意味波形42を抽出し、これを周波数領域に変換した意味周波数スペクトル43に基づいて類似計算することから、例えば、小説と映画など、異なる種類のメディアコンテンツ41であっても類似計算することが可能である。
In addition, when performing similarity calculations, the data of the
さらに、類似計算の際に、メディアコンテンツ41毎に、複数の意味周波数スペクトル43をベクトル化した意味周波数スペクトルベクトル44を生成して、これらのベクトル間のコサイン類似度を計算して類似度を得るというシンプルな手法をとることにより、低コストでメディアコンテンツ41間の類似度を計算することが可能である。
Furthermore, when calculating the similarity, a simple method is used in which a semantic
(実施の形態2)
本発明の実施の形態2であるコンテンツ検索・推奨システムは、上述した実施の形態1のコンテンツ類似計算システムを用いて、メディアコンテンツの検索・推奨を行う情報処理システムである。
(Embodiment 2)
The content search and recommendation system according to the second embodiment of the present invention is an information processing system that uses the content similarity calculation system according to the first embodiment described above to search for and recommend media content.
<システム構成>
図6は、本発明の実施の形態2であるコンテンツ検索・推奨システムの構成例について概要を示した図である。コンテンツ検索・推奨システム3は、例えば、サーバ機器やクラウドコンピューティングサービス上に構築された仮想サーバ等のサーバシステム、もしくはPC等のコンピュータシステムにより構成される。そして、図示しないCPUにより、HDD等の記録装置からメモリ上に展開したOSやDBMS、Webサーバプログラム等のミドルウェアや、その上で稼働するソフトウェアを実行することで、ユーザから指定された条件に基づくメディアコンテンツの検索や推奨に係る後述する各種機能を実現する。
<System Configuration>
6 is a diagram showing an overview of a configuration example of a content search and recommendation system according to a second embodiment of the present invention. The content search and
コンテンツ検索・推奨システム3は、例えば、ソフトウェアとして実装された条件コンテンツ入力部31、コンテンツ取出部32、コンテンツ類似計算部33、および結果コンテンツ出力部34等の各部を有する。また、複数のメディアコンテンツを格納するコンテンツデータベース(DB)35を有する。コンテンツ検索・推奨システム3は、コンテンツDB35に格納されているメディアコンテンツの中から、ユーザにより検索条件として指定されたメディアコンテンツに類似するものを抽出して、検索結果もしくは推奨コンテンツとして出力する。
The content search and
条件コンテンツ入力部31は、メディアコンテンツの検索や推奨を行う際の条件となる比較対象のメディアコンテンツの入力を受け付ける機能を有する。図示しない入出力デバイスを介してメディアコンテンツのデータファイルの入力を直接受け付けてもよいし、インターネット等のネットワーク2を介してアップロードにより入力を受け付けてもよい。
The condition
コンテンツ取出部32は、コンテンツDB35に格納されているメディアコンテンツを検索対象として順次取り出す機能を有する。全てのメディアコンテンツを順次取り出すようにしてもよいし、条件コンテンツ入力部31を介して入力された検索条件のメディアコンテンツの内容やメタデータその他の情報に基づいてコンテンツDB35から取り出すメディアコンテンツの範囲を絞り込んで、その中から順次取り出すようにしてもよい。
The
コンテンツ類似計算部33は、条件コンテンツ入力部31を介して入力された検索条件のメディアコンテンツと、コンテンツ取出部32によりコンテンツDB35から順次取り出されたメディアコンテンツとを入力として、メディアコンテンツ間の類似度を計算する機能を有する。実装に際しては、例えば、上述の実施の形態1に記載されたコンテンツ類似計算システム1(より正確にはソフトウェアとして実装された各部)を用いることができ、本実施の形態でもそのような構成をとるものとする。
The content
結果コンテンツ出力部34は、コンテンツ類似計算部33により計算された類似度の情報に基づいて、コンテンツDB35内のメディアコンテンツのうち、検索条件のメディアコンテンツとの間の類似度が最も高いものから順に一定数(もしくは類似度が一定の値以上)のメディアコンテンツを検索結果もしくは推奨コンテンツとしてユーザに対して出力する機能を有する。出力方法は特に限定されず、コンテンツ検索・推奨システム3が備える図示しないディスプレイに表示してもよいし、データファイルとして取り出したり、ネットワーク2を介してユーザがダウンロードしたりできるようにしてもよい。
The result
<結語>
以上に説明したように、本発明の実施の形態2であるコンテンツ検索・推奨システム3によれば、コンテンツDB35に格納されているメディアコンテンツの中から、ユーザにより検索条件として指定されたメディアコンテンツに類似するものを抽出して、検索結果もしくは推奨コンテンツとして出力することが可能である。
<Conclusion>
As described above, according to the content search and
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記の実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。また、上記の実施の形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施の形態の構成の一部を他の実施の形態の構成に置き換えることが可能であり、また、ある実施の形態の構成に他の実施の形態の構成を加えることも可能である。また、各実施の形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。 The invention made by the inventor has been specifically described above based on the embodiments, but it goes without saying that the present invention is not limited to the above embodiments and can be modified in various ways without departing from the gist of the invention. Furthermore, the above embodiments have been described in detail to explain the invention in an easy-to-understand manner, and the invention is not necessarily limited to having all of the configurations described. Furthermore, it is possible to replace part of the configuration of one embodiment with the configuration of another embodiment, and it is also possible to add the configuration of another embodiment to the configuration of one embodiment. Furthermore, it is possible to add, delete, or replace part of the configuration of each embodiment with other configurations.
また、上記の各構成、機能、処理部、処理手段等は、それらの一部または全部を、例えば、集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリやハードディスク、SSD(Solid State Drive)等の記録装置、またはICカード、SDカード、DVD等の記録媒体に置くことができる。 Furthermore, the above-mentioned configurations, functions, processing units, processing means, etc. may be realized in part or in whole in hardware, for example by designing them as integrated circuits. Furthermore, the above-mentioned configurations, functions, etc. may be realized in software by a processor interpreting and executing a program that realizes each function. Information on the programs, tables, files, etc. that realize each function can be stored in a recording device such as a memory, hard disk, or SSD (Solid State Drive), or in a recording medium such as an IC card, SD card, or DVD.
また、上記の各図において、制御線や情報線は説明上必要と考えられるものを示しており、必ずしも実装上の全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。 In addition, in each of the above diagrams, the control lines and information lines shown are those considered necessary for explanation, and do not necessarily show all of the control lines and information lines in the actual implementation. In reality, it can be assumed that almost all components are interconnected.
本発明は、時系列で変化する展開や筋を有するメディアコンテンツの類似度を計算するコンテンツ類似システムおよびコンテンツ検索・推奨システムに利用可能である。 The present invention can be used in content similarity systems and content search and recommendation systems that calculate the similarity of media content that has a development or plot that changes over time.
1…コンテンツ類似計算システム、2…ネットワーク、3…コンテンツ検索・推奨システム、
11…コンテンツ入力部、12…意味波形抽出部、13…時間・周波数領域変換部、14…類似計算部、
31…条件コンテンツ入力部、32…コンテンツ取出部、33…コンテンツ類似計算部、34…結果コンテンツ出力部34、35…コンテンツDB、
41…メディアコンテンツ、41a…メディアコンテンツA、41b…メディアコンテンツB、42…意味波形、42a…意味波形A、42b…意味波形B、43…意味周波数スペクトル、43a…意味周波数スペクトルA、43b…意味周波数スペクトルB、44…意味周波数スペクトルベクトル、45…類似度
51…ウィンドウ
1...Content similarity calculation system, 2...Network, 3...Content search and recommendation system,
11 ... content input unit, 12 ... semantic waveform extraction unit, 13 ... time-frequency domain conversion unit, 14 ... similarity calculation unit,
31: condition content input unit, 32: content extraction unit, 33: content similarity calculation unit, 34: result content output unit, 35: content DB,
41...media content, 41a...media content A, 41b...media content B, 42...semantic waveform, 42a...semantic waveform A, 42b...semantic waveform B, 43...semantic frequency spectrum, 43a...semantic frequency spectrum A, 43b...semantic frequency spectrum B, 44...semantic frequency spectrum vector, 45...similarity, 51...window
Claims (3)
入力された2以上のメディアコンテンツについて、それぞれ複数の意味項目についてその影響の程度の変化を抽出して意味波形のデータとして出力する意味波形抽出部と、
前記各メディアコンテンツの前記各意味波形のデータからフーリエ変換により意味周波数スペクトルを取得して出力する時間・周波数領域変換部と、
前記各メディアコンテンツについて、それぞれ、前記各意味周波数スペクトルのデータを要素とする意味周波数スペクトルベクトルを生成し、前記意味周波数スペクトルベクトル間のコサイン類似度を計算して出力する類似計算部と、
を有する、コンテンツ類似計算システム。 A content similarity calculation system for calculating a similarity between media contents whose contents change over time, comprising:
a semantic waveform extraction unit for extracting changes in the degree of influence of a plurality of semantic items for each of two or more input media contents and outputting the changes as semantic waveform data;
a time-frequency domain transform unit that performs a Fourier transform on the semantic waveform data of each of the media contents to obtain and output a semantic frequency spectrum;
a similarity calculation unit that generates a semantic frequency spectrum vector having data of each of the semantic frequency spectra as elements for each of the media contents, calculates and outputs a cosine similarity between the semantic frequency spectrum vectors;
A content similarity calculation system comprising:
前記意味波形抽出部は、
前記メディアコンテンツを所定の時間幅で区切った各ウィンドウにおける特徴項目に係る単語の出現数と、前記各ウィンドウの時間との対応からなる単語行列と、前記特徴項目に係る単語と、前記各意味項目との対応からなる変換行列とに基づいて、前記変換行列との積が前記単語行列となるようなメディアコンテンツ行列を取得し、前記メディアコンテンツ行列のデータに基づいて前記各意味波形のデータを得る、コンテンツ類似計算システム。 2. The content similarity calculation system according to claim 1,
The semantic waveform extraction unit
A content similarity calculation system which obtains a media content matrix whose product with the transformation matrix becomes the word matrix based on a word matrix showing the correspondence between the number of occurrences of words related to feature items in each window obtained by dividing the media content into a predetermined time width and the time of each window, and a transformation matrix showing the correspondence between the words related to the feature items and each of the semantic items, and obtains data for each of the semantic waveforms based on the media content matrix data.
請求項1に記載のコンテンツ類似計算システムからなるコンテンツ類似計算部と、
前記コンテンツ類似計算部によりそれぞれ計算された、前記各第1のメディアコンテンツと前記第2のメディアコンテンツとの類似度に基づいて、前記類似度が所定の条件を満たす前記第1のメディアコンテンツを検索結果として出力する結果コンテンツ出力部と、
を有する、コンテンツ検索・推奨システム。 A content search and recommendation system for searching for media content similar to a specified second media content from a content storage unit in which a plurality of first media content whose contents change over time is stored, comprising:
A content similarity calculation unit comprising the content similarity calculation system according to claim 1;
a result content output unit that outputs, as a search result, the first media content whose similarity satisfies a predetermined condition based on the similarity between each of the first media content and the second media content calculated by the content similarity calculation unit;
A content search and recommendation system having the above.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021112077A JP7682525B2 (en) | 2021-07-06 | 2021-07-06 | Content similarity calculation system and content search and recommendation system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021112077A JP7682525B2 (en) | 2021-07-06 | 2021-07-06 | Content similarity calculation system and content search and recommendation system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023008474A JP2023008474A (en) | 2023-01-19 |
| JP7682525B2 true JP7682525B2 (en) | 2025-05-26 |
Family
ID=85111753
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021112077A Active JP7682525B2 (en) | 2021-07-06 | 2021-07-06 | Content similarity calculation system and content search and recommendation system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7682525B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116108955A (en) * | 2022-11-18 | 2023-05-12 | 中国电信股份有限公司 | Method, device, equipment and storage medium for escalation and early warning of social conflicts and disputes |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004046370A (en) | 2002-07-09 | 2004-02-12 | Sony Corp | Similarity calculation method and apparatus, program, and recording medium |
| JP2008269065A (en) | 2007-04-17 | 2008-11-06 | Nippon Telegr & Teleph Corp <Ntt> | User support method, user support device, and user support program |
-
2021
- 2021-07-06 JP JP2021112077A patent/JP7682525B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004046370A (en) | 2002-07-09 | 2004-02-12 | Sony Corp | Similarity calculation method and apparatus, program, and recording medium |
| JP2008269065A (en) | 2007-04-17 | 2008-11-06 | Nippon Telegr & Teleph Corp <Ntt> | User support method, user support device, and user support program |
Non-Patent Citations (1)
| Title |
|---|
| 稲荷 太良,歌詞の時系列トピック分析を用いた楽曲推薦システムの構築,第13回データ工学と情報マネジメントに関するフォーラム (第19回日本データベース学会年次大会),DEIM Forum 2020 D25-2,日本,日本データベース学会,2021年03月03日 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023008474A (en) | 2023-01-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Large et al. | On time series classification with dictionary-based classifiers | |
| CN108280114B (en) | Deep learning-based user literature reading interest analysis method | |
| US7772478B2 (en) | Understanding music | |
| Zhai et al. | Online latent Dirichlet allocation with infinite vocabulary | |
| CN111797214A (en) | Question screening method, device, computer equipment and medium based on FAQ database | |
| CN109376309A (en) | Method and device for document recommendation based on semantic tags | |
| CN113722512A (en) | Text retrieval method, device and equipment based on language model and storage medium | |
| CN114880447A (en) | Information retrieval method, device, equipment and storage medium | |
| JP7251623B2 (en) | Parameter learning device, parameter learning method, and program | |
| CN110019669A (en) | A kind of text searching method and device | |
| KR102345401B1 (en) | methods and apparatuses for content retrieval, devices and storage media | |
| CN117992573A (en) | Text expansion-based information retrieval method and device, electronic equipment and medium | |
| JP2016018286A (en) | Action type determination device, action type determination method, and action type determination program | |
| Melo et al. | A semantic search system for the Supremo Tribunal de Justiça | |
| Wang et al. | Multivariate time series similarity searching | |
| JP7682525B2 (en) | Content similarity calculation system and content search and recommendation system | |
| CN111339778B (en) | Text processing method, device, storage medium and processor | |
| CN109977286B (en) | Information retrieval method based on content | |
| JP2023071785A (en) | Acoustic signal retrieval device, acoustic signal retrieval method, data retrieval device, data retrieval method, program | |
| JP2009301140A (en) | Text segmentation device, method, program, and computer-readable recording medium | |
| JP2013101679A (en) | Text segmentation device, method, program, and computer-readable recording medium | |
| JP2005149014A (en) | Document-related vocabulary acquisition method, apparatus and program | |
| JP5869948B2 (en) | Passage dividing method, apparatus, and program | |
| JP2006338342A (en) | Word vector generation device, word vector generation method and program | |
| CN118260414A (en) | A timeline summary method based on event evolution stages |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240611 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250430 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250502 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250507 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7682525 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |