Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6690445B2 - SOUND INFORMATION SETTING METHOD AND SOUND INFORMATION SETTING DEVICE - Google Patents
[go: Go Back, main page]

JP6690445B2 - SOUND INFORMATION SETTING METHOD AND SOUND INFORMATION SETTING DEVICE - Google Patents

SOUND INFORMATION SETTING METHOD AND SOUND INFORMATION SETTING DEVICE Download PDF

Info

Publication number
JP6690445B2
JP6690445B2 JP2016135965A JP2016135965A JP6690445B2 JP 6690445 B2 JP6690445 B2 JP 6690445B2 JP 2016135965 A JP2016135965 A JP 2016135965A JP 2016135965 A JP2016135965 A JP 2016135965A JP 6690445 B2 JP6690445 B2 JP 6690445B2
Authority
JP
Japan
Prior art keywords
unit
image
period
sound information
periods
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016135965A
Other languages
Japanese (ja)
Other versions
JP2018005171A (en
Inventor
藤島 琢哉
琢哉 藤島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2016135965A priority Critical patent/JP6690445B2/en
Publication of JP2018005171A publication Critical patent/JP2018005171A/en
Application granted granted Critical
Publication of JP6690445B2 publication Critical patent/JP6690445B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)

Description

本発明は、音響信号が表す音にコード名等の音情報を設定する技術に関する。   The present invention relates to a technique of setting sound information such as a chord name in a sound represented by an acoustic signal.

例えば楽曲の再生音を聴取しながら楽曲の期間毎にコード名等の音情報を利用者が指定するためには、非常に煩雑で専門的な作業が必要である。そこで、音響信号の解析によりコードを推定する技術が例えば特許文献1に開示されている。   For example, in order for the user to specify the sound information such as the chord name for each period of the music while listening to the reproduced sound of the music, very complicated and specialized work is required. Therefore, a technique for estimating a code by analyzing an acoustic signal is disclosed in Patent Document 1, for example.

特開2014−235328号公報JP, 2014-235328, A

しかし、音響信号の解析によりコード等の音情報を高精度に解析することは容易ではない。例えば歌唱音声や打楽器音等の複数の音響成分の混合音から高精度にコードを推定することは実際には困難である。以上の事情を考慮して、本発明は、利用者が音情報を効率的に指示できるようにすることを目的とする。   However, it is not easy to analyze sound information such as chords with high accuracy by analyzing acoustic signals. For example, it is actually difficult to accurately estimate a code from a mixed sound of a plurality of acoustic components such as a singing voice and a percussion instrument sound. In consideration of the above circumstances, an object of the present invention is to enable a user to efficiently instruct sound information.

以上の課題を解決するために、本発明の第1態様に係る音情報設定方法は、コンピュータシステムが、音響信号の特徴量を複数の単位期間の各々について抽出し、複数の単位期間の各々に対応する単位画像を配置した解析画像を、各単位期間の特徴量が類似するほど当該各単位期間の単位画像の表示態様が近似するように、表示装置に表示させ、解析画像から利用者が選択した単位画像に対応する1以上の単位期間を含む設定期間について音情報を設定する。以上の態様では、各単位期間の特徴量が類似するほど各単位画像の表示態様が近似する解析画像が表示装置に表示され、利用者が解析画像から選択した1個以上の単位期間を含む設定期間について音情報が設定される。したがって、利用者が音情報を効率的に指示することが可能である。   In order to solve the above problems, in the sound information setting method according to the first aspect of the present invention, a computer system extracts a characteristic amount of an acoustic signal for each of a plurality of unit periods, The analysis image on which the corresponding unit image is arranged is displayed on the display device so that the display mode of the unit image of each unit period becomes closer as the feature amount of each unit period is similar, and the user selects from the analysis image. The sound information is set for a set period including one or more unit periods corresponding to the selected unit image. In the above aspect, the analysis image in which the display aspect of each unit image is closer to each other as the feature amount of each unit period is similar is displayed on the display device, and the setting including one or more unit periods selected from the analysis image by the user is performed. Sound information is set for the period. Therefore, the user can efficiently instruct the sound information.

本発明の第2態様に係る音情報設定方法は、コンピュータシステムが、音響信号の特徴量を複数の単位期間の各々について抽出し、複数の単位期間の各々に対応する第1単位画像を時間軸に沿って配置した時系列画像と、複数の単位期間の各々に対応する第2単位画像を各単位期間の特徴量の距離に応じた間隔で座標平面に配置した分布画像とを、各単位期間の特徴量が類似するほど、当該各単位期間の第1単位画像の表示態様が近似するとともに当該各単位期間の第2単位画像の表示態様が近似するように、表示装置に表示させ、時系列画像から利用者が選択した第1単位画像または分布画像から利用者が選択した第2単位画像に対応する1以上の単位期間を含む設定期間について音情報を設定する。以上の態様では、各単位期間の特徴量が類似するほど、当該各単位期間の第1単位画像の表示態様が近似するとともに当該各単位期間の第2単位画像の表示態様が近似する画像が表示装置に表示され、利用者が選択した1個以上の単位期間を含む設定期間について音情報が設定される。したがって、利用者が音情報を効率的に指示することが可能である。   In the sound information setting method according to the second aspect of the present invention, the computer system extracts the characteristic amount of the acoustic signal for each of the plurality of unit periods, and sets the first unit image corresponding to each of the plurality of unit periods on the time axis. And a distribution image in which the second unit images corresponding to each of the plurality of unit periods are arranged on the coordinate plane at intervals according to the distance of the feature amount of each unit period. The more similar the feature amount is, the closer the display mode of the first unit image in each unit period is approximated, and the closer the display mode of the second unit image in each unit period is approximated. The sound information is set for a set period including one or more unit periods corresponding to the first unit image selected by the user from the image or the second unit image selected by the user from the distribution image. In the above aspect, the more similar the feature amount of each unit period is, the more similar the display aspect of the first unit image of each unit period is, and the closer the display aspect of the second unit image of each unit period is is displayed. Sound information is set for a set period displayed on the device and including one or more unit periods selected by the user. Therefore, the user can efficiently instruct the sound information.

第2態様の好適例において、時系列画像における第1単位画像が選択された場合に、当該第1単位画像の表示態様を変更するとともに、分布画像のうち当該第1単位画像と共通の単位期間に対応する第2単位画像の表示態様を変更する。また、第2態様の好適例において、分布画像における第2単位画像が選択された場合に、当該第2単位画像の表示態様を変更するとともに、時系列画像のうち当該第2単位画像と共通の単位期間に対応する第1単位画像の表示態様を変更する。   In the preferred example of the second aspect, when the first unit image in the time-series image is selected, the display aspect of the first unit image is changed and the unit period common to the first unit image in the distribution image. The display mode of the second unit image corresponding to is changed. Further, in the preferred example of the second mode, when the second unit image in the distribution image is selected, the display mode of the second unit image is changed, and the same time unit image as the second unit image is shared. The display mode of the first unit image corresponding to the unit period is changed.

第2態様の好適例において、時系列画像の第1単位画像を利用者が選択した場合に、当該第1単位画像が表す単位期間を含む設定期間と、当該単位期間に特徴量が類似する単位期間を含む他の設定期間とを設定する。以上の態様では、利用者が選択した第1単位画像が表す単位期間を含む設定期間と、当該単位期間に特徴量が類似する単位期間を含む他の設定期間とが一括的に設定される。したがって、各設定期間を利用者が個別に指定する必要がある構成と比較して、利用者が複数の設定期間を指定するための負荷を軽減することが可能である。   In a preferred example of the second aspect, when the user selects the first unit image of the time-series image, a set period including the unit period represented by the first unit image, and a unit whose feature amount is similar to the unit period. Other set period including the period is set. In the above aspect, the set period including the unit period represented by the first unit image selected by the user and the other set period including the unit period in which the feature amount is similar to the unit period are collectively set. Therefore, it is possible to reduce the load for the user to specify a plurality of setting periods, as compared with a configuration in which the user needs to specify each setting period individually.

本発明の好適な態様に係る音情報設定装置は、音響信号の特徴量を複数の単位期間の各々について抽出する特徴抽出部と、複数の単位期間の各々に対応する単位画像を配置した解析画像を、各単位期間の特徴量が類似するほど当該各単位期間の単位画像の表示態様が近似するように、表示装置に表示させる表示制御部と、解析画像から利用者が選択した単位画像に対応する1以上の単位期間を含む設定期間について音情報を設定する情報設定部とを具備する。   A sound information setting device according to a preferred aspect of the present invention is a feature extraction unit that extracts a feature amount of an acoustic signal for each of a plurality of unit periods, and an analysis image in which unit images corresponding to each of the plurality of unit periods are arranged. Corresponding to the unit image selected by the user from the display control unit and the analysis image so that the display mode of the unit image in each unit period becomes closer as the feature amount of each unit period becomes closer. And an information setting unit that sets sound information for a set period including one or more unit periods.

本発明の第1実施形態に係る音情報設定装置の構成図である。It is a block diagram of the sound information setting device which concerns on 1st Embodiment of this invention. 時系列画像の説明図である。It is explanatory drawing of a time series image. 分布画像の説明図である。It is explanatory drawing of a distribution image. 分布画像における各単位画像の表示態様を選定するための色相環の説明図である。It is an explanatory view of a hue circle for selecting a display mode of each unit image in a distribution image. 設定期間の説明図である。It is explanatory drawing of a setting period. 設定期間および音情報を設定する手順の説明図である。It is explanatory drawing of the procedure which sets a setting period and sound information. 音情報設定処理のフローチャートである。It is a flow chart of sound information setting processing. 第2実施形態において設定期間および音情報を設定する手順の説明図である。It is explanatory drawing of the procedure which sets a setting period and sound information in 2nd Embodiment. 変形例における彩色画像の説明図である。It is explanatory drawing of the coloring image in a modification.

<第1実施形態>
図1は、本発明の第1実施形態に係る音情報設定装置100の構成図である。第1実施形態の音情報設定装置100は、制御装置10と記憶装置12と表示装置14と入力装置16とを具備するコンピュータシステムで実現される。例えば携帯電話機、スマートフォンまたはパーソナルコンピュータ等の各種の情報処理装置が音情報設定装置100として利用され得る。
<First Embodiment>
FIG. 1 is a configuration diagram of a sound information setting device 100 according to the first embodiment of the present invention. The sound information setting device 100 of the first embodiment is realized by a computer system including a control device 10, a storage device 12, a display device 14, and an input device 16. For example, various information processing devices such as mobile phones, smartphones, and personal computers can be used as the sound information setting device 100.

記憶装置12は、制御装置10が実行するプログラムと制御装置10が使用する各種のデータとを記憶する。例えば磁気記録媒体または半導体記録媒体等の公知の記録媒体が記憶装置12として利用され得る。相互に別体に構成された同種または異種の複数の記録媒体の組合せを記憶装置12として利用することも可能である。音情報設定装置100とは別体の記憶装置12(例えばクラウドストレージ)を設置し、制御装置10が通信網を介して記憶装置12に対する書込や読出を実行してもよい。   The storage device 12 stores a program executed by the control device 10 and various data used by the control device 10. For example, a known recording medium such as a magnetic recording medium or a semiconductor recording medium can be used as the storage device 12. It is also possible to use, as the storage device 12, a combination of a plurality of recording media of the same type or different types that are configured separately from each other. A storage device 12 (for example, cloud storage) separate from the sound information setting device 100 may be installed, and the control device 10 may perform writing and reading to and from the storage device 12 via a communication network.

第1実施形態の記憶装置12は、楽音や音声等の各種の音を表す音響信号Xを記憶する。音響信号Xは、例えば、複数の楽器の演奏音の波形を表す時間領域の信号(複数のサンプルの系列)である。なお、例えば光ディスク等の記録媒体に記録された音響信号Xを再生する再生装置から音情報設定装置100に音響信号Xを供給することも可能である。音響信号Xは任意の形式のファイルとして記憶装置12に記憶される。   The storage device 12 of the first embodiment stores acoustic signals X representing various sounds such as musical sounds and voices. The acoustic signal X is, for example, a signal in the time domain (a series of a plurality of samples) that represents the waveforms of performance sounds of a plurality of musical instruments. It is also possible to supply the acoustic signal X to the sound information setting device 100 from a reproducing device that reproduces the acoustic signal X recorded on a recording medium such as an optical disc. The acoustic signal X is stored in the storage device 12 as a file of any format.

第1実施形態の音情報設定装置100は、音響信号Xの特定の期間(以下「設定期間」という)について音情報Zを設定する情報処理装置である。音響信号Xを時間軸上で区分した複数の設定期間の各々について音情報Zが設定される。音情報Zは、音響信号Xが表す音の特性に関する情報である。第1実施形態では、音響信号Xが表す音のコード名を音情報Zとして例示する。   The sound information setting device 100 of the first embodiment is an information processing device that sets the sound information Z for a specific period of the acoustic signal X (hereinafter referred to as “setting period”). The sound information Z is set for each of a plurality of setting periods in which the acoustic signal X is divided on the time axis. The sound information Z is information regarding the characteristics of the sound represented by the acoustic signal X. In the first embodiment, the chord name of the sound represented by the acoustic signal X is exemplified as the sound information Z.

図1の表示装置14は、例えば液晶表示パネルで構成され、制御装置10による制御のもとで各種の画像を表示する。入力装置16は、利用者からの指示を受付ける操作機器である。例えば利用者が操作する複数の操作子、または、表示装置14の表示面に対する接触を検知するタッチパネルが入力装置16として好適に利用される。   The display device 14 of FIG. 1 is composed of, for example, a liquid crystal display panel, and displays various images under the control of the control device 10. The input device 16 is an operation device that receives an instruction from a user. For example, a plurality of operators operated by the user or a touch panel that detects contact with the display surface of the display device 14 is preferably used as the input device 16.

制御装置10は、例えばCPU(Central Processing Unit)等の汎用の処理回路で構成され、音情報設定装置100の各要素を統括的に制御する。第1実施形態の制御装置10は、記憶装置12に記憶されたプログラムを実行することで、音響信号Xの各設定期間に音情報Zを設定するための複数の機能(特徴抽出部22,表示制御部24,情報設定部26)を実現する。なお、制御装置10の機能を複数の装置に分散した構成、または、制御装置10の機能の一部または全部を専用の電子回路が実現する構成も採用され得る。   The control device 10 is configured by a general-purpose processing circuit such as a CPU (Central Processing Unit), and controls each element of the sound information setting device 100 as a whole. The control device 10 of the first embodiment executes a program stored in the storage device 12 to execute a plurality of functions for setting the sound information Z in each setting period of the acoustic signal X (feature extraction unit 22, display). The control unit 24 and the information setting unit 26) are realized. A configuration in which the functions of the control device 10 are distributed to a plurality of devices, or a configuration in which a dedicated electronic circuit realizes some or all of the functions of the control device 10 may be employed.

特徴抽出部22は、音響信号Xの特徴量Fを抽出する。第1実施形態の特徴抽出部22は、音響信号Xを時間軸上で区分した複数の期間(以下「単位期間」という)の各々について特徴量Fを算定する。各単位期間は、例えば数十ミリ秒から数百ミリ秒程度の時間長の期間(フレーム)である。複数の連続する単位期間で構成される設定期間毎に音情報Zが設定される。なお、時間軸上で隣合う2個の単位期間は一部が重複していてもよい。   The feature extraction unit 22 extracts the feature amount F of the acoustic signal X. The feature extraction unit 22 of the first embodiment calculates the feature amount F for each of a plurality of periods (hereinafter referred to as “unit period”) in which the acoustic signal X is divided on the time axis. Each unit period is, for example, a period (frame) having a time length of about several tens of milliseconds to several hundreds of milliseconds. The sound information Z is set for each set period including a plurality of continuous unit periods. In addition, two adjacent unit periods on the time axis may partially overlap each other.

第1実施形態の特徴量Fは、音響信号Xが表す音のコード(和音)の特徴を表す指標である。第1実施形態ではクロマベクトルを特徴量Fとして例示する。クロマベクトルは、相異なる音階音(例えば平均律の12半音の各々)に対応する複数の要素を含むベクトル(PCP:Pitch Class Profile)である。クロマベクトルのうち任意の1個の音階音に対応する要素は、音響信号Xのうち当該音階音に対応する帯域成分の強度を複数のオクターブにわたり加算または平均した数値に設定される。したがって、クロマベクトルの複数の要素のうち単位期間内のコードの各構成音に対応する要素ほど大きい数値に設定される。   The feature amount F of the first embodiment is an index representing the feature of the chord (chord) of the sound represented by the acoustic signal X. In the first embodiment, the chroma vector is exemplified as the feature amount F. The chroma vector is a vector (PCP: Pitch Class Profile) including a plurality of elements corresponding to different tones (for example, 12 semitones of equal temperament). An element corresponding to any one scale tone of the chroma vector is set to a numerical value obtained by adding or averaging the intensities of band components corresponding to the scale tone of the acoustic signal X over a plurality of octaves. Therefore, among the plurality of elements of the chroma vector, the element corresponding to each constituent sound of the chord within the unit period is set to a larger numerical value.

表示制御部24は、表示装置14に画像を表示させる。第1実施形態の表示制御部24は、音響信号Xの複数の単位期間の各々に対応する画像(以下「単位画像」という)を配置した解析画像を表示装置14に表示させる。第1実施形態では、図2の時系列画像GAと図3の分布画像GBとが解析画像として表示装置14に表示される。時系列画像GAと分布画像GBとは、例えば相互に並列に表示(例えば同一の画面内に表示)される。   The display control unit 24 causes the display device 14 to display an image. The display control unit 24 of the first embodiment causes the display device 14 to display an analysis image in which images (hereinafter referred to as “unit images”) corresponding to each of the plurality of unit periods of the acoustic signal X are arranged. In the first embodiment, the time series image GA of FIG. 2 and the distribution image GB of FIG. 3 are displayed on the display device 14 as analysis images. The time-series image GA and the distribution image GB are, for example, displayed in parallel with each other (for example, displayed on the same screen).

図2に例示される通り、時系列画像GAは、音響信号Xの複数の単位期間の各々に対応する単位画像UA(第1単位画像の例示)を時間軸に沿って配列した画像である。各単位画像UAは、音響信号Xの1個の単位期間を表す画像である。図2では、各単位画像UAを矩形状の図形とした場合が例示されている。   As illustrated in FIG. 2, the time-series image GA is an image in which unit images UA (exemplification of the first unit image) corresponding to each of the plurality of unit periods of the acoustic signal X are arranged along the time axis. Each unit image UA is an image representing one unit period of the acoustic signal X. FIG. 2 exemplifies a case where each unit image UA is a rectangular figure.

図3に例示される通り、分布画像GBは、音響信号Xの複数の単位期間の各々に対応する単位画像UB(第2単位画像の例示)を座標平面に配置した画像である。各単位画像UBは、音響信号Xの1個の単位期間を表す画像である。図3では、各単位画像を円形状の図形とした場合が例示されている。以上の説明から理解される通り、音響信号Xの複数の単位期間の各々について単位画像UAと単位画像UBとが表示装置14に表示される。すなわち、時系列画像GAの各単位画像UAと分布画像GBの各単位画像UBとは1対1に対応する。   As illustrated in FIG. 3, the distribution image GB is an image in which the unit image UB (illustration of the second unit image) corresponding to each of the plurality of unit periods of the acoustic signal X is arranged on the coordinate plane. Each unit image UB is an image representing one unit period of the acoustic signal X. In FIG. 3, the case where each unit image is a circular figure is illustrated. As understood from the above description, the unit image UA and the unit image UB are displayed on the display device 14 for each of the plurality of unit periods of the acoustic signal X. That is, each unit image UA of the time-series image GA and each unit image UB of the distribution image GB have a one-to-one correspondence.

図3の分布画像GBにおける複数の単位画像UBは、各単位期間の特徴量Fの類似性(すなわち類否の度合)に応じた間隔で座標平面に配置される。具体的には、表示制御部24は、音響信号Xの複数の単位期間から2個の単位期間を選択する全通りの組合せについて2個の単位期間の間の特徴量Fの距離を算定する。距離は、2個の単位期間の相互間における特徴量Fの類似性の指標であり、例えばユークリッド距離またはコサイン距離が好適例である。特徴量Fが類似する(すなわち距離が小さい)各単位期間の単位画像UBは近い位置に配置され、特徴量Fが乖離する各単位期間の単位画像UBは遠い位置に配置される。したがって、例えば相互に類似または共通するコードが演奏された各単位期間の単位画像UBは、座標平面内の特定の領域に集中する。座標平面に対する複数の単位画像UBの配置には、多次元尺度構成法(MDS:Multi Dimensional Scaling)等の公知の解析技術が任意に利用され得る。   The plurality of unit images UB in the distribution image GB of FIG. 3 are arranged on the coordinate plane at intervals according to the similarity (that is, the degree of similarity) of the feature amount F of each unit period. Specifically, the display control unit 24 calculates the distance of the feature amount F between the two unit periods for all combinations that select two unit periods from the plurality of unit periods of the acoustic signal X. The distance is an index of the similarity of the feature amount F between two unit periods, and for example, a Euclidean distance or a cosine distance is a suitable example. The unit images UB of each unit period in which the feature amounts F are similar (that is, the distance is small) are arranged at close positions, and the unit images UB of each unit period in which the feature amounts F deviate are arranged at distant positions. Therefore, for example, the unit images UB of each unit period in which similar or common chords are played are concentrated in a specific area in the coordinate plane. For arranging the plurality of unit images UB with respect to the coordinate plane, a known analysis technique such as a multidimensional scaling method (MDS) can be arbitrarily used.

図2および図3に例示される通り、第1実施形態の表示制御部24は、時系列画像GAにおける各単位画像UAの表示態様と分布画像GBにおける各単位画像UBの表示態様とを、各単位期間の特徴量Fに応じて可変に設定する。表示態様とは、視覚的に弁別可能な画像の性状を意味する。例えば、色の三属性である彩度、明度(階調)または色相(色調)が表示態様の典型例である。   As illustrated in FIG. 2 and FIG. 3, the display control unit 24 of the first embodiment sets the display mode of each unit image UA in the time-series image GA and the display mode of each unit image UB in the distribution image GB as follows. It is variably set according to the feature amount F of the unit period. The display mode means a property of an image that can be visually discriminated. For example, the three attributes of color, saturation, lightness (gradation), or hue (hue) are typical examples of display modes.

具体的には、表示制御部24は、図3の分布画像GBについて、各単位期間の特徴量Fが相互に類似するほど各単位期間の単位画像UBの表示態様が近似するように、各単位画像UBの表示態様を選定する。すなわち、音響信号Xの任意の2個の単位期間の間で特徴量Fが類似するほど、各単位期間に対応する2個の単位画像UBの表示態様は相互に近似し、2個の単位期間の間で特徴量Fが相違するほど、各単位期間に対応する2個の単位画像UBの表示態様の相違は顕著となる。   Specifically, with respect to the distribution image GB of FIG. 3, the display control unit 24 makes each unit such that the display mode of the unit image UB of each unit period becomes closer as the feature amount F of each unit period becomes similar to each other. The display mode of the image UB is selected. That is, as the feature amount F is similar between any two unit periods of the acoustic signal X, the display modes of the two unit images UB corresponding to each unit period are similar to each other, and the two unit periods UB are similar to each other. The difference in the feature amount F between the two becomes more remarkable the difference in the display mode of the two unit images UB corresponding to each unit period.

具体的には、表示制御部24は、複数の単位画像UBの重心P0を中心とした円周方向に沿って色相が変化し、かつ、重心P0を中心とした半径方向に沿って彩度が変化するように、各単位画像UBの表示態様を選定する。例えば、図4に例示される通り、円周方向に沿って色相が連続的に変化するとともに半径方向に沿って彩度が連続的に変化する色相環を想定する。表示制御部24は、色相環の中心が複数の単位画像UBの重心P0に位置するように色相環を分布画像GBに重ねて配置し、色相環のうち各単位画像UBが位置する地点の色相および彩度を、当該単位画像UBの色相および彩度として選択する。したがって、音響信号Xの任意の2個の単位期間の間で特徴量Fが類似するほど、各単位期間に対応する2個の単位画像UBの色相および彩度が相互に近似する。以上に例示した分布画像GBを視認した利用者は、音響信号X内のコードの概略的な種類数や頻度を確認することが可能である。   Specifically, the display control unit 24 changes the hue along the circumferential direction around the center of gravity P0 of the plurality of unit images UB, and the saturation along the radial direction around the center of gravity P0. The display mode of each unit image UB is selected so as to change. For example, as illustrated in FIG. 4, assume a hue circle in which the hue continuously changes in the circumferential direction and the saturation continuously changes in the radial direction. The display control unit 24 arranges the hue circles so as to overlap the distribution image GB so that the center of the hue circle is located at the center of gravity P0 of the plurality of unit images UB, and the hue at the point where each unit image UB is located in the hue circle. And saturation are selected as the hue and saturation of the unit image UB. Therefore, as the feature amount F becomes more similar between any two unit periods of the acoustic signal X, the hue and saturation of the two unit images UB corresponding to each unit period are closer to each other. The user who visually recognizes the distribution image GB illustrated above can check the approximate number and frequency of types of codes in the acoustic signal X.

また、表示制御部24は、図2に例示される通り、時系列画像GA内で任意の1個の単位期間に対応する単位画像UAを、分布画像GB内で当該単位期間に対応する単位画像UBと同等の表示態様で表示する。すなわち、音響信号Xの共通の単位期間に対応する単位画像UAと単位画像UBとは同様の表示態様で表示される。したがって、時系列画像GAにおいても分布画像GBと同様に、音響信号Xの任意の2個の単位期間の間で特徴量Fが類似するほど、各単位期間に対応する2個の単位画像UAの表示態様は相互に近似し、2個の単位期間の間で特徴量Fが乖離するほど、各単位期間に対応する2個の単位画像UAの表示態様の相違は顕著となる。   In addition, as illustrated in FIG. 2, the display control unit 24 displays the unit image UA corresponding to any one unit period in the time series image GA and the unit image corresponding to the unit period in the distribution image GB. It is displayed in the same display mode as UB. That is, the unit image UA and the unit image UB corresponding to the common unit period of the acoustic signal X are displayed in the same display mode. Therefore, similarly to the distribution image GB in the time-series image GA, the more similar the feature amount F is between the arbitrary two unit periods of the acoustic signal X, the more the two unit images UA corresponding to each unit period. The display modes are similar to each other, and the more the feature amounts F deviate between the two unit periods, the more remarkable the display modes of the two unit images UA corresponding to the respective unit periods become.

以上の説明から理解される通り、第1実施形態の表示制御部24は、各単位期間の特徴量Fが類似するほど、時系列画像GA内の各単位画像UAの表示態様が近似するとともに分布画像GB内の各単位画像UBの表示態様が近似するように、時系列画像GAと分布画像GBとを表示装置14に表示させる。したがって、表示装置14に表示された時系列画像GAを視認した利用者は、音響信号Xの時間軸上の各単位期間における特徴量Fの類否または異同を確認することが可能である。第1実施形態の特徴量Fはコードの特徴を反映したクロマベクトルであるから、時系列画像GAを視認した利用者は、音響信号Xにおけるコードの遷移(例えば任意の1個のコードが継続する期間)を把握することが可能である。   As is understood from the above description, the display control unit 24 of the first embodiment approximates the display mode of each unit image UA in the time-series image GA and the distribution as the feature amount F of each unit period is similar. The time series image GA and the distribution image GB are displayed on the display device 14 so that the display modes of the respective unit images UB in the image GB are similar. Therefore, the user who visually recognizes the time-series image GA displayed on the display device 14 can confirm whether the feature amount F is similar or different in each unit period on the time axis of the acoustic signal X. Since the feature amount F of the first embodiment is a chroma vector reflecting the feature of the code, the user who visually recognizes the time series image GA changes the code in the acoustic signal X (for example, any one code continues). It is possible to understand the period).

図1の情報設定部26は、音響信号Xの各設定期間について音情報Zを設定する。利用者は、入力装置16を適宜に操作することで、音響信号Xの設定期間と当該設定期間の音情報Zとを任意に指定することが可能である。具体的には、時系列画像GAに対する利用者からの指示で1個以上の設定期間が指定される。第1実施形態の情報設定部26は、利用者が指定した各設定期間について、利用者が当該設定期間に対して指定した音情報Zを設定する。具体的には、情報設定部26は、設定期間毎に音情報Zを示す設定データを利用者からの指示に応じて生成および更新する。設定データは、各設定期間の始点および終点と、当該設定期間に設定された音情報Zとの対応を規定するデータであり、記憶装置12に格納される。   The information setting unit 26 of FIG. 1 sets the sound information Z for each setting period of the acoustic signal X. The user can arbitrarily specify the set period of the acoustic signal X and the sound information Z of the set period by appropriately operating the input device 16. Specifically, one or more set periods are designated by the user's instruction for the time-series image GA. The information setting unit 26 of the first embodiment sets, for each setting period specified by the user, the sound information Z specified by the user for the setting period. Specifically, the information setting unit 26 generates and updates the setting data indicating the sound information Z for each setting period according to the instruction from the user. The setting data is data that defines the correspondence between the start and end points of each setting period and the sound information Z set in the setting period, and is stored in the storage device 12.

表示制御部24は、音響信号Xの各設定期間と設定期間毎の音情報Zの内容(具体的にはコード名)とを解析画像に表示する。具体的には、表示制御部24は、図5に例示される通り、時系列画像GAに各設定期間を表示(具体的には枠線により強調表示)するとともに当該設定期間の近傍に音情報Zを表示し、分布画像GBのうち設定期間に対応する1個以上の単位画像UBの近傍に音情報Zを表示する。第1実施形態では、利用者は、以下に詳述する通り、表示装置14に表示された解析画像(時系列画像GA,分布画像GB)を入力装置16により操作することで、任意の1個以上の単位期間を設定期間として指定するとともに当該設定期間の音情報Zを指定することが可能である。   The display control unit 24 displays each set period of the acoustic signal X and the content (specifically, the chord name) of the sound information Z for each set period on the analysis image. Specifically, as illustrated in FIG. 5, the display control unit 24 displays each set period on the time-series image GA (specifically, it is highlighted by a frame line), and the sound information is displayed near the set period. Z is displayed, and the sound information Z is displayed in the vicinity of one or more unit images UB corresponding to the set period in the distribution image GB. In the first embodiment, as described in detail below, the user operates the analysis image (time series image GA, distribution image GB) displayed on the display device 14 with the input device 16 to select an arbitrary one. It is possible to specify the above unit period as the set period and also specify the sound information Z of the set period.

まず、利用者は、時系列画像GAの複数の単位画像UAのうち1個以上の単位画像UAを設定期間として指定するとともに当該設定期間の音情報Zを指定することが可能である。図6は、時系列画像GAに対して設定期間および音情報Zを指定する手順の説明図である。図6に例示された手順PA1の通り、利用者は、時系列画像GAの複数の単位画像UAのうち任意の1個の単位画像UAを指定する。情報設定部26は、利用者が選択した1個の単位画像UAが表す単位期間を暫定的な設定期間として指定し、表示制御部24は当該設定期間を強調表示する。具体的には、設定期間を包囲する枠線が表示される。   First, the user can specify one or more unit images UA of the plurality of unit images UA of the time-series image GA as the setting period and also specify the sound information Z of the setting period. FIG. 6 is an explanatory diagram of a procedure for designating the set period and the sound information Z for the time-series image GA. As in the procedure PA1 illustrated in FIG. 6, the user specifies any one unit image UA of the plurality of unit images UA of the time-series image GA. The information setting unit 26 designates the unit period represented by the one unit image UA selected by the user as the provisional setting period, and the display control unit 24 highlights the setting period. Specifically, a frame line surrounding the set period is displayed.

図6に例示された手順PA2の通り、利用者は、入力装置16を適宜に操作することで、手順PA1で指定した1個の単位画像UAの周囲(前方または後方)において表示態様が類似または一致する他の単位画像UAまで設定期間を拡張することが可能である。すなわち、手順PA1で選択した1個の単位期間の前後に、当該単位期間と特徴量Fが類似する範囲内で設定期間が拡張される。情報設定部26は、利用者からの拡張の指示に応じて設定期間を更新するとともに、表示制御部24は拡張後の設定期間を強調表示する。以上の操作により1個の設定期間が画定される。なお、1個の単位区間に属する各単位期間の単位画像UAまたは単位画像UBを共通の表示態様に更新することも可能である。   As in the procedure PA2 illustrated in FIG. 6, the user appropriately operates the input device 16 so that the display mode is similar (front or rear) around the one unit image UA specified in the procedure PA1. It is possible to extend the set period to another unit image UA that matches. That is, before and after the one unit period selected in the procedure PA1, the set period is extended within the range where the unit period and the feature amount F are similar. The information setting unit 26 updates the set period according to the user's instruction for expansion, and the display control unit 24 highlights the expanded set period. By the above operation, one set period is defined. It is also possible to update the unit image UA or the unit image UB of each unit period belonging to one unit section to a common display mode.

図6に例示された手順PA3の通り、利用者は、入力装置16を適宜に操作することで、手順PA2で指定した設定期間に対して任意の音情報Z(具体的にはコード名)を指定することが可能である。情報設定部26は、利用者から指定された音情報Zを当該設定期間に設定するとともに、表示制御部24は当該音情報Zを設定期間の近傍に表示する。時系列画像GAに対して設定期間および音情報Zが指定されると、表示制御部24は、当該指定の内容を分布画像GBに反映させる。具体的には、図5に例示される通り、分布画像GB内で設定期間内の各単位期間に対応する複数の単位画像UBが強調表示される(具体的には複数の単位画像UBを包囲する枠線が表示される)とともに、当該設定期間の音情報Zを単位画像UBの近傍に表示させる。以上の説明から理解される通り、表示制御部24は、時系列画像GA内の単位画像UAが選択された場合に、当該単位画像UAの表示態様を変更するとともに、分布画像GB内で当該単位画像UAと共通の単位期間に対応する単位画像UBの表示態様を変更する。なお、以上の説明では、設定期間の拡張(PA2)後に音情報Zを設定(PA3)したが、音情報Zの設定後に設定期間を拡張することも可能である。   As in the procedure PA3 illustrated in FIG. 6, the user appropriately operates the input device 16 to generate arbitrary sound information Z (specifically, a chord name) for the set period designated in the procedure PA2. It is possible to specify. The information setting unit 26 sets the sound information Z designated by the user in the setting period, and the display control unit 24 displays the sound information Z near the setting period. When the set period and the sound information Z are designated for the time-series image GA, the display control unit 24 reflects the contents of the designation in the distribution image GB. Specifically, as illustrated in FIG. 5, a plurality of unit images UB corresponding to each unit period within the set period is highlighted in the distribution image GB (specifically, the plurality of unit images UB are surrounded. The frame information is displayed) and the sound information Z of the set period is displayed near the unit image UB. As can be understood from the above description, the display control unit 24 changes the display mode of the unit image UA when the unit image UA in the time-series image GA is selected, and the unit in the distribution image GB is changed. The display mode of the unit image UB corresponding to the unit period common to the image UA is changed. In the above description, the sound information Z is set (PA3) after the setting period is extended (PA2), but the setting period can be extended after the setting of the sound information Z.

また、利用者は、分布画像GB内の1個以上の単位画像UBを単位画像UBを、入力装置16に対する指示で任意に指定できる。分布画像GB内の単位画像UBが指定された場合、表示制御部24は、当該単位画像UBの表示態様を変更するとともに、時系列画像GAのうち利用者が指定した単位画像UBと共通の単位期間に対応する単位画像UAの表示態様を変更する。以上の説明から理解される通り、時系列画像GA内の単位画像UAおよび分布画像GB内の単位画像UBの一方の指定が他方の表示に反映される。すなわち、単位画像UAまたは単位画像UBの選択により利用者が指定した各単位期間について、単位画像UAおよび単位画像UBの双方が非選択時とは別個の表示態様で表示(すなわち強調表示)される。   In addition, the user can arbitrarily specify one or more unit images UB in the distribution image GB and the unit image UB by an instruction to the input device 16. When the unit image UB in the distribution image GB is designated, the display control unit 24 changes the display mode of the unit image UB, and a unit common to the unit image UB designated by the user in the time series image GA. The display mode of the unit image UA corresponding to the period is changed. As can be understood from the above description, designation of one of the unit image UA in the time-series image GA and the unit image UB in the distribution image GB is reflected in the display of the other. That is, for each unit period designated by the user by selecting the unit image UA or the unit image UB, both the unit image UA and the unit image UB are displayed (that is, highlighted) in a display mode different from that in the non-selected state. .

以上の説明から理解される通り、第1実施形態では、音響信号Xの共通の単位期間に対応する単位画像UAおよび単位画像UBの表示態様が、単位画像UAおよび単位画像UBの一方の指定により相互に連動して変更(すなわち強調表示)される。したがって、時系列画像GAの各単位画像UAと分布画像GBの各単位画像UBとの対応関係(すなわち、共通の単位期間に対応する単位画像UAと単位画像UBとの組合せ)を、利用者が視覚的および直観的に把握することが可能である。   As will be understood from the above description, in the first embodiment, the display mode of the unit image UA and the unit image UB corresponding to the common unit period of the acoustic signal X is determined by one of the unit image UA and the unit image UB. They are changed (that is, highlighted) in conjunction with each other. Therefore, the user can establish a correspondence relationship between each unit image UA of the time-series image GA and each unit image UB of the distribution image GB (that is, a combination of the unit image UA and the unit image UB corresponding to a common unit period). It is possible to understand visually and intuitively.

図7は、音情報設定装置100が音響信号Xの各設定期間に音情報Zを設定するための処理(以下「音情報設定処理」という)のフローチャートである。記憶装置12に記憶されたプログラムの起動の指示を契機として制御装置10が図7の音情報設定処理を開始する。   FIG. 7 is a flowchart of a process (hereinafter, referred to as “sound information setting process”) for the sound information setting device 100 to set the sound information Z in each setting period of the acoustic signal X. The control device 10 starts the sound information setting process of FIG. 7 triggered by an instruction to activate the program stored in the storage device 12.

音情報設定処理を開始すると、特徴抽出部22は、音響信号Xの各単位期間について特徴量Fを抽出する(SA1)。表示制御部24は、特徴量Fに応じた表示態様の複数の単位画像UAを配置した時系列画像GAと、特徴量Fに応じた表示態様の複数の単位画像UBを配置した分布画像GBとを表示装置14に表示させる(SA2)。   When the sound information setting process is started, the feature extraction unit 22 extracts the feature amount F for each unit period of the acoustic signal X (SA1). The display control unit 24 includes a time-series image GA in which a plurality of unit images UA in a display manner corresponding to the feature amount F are arranged, and a distribution image GB in which a plurality of unit images UB in a display manner according to the feature amount F are arranged. Is displayed on the display device 14 (SA2).

情報設定部26は、設定期間の指示を利用者から受付けたか否かを判定する(SA3)。設定期間の指示を受付けた場合(SA3:YES)、情報設定部26は、利用者からの指示に応じて設定期間を設定し(SA4)、表示制御部24は、利用者が選択した設定期間に対応する各単位画像UAおよび各単位画像UBの表示態様を変更する(SA5)。他方、設定期間が指示されない場合(SA3:NO)、情報設定部26は、設定期間の指定が解除されたか否かを判定する(SA6)。設定期間の指定が解除された場合(SA6:YES)、情報設定部26は、当該設定期間の指定を解除し(SA7)、表示制御部24は、当該設定期間に対応する単位画像UAおよび単位画像UBの表示態様を初期的な態様に変更する(SA8)。   The information setting unit 26 determines whether or not an instruction of the set period has been received from the user (SA3). When the instruction of the set period is received (SA3: YES), the information setting unit 26 sets the set period according to the instruction from the user (SA4), and the display control unit 24 sets the set period selected by the user. The display mode of each unit image UA and each unit image UB corresponding to is changed (SA5). On the other hand, when the set period is not instructed (SA3: NO), the information setting unit 26 determines whether the designation of the set period has been canceled (SA6). When the designation of the set period is released (SA6: YES), the information setting unit 26 releases the designation of the set period (SA7), and the display control unit 24 causes the unit image UA and the unit corresponding to the set period. The display mode of the image UB is changed to the initial mode (SA8).

設定期間の指定または解除が指示されない場合(SA6:NO)、情報設定部26は、音情報Zの指示を利用者から受付けたか否かを判定する(SA9)。音情報Zが指示された場合(SA9:YES)、音情報設定部26は、利用者が指示した音情報Zを現在の選択状態の設定期間に設定し(SA10)、表示制御部24は、利用者が指示した音情報Zを時系列画像GAおよび分布画像GBに表示させる(SA11)。他方、音情報Zが指示されない場合(SA9:NO)には、音情報Zの設定(SA10)および表示(SA11)は実行されない。   When the designation or cancellation of the set period is not instructed (SA6: NO), the information setting unit 26 determines whether the instruction of the sound information Z has been received from the user (SA9). When the sound information Z is instructed (SA9: YES), the sound information setting unit 26 sets the sound information Z instructed by the user in the setting period of the current selection state (SA10), and the display control unit 24 The sound information Z designated by the user is displayed on the time series image GA and the distribution image GB (SA11). On the other hand, if the sound information Z is not designated (SA9: NO), the setting (SA10) and the display (SA11) of the sound information Z are not executed.

以上の処理が完了すると、制御装置10は、音情報設定処理の終了が利用者から指示されたか否かを判定する(SA12)。音情報設定処理の終了が指示されない場合(SA12:NO)、制御装置10は処理をステップSA3に移行する。すなわち、利用者からの指示に応じた設定期間の設定(SA4,SA5)および解除(SA7,SA8)と音情報Zの設定(SA10,SA11)とが反復される。したがって、音響信号Xの複数の設定期間の各々について音情報Zが設定される。他方、利用者により終了が指示された場合(SA10:YES)、制御装置10は図7の音情報設定処理を終了する。   When the above process is completed, the control device 10 determines whether or not the user has instructed the end of the sound information setting process (SA12). When the end of the sound information setting process is not instructed (SA12: NO), the control device 10 shifts the process to step SA3. That is, setting (SA4, SA5) and cancellation (SA7, SA8) of the setting period and setting of the sound information Z (SA10, SA11) according to the instruction from the user are repeated. Therefore, the sound information Z is set for each of the plurality of setting periods of the acoustic signal X. On the other hand, when the user instructs the end (SA10: YES), the control device 10 ends the sound information setting process of FIG. 7.

以上に例示した通り、第1実施形態では、各単位期間の特徴量Fが類似するほど各単位画像(UA,UB)の表示態様が近似する解析画像が表示装置14に表示され、利用者が解析画像から選択した1個以上の単位期間を含む設定期間について音情報Zが設定される。したがって、利用者が音情報Zを効率的に指示することが可能である。第1実施形態では特に、各単位期間に対応する単位画像UAを時間軸に沿って配置した時系列画像GAが表示される。したがって、各単位期間の特徴量Fの類否の時間的な遷移を確認しながら、利用者が所望の設定期間を選択できるという利点がある。また、第1実施形態では、各単位期間に対応する単位画像UBを特徴量Fの距離に応じた間隔で座標平面に配置した分布画像GBが表示される。したがって、各単位期間の特徴量Fの分布を視覚的および直観的に把握しながら、利用者が所望の設定期間を選択できるという利点もある。   As illustrated above, in the first embodiment, the analysis image in which the display mode of each unit image (UA, UB) is closer to each other as the feature amount F of each unit period is similar is displayed on the display device 14, and the user is The sound information Z is set for a set period including one or more unit periods selected from the analysis image. Therefore, the user can efficiently specify the sound information Z. Particularly in the first embodiment, the time-series image GA in which the unit images UA corresponding to the respective unit periods are arranged along the time axis is displayed. Therefore, there is an advantage that the user can select a desired set period while confirming the temporal transition of the similarity of the feature amount F of each unit period. Further, in the first embodiment, the distribution image GB in which the unit images UB corresponding to the respective unit periods are arranged on the coordinate plane at intervals according to the distance of the feature amount F is displayed. Therefore, there is also an advantage that the user can select a desired set period while visually and intuitively grasping the distribution of the feature amount F in each unit period.

ところで、音響信号Xの各期間に音情報Zを設定する構成としては、例えば、音情報Z毎(例えばコード毎)に事前に用意された複数の基準値を利用する構成(以下「対比例」という)も想定される。各基準値は、特徴量Fとの比較対象となるテンプレートである。対比例では、任意の1個の単位期間の特徴量Fが複数の基準値の各々と比較され、単位期間の特徴量Fに最も類似する基準値に対応した音情報Zが当該単位期間に設定される。しかし、実際には、単位期間の特徴量Fに類似する基準値の音情報Zが適切な内容であるとは限らず、実際には他の音情報Zが適正である場合も発生し得る。以上に例示した対比例とは対照的に、第1実施形態では、利用者が指定した設定期間に対して当該利用者からの指示に応じた音情報Zが設定されるから、音響信号Xの各期間に不適切な音情報Zが設定されるという対比例の問題を抑制することが可能である。   By the way, as a configuration for setting the sound information Z in each period of the acoustic signal X, for example, a configuration using a plurality of reference values prepared in advance for each sound information Z (for example, for each chord) (hereinafter referred to as “comparative”) Is also assumed. Each reference value is a template to be compared with the feature amount F. In contrast, the feature amount F of any one unit period is compared with each of a plurality of reference values, and the sound information Z corresponding to the reference value most similar to the feature amount F of the unit period is set in the unit period. To be done. However, in practice, the sound information Z of the reference value similar to the feature amount F of the unit period is not necessarily the proper content, and in some cases, other sound information Z may be proper. In contrast to the proportionality illustrated above, in the first embodiment, the sound information Z corresponding to the instruction from the user is set for the setting period designated by the user, and therefore the acoustic signal X It is possible to suppress the problem of the proportionality that inappropriate sound information Z is set in each period.

<第2実施形態>
本発明の第2実施形態を説明する。第1実施形態では、音響信号Xの各設定期間を個別に指定するとともに音情報Zを設定期間毎に個別に設定した。第2実施形態では、利用者が1個の設定期間を指定した場合に、当該設定期間に特徴量Fが類似する他の設定期間も一括的に指定される。なお、以下に例示する各形態において作用または機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
<Second Embodiment>
A second embodiment of the present invention will be described. In the first embodiment, each set period of the acoustic signal X is individually designated, and the sound information Z is set individually for each set period. In the second embodiment, when the user specifies one setting period, other setting periods in which the feature amount F is similar to the setting period are also collectively specified. It should be noted that, in each of the following exemplary embodiments, the elements having the same operation or function as those in the first embodiment are given the same reference numerals as those used in the description of the first embodiment, and the detailed description thereof will be appropriately omitted.

図8は、第2実施形態における設定期間の選択の説明図である。図8の手順PB1において、時系列画像GA内の1個の単位画像UAを利用者が指定すると、情報設定部26は、当該単位画像UAに対応する単位期間と、当該単位期間に特徴量Fが類似する他の単位期間とが、設定期間として一括的に指定される。具体的には、利用者が指定した1個の単位期間の特徴量Fに対して許容範囲内にある特徴量Fが抽出された各単位期間(例えば、利用者が指定した1個の単位期間の特徴量Fとの差分が閾値を下回る単位期間)の単位画像UAが指定される。すなわち、特徴量Fが相互に類似する複数の単位期間の各々が設定期間として一括的に選択される。表示制御部24は、情報設定部26が選択した各単位画像UAを強調表示する。   FIG. 8 is an explanatory diagram of selection of a set period in the second embodiment. In the procedure PB1 of FIG. 8, when the user designates one unit image UA in the time-series image GA, the information setting unit 26 causes the unit period corresponding to the unit image UA and the feature amount F in the unit period. And other unit periods having similar values are collectively designated as the set period. Specifically, each unit period in which the feature amount F within the allowable range is extracted with respect to the feature amount F in one unit period designated by the user (for example, one unit period designated by the user Unit image UA for which the difference from the feature amount F is less than the threshold value. That is, each of the plurality of unit periods in which the feature amount F is similar to each other is collectively selected as the set period. The display control unit 24 highlights each unit image UA selected by the information setting unit 26.

図8の手順PB2において、利用者は、手順PB1で指定された複数の設定期間のうち任意の1個の設定期間を、第1実施形態の手順PA2と同様に前方または後方に拡張することが可能である。時間軸上で隣合う各単位期間において特徴量Fは相違し得るから、設定期間を拡張する(設定期間内の単位期間の総数が増加する)と、当該設定期間内の各単位期間の特徴量Fの数値範囲は拡大する。音情報設定部26は、拡張後の設定期間に含まれる複数の単位期間の特徴量Fの数値範囲まで許容範囲を拡大し、手順PB1で指定された単位期間の周辺において特徴量Fが拡大後の許容範囲内に含まれる複数の単位期間の範囲を、更新後の設定期間として画定する。すなわち、複数の単位期間を各々が含む複数の設定期間が一括的に指定される。   In the procedure PB2 of FIG. 8, the user can extend any one of the plurality of setting periods designated in the procedure PB1 forward or backward like the procedure PA2 of the first embodiment. It is possible. Since the feature amount F may be different between the unit periods adjacent to each other on the time axis, when the set period is extended (the total number of unit periods in the set period increases), the feature amount of each unit period in the set period is increased. The numerical range of F is expanded. The sound information setting unit 26 expands the allowable range up to the numerical value range of the feature amount F of the plurality of unit periods included in the extended set period, and after the feature amount F is enlarged around the unit period designated in the procedure PB1. The range of the plurality of unit periods included in the permissible range is defined as the updated set period. That is, a plurality of set periods each including a plurality of unit periods are collectively designated.

図8の手順PB2において、利用者は、手順PB2で指定された複数の設定期間のうち任意の1個の設定期間について音情報Zを指定することが可能である。音情報設定部26は、手順PB1および手順PB2で指定された複数の設定期間について、利用者が指定した音情報Zを共通に設定する。すなわち、特徴量Fが類似する複数の設定期間について共通の音情報Zが一括的に設定される。   In procedure PB2 of FIG. 8, the user can specify the sound information Z for any one of the plurality of setting periods specified in the procedure PB2. The sound information setting unit 26 sets the sound information Z designated by the user in common for the plurality of setting periods designated in the procedure PB1 and the procedure PB2. That is, common sound information Z is collectively set for a plurality of setting periods having similar feature amounts F.

第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態においては、時系列画像GAの単位画像UAが指定された場合に、当該単位画像UAが表す単位期間を含む設定期間と、当該単位期間に特徴量Fが類似する他の設定期間とが一括的に設定される。したがって、各設定期間を個別に指定する必要がある構成と比較して、利用者が複数の設定期間を指定するための負荷を軽減することが可能である。   Also in the second embodiment, the same effect as that of the first embodiment is realized. Further, in the second embodiment, when the unit image UA of the time-series image GA is designated, a set period including the unit period represented by the unit image UA and another feature amount F similar to the unit period are displayed. The set period and the set period are collectively set. Therefore, it is possible to reduce the load for the user to specify a plurality of setting periods as compared with the configuration in which each setting period needs to be specified individually.

<変形例>
以上に例示した各態様は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2個以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
<Modification>
Each aspect illustrated above can be variously modified. Specific modes of modification will be exemplified below. Two or more aspects arbitrarily selected from the following exemplifications can be appropriately merged within a range not inconsistent with each other.

(1)特徴量Fの抽出の単位となる単位期間の時間長は任意である。例えば、音響信号Xが表す楽曲の拍点を境界として音響信号Xを区分した各単位期間について特徴量Fを抽出する構成も採用され得る。複数拍に相当する時間長の期間を単位期間としてもよい。また、単位期間内の複数の期間について特徴量を抽出し、単位期間内の特徴量の代表値(例えば平均値)を当該単位期間の特徴量Fとして算定することも可能である。 (1) The time length of the unit period which is the unit for extracting the feature amount F is arbitrary. For example, a configuration may be adopted in which the feature amount F is extracted for each unit period in which the acoustic signal X is divided with the beat point of the music represented by the acoustic signal X as a boundary. A unit of time may be a period of time length corresponding to a plurality of beats. It is also possible to extract the feature amount for a plurality of periods within the unit period and calculate a representative value (for example, an average value) of the feature amounts within the unit period as the feature amount F for the unit period.

(2)前述の各形態では、単位画像UAおよび単位画像UBの表示態様として色相および彩度を例示したが、単位画像UAまたは単位画像UBの表示態様は以上の例示に限定されない。例えば、色相、彩度および明度のうちの少なくともひとつでもよいし、これらの任意の組合せでもよい。また、模様や明暗(濃淡)等の表示態様で特徴量Fの類否を表現することも可能である。以上の説明から理解される通り、単位画像UAまたは単位画像UBの表示態様とは、視覚的に弁別可能な画像の性状を意味する。 (2) In each of the above-described embodiments, the hue and the saturation are illustrated as the display modes of the unit image UA and the unit image UB, but the display modes of the unit image UA or the unit image UB are not limited to the above examples. For example, it may be at least one of hue, saturation, and lightness, or any combination thereof. Further, it is also possible to express the similarity of the feature amount F in a display mode such as a pattern or light and dark (shade). As understood from the above description, the display mode of the unit image UA or the unit image UB means the property of the image that can be visually discriminated.

(3)前述の各形態では、各設定期間に設定される音情報Zを利用者が指定する構成を例示したが、音情報Zを特定する方法は以上の例示に限定されない。例えば、音響信号Xの解析により音情報Zを特定することも可能である。例えば、公知のコード識別技術を利用して音響信号Xから自動的に推定されたコード名を音情報Zとして各設定期間に設定することも可能である。音響信号Xの解析で自動的に特定された音情報Zを初期値として利用者が任意に変更できる構成も好適である。 (3) In each of the above-described embodiments, the configuration in which the user specifies the sound information Z set in each setting period has been illustrated, but the method for specifying the sound information Z is not limited to the above example. For example, it is possible to specify the sound information Z by analyzing the acoustic signal X. For example, it is possible to set the chord name automatically estimated from the acoustic signal X as the sound information Z in each set period by using a known chord identification technique. A configuration in which the user can arbitrarily change the sound information Z automatically specified by the analysis of the acoustic signal X as an initial value is also preferable.

(4)前述の各形態では、音情報Zとしてコード名を例示したが、音情報Zの内容は以上の例示に限定されない。例えば、設定期間内で優勢に発音される楽器の種類(楽器名)、または、設定期間内で優勢に発音される音名を、音情報Zとして設定期間毎に設定することも可能である。また、人間の発声音を表す音響信号Xを想定すると、設定期間内で発音される音韻(発音内容)を音情報Zとして設定期間毎に設定することも可能である。以上の説明から理解される通り、音情報Zは、各設定期間に設定される各種の情報(ラベル)を包含する。 (4) In each of the above embodiments, the chord name is illustrated as the sound information Z, but the content of the sound information Z is not limited to the above example. For example, it is possible to set, as the sound information Z, the type of musical instrument (instrument name) that is predominantly sounded within the set period or the note name that is predominantly sounded within the set period as the sound information Z for each set period. Further, assuming an acoustic signal X representing a human uttered sound, it is possible to set the phoneme (pronounced content) produced within the set period as the sound information Z for each set period. As understood from the above description, the sound information Z includes various information (labels) set in each set period.

(5)前述の各形態では、多次元尺度構成法(MDS)を利用して分布画像GBを生成したが、分布画像GBを生成する方法は以上の例示に限定されない。例えば、前述の各形態では、分布画像GBの各単位画像UBの表示態様を選定するために色相環を利用したが、図9に例示される通り、相互に直交する2軸に沿って色相および彩度が変化する画像(以下「彩色画像」という)を各単位画像UBの表示態様の選定に利用することも可能である。具体的には、表示制御部24は、彩色画像を分布画像GBに重ねて配置し、彩色画像のうち各単位画像UBが位置する地点の色相および彩度を、当該単位画像UBの色相および彩度として選択する。 (5) In each of the above-described embodiments, the distribution image GB is generated using the multidimensional scaling method (MDS), but the method of generating the distribution image GB is not limited to the above examples. For example, in each of the above-described embodiments, the hue circle is used to select the display mode of each unit image UB of the distribution image GB, but as illustrated in FIG. It is also possible to use an image whose saturation changes (hereinafter referred to as "colored image") for selecting the display mode of each unit image UB. Specifically, the display control unit 24 arranges the colored image so as to overlap the distribution image GB, and determines the hue and the saturation of the point where each unit image UB is located in the colored image as the hue and the saturation of the unit image UB. Select as degree.

また、例えば、特徴抽出部22が抽出した複数の特徴量Fをk-means等の公知の技術で複数のクラスタに分類(クラスタリング)し、クラスタ毎に表示態様を選定することも可能である。例えば、相異なるクラスタに対応する複数の領域に色相環を分割し、各クラスタに属する特徴量Fが抽出された単位期間を表す単位画像UAおよび単位画像UBに対して、色相環のうち当該クラスタに対応する領域内の色を割当てることも可能である。以上の構成では、特徴量Fが共通のクラスタに分類された各単位期間の単位画像(UA,UB)は相互に近似する表示態様で表示される。   Further, for example, it is also possible to classify (cluster) the plurality of feature amounts F extracted by the feature extraction unit 22 into a plurality of clusters by a known technique such as k-means and select the display mode for each cluster. For example, the hue circle is divided into a plurality of regions corresponding to different clusters, and the unit image UA and the unit image UB representing the unit period in which the feature amount F belonging to each cluster is extracted It is also possible to assign a color within the area corresponding to. With the above configuration, the unit images (UA, UB) in each unit period in which the feature amount F is classified into the common cluster are displayed in a display mode that is similar to each other.

以上の例示から理解される通り、分布画像GBは、複数の単位期間の各々に対応する単位画像UBを、特徴量Fが類似する各単位期間の単位画像UBの間で表示態様が近似するように、各単位期間の特徴量Fの距離に応じた間隔で座標平面に配置した画像として包括的に表現される。   As can be understood from the above example, the distribution image GB is configured so that the display modes of the unit images UB corresponding to each of the plurality of unit periods are similar between the unit images UB of the unit periods having similar feature amounts F. And is comprehensively represented as an image arranged on the coordinate plane at intervals according to the distance of the feature amount F in each unit period.

(6)前述の各形態で例示した音情報設定装置100は、前述の各形態の例示の通り、制御装置10とプログラムとの協働で実現される。本発明の好適な態様に係るプログラムは、音響信号Xの特徴量Fを複数の単位期間の各々について抽出する特徴抽出部22、複数の単位期間の各々に対応する単位画像(UA,UB)を配置した解析画像(GA,GB)を、各単位期間の特徴量Fが類似するほど当該各単位期間の単位画像の表示態様が近似するように、表示装置14に表示させる表示制御部24、および、解析画像から利用者が選択した単位画像に対応する1以上の単位期間を含む設定期間について音情報Zを設定する情報設定部26、としてコンピュータを機能させる。 (6) The sound information setting device 100 illustrated in each of the above-described modes is realized by the cooperation of the control device 10 and a program as illustrated in each of the above-described modes. A program according to a preferred aspect of the present invention includes a feature extraction unit 22 that extracts a feature amount F of an acoustic signal X for each of a plurality of unit periods, and unit images (UA, UB) corresponding to each of the plurality of unit periods. A display control unit 24 for displaying the arranged analysis images (GA, GB) on the display device 14 so that the display mode of the unit image of each unit period becomes closer as the feature amount F of each unit period becomes similar, and The computer is caused to function as the information setting unit 26 that sets the sound information Z for a set period including one or more unit periods corresponding to the unit image selected by the user from the analysis image.

以上に例示したプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、通信網を介した配信の形態でプログラムをコンピュータに配信することも可能である。   The programs exemplified above may be provided in a form stored in a computer-readable recording medium and installed in the computer. The recording medium is, for example, a non-transitory recording medium, and an optical recording medium (optical disk) such as a CD-ROM is a good example, but a known arbitrary recording medium such as a semiconductor recording medium or a magnetic recording medium is used. Recording media of the form It is also possible to distribute the program to the computer in the form of distribution via a communication network.

100…音情報設定装置、10…制御装置、12…記憶装置、14…表示装置、16…入力装置、22…特徴抽出部、24…表示制御部、26…情報設定部。
100 ... Sound information setting device, 10 ... Control device, 12 ... Storage device, 14 ... Display device, 16 ... Input device, 22 ... Feature extraction part, 24 ... Display control part, 26 ... Information setting part.

Claims (8)

コンピュータシステムが、
音響信号の特徴量を複数の単位期間の各々について抽出し、
前記複数の単位期間の各々に対応する単位画像を配置した解析画像を、前記各単位期間の前記特徴量が類似するほど当該各単位期間の前記単位画像の表示態様が近似するように、表示装置に表示させ、
前記解析画像から利用者が選択した前記単位画像に対応する1以上の単位期間を含む設定期間について音情報を設定する
音情報設定方法。
Computer system
The feature amount of the acoustic signal is extracted for each of the plurality of unit periods,
A display device such that the analysis image in which unit images corresponding to each of the plurality of unit periods are arranged is closer to the display mode of the unit image in each unit period as the feature amount of each unit period is similar. To display
A sound information setting method for setting sound information for a set period including one or more unit periods corresponding to the unit image selected by the user from the analysis image.
コンピュータシステムが、
音響信号の特徴量を複数の単位期間の各々について抽出し、
前記複数の単位期間の各々に対応する第1単位画像を時間軸に沿って配置した時系列画像と、前記複数の単位期間の各々に対応する第2単位画像を前記各単位期間の前記特徴量の距離に応じた間隔で座標平面に配置した分布画像とを、前記各単位期間の前記特徴量が類似するほど、当該各単位期間の前記第1単位画像の表示態様が近似するとともに当該各単位期間の前記第2単位画像の表示態様が近似するように、表示装置に表示させ、
前記時系列画像から利用者が選択した前記第1単位画像または前記分布画像から利用者が選択した前記第2単位画像に対応する1以上の単位期間を含む設定期間について音情報を設定する
音情報設定方法。
Computer system
The feature amount of the acoustic signal is extracted for each of the plurality of unit periods,
The time-series image in which the first unit image corresponding to each of the plurality of unit periods is arranged along the time axis, and the second unit image corresponding to each of the plurality of unit periods include the feature amount of each unit period. The distribution image arranged on the coordinate plane at intervals according to the distance, the more similar the feature amount of each unit period is, the more similar the display mode of the first unit image of each unit period is, and each unit unit Display on the display device so that the display mode of the second unit image during the period is approximate,
Sound information that sets sound information for a set period including one or more unit periods corresponding to the first unit image selected by the user from the time-series image or the second unit image selected by the user from the distribution image Setting method.
前記時系列画像における前記第1単位画像が選択された場合に、当該第1単位画像の表示態様を変更するとともに、前記分布画像のうち当該第1単位画像と共通の単位期間に対応する前記第2単位画像の表示態様を変更する
請求項2の音情報設定方法。
When the first unit image in the time-series image is selected, the display mode of the first unit image is changed, and the first unit image corresponding to the unit period common to the first unit image in the distribution image is selected. The sound information setting method according to claim 2, wherein the display mode of the two-unit image is changed.
前記分布画像における前記第2単位画像が選択された場合に、当該第2単位画像の表示態様を変更するとともに、前記時系列画像のうち当該第2単位画像と共通の単位期間に対応する前記第1単位画像の表示態様を変更する
請求項2または請求項3の音情報設定方法。
When the second unit image in the distribution image is selected, the display mode of the second unit image is changed, and the second unit image corresponding to the unit period common to the second unit image is selected. The sound information setting method according to claim 2, wherein the display mode of the one-unit image is changed.
前記時系列画像の前記第1単位画像を利用者が選択した場合に、当該第1単位画像が表す単位期間を含む設定期間と、当該単位期間に特徴量が類似する単位期間を含む他の設定期間とを設定する
請求項2から請求項4の何れかの音情報設定方法。
When the user selects the first unit image of the time-series image, a setting period including a unit period represented by the first unit image, and another setting including a unit period having a feature amount similar to the unit period The period is set, and the sound information setting method according to claim 2.
前記音情報は、コード名を含む
請求項1から請求項5の何れかの音情報設定方法。
The sound information setting method according to claim 1, wherein the sound information includes a chord name.
音響信号の特徴量を複数の単位期間の各々について抽出する特徴抽出部と、
前記複数の単位期間の各々に対応する単位画像を配置した解析画像を、前記各単位期間の前記特徴量が類似するほど当該各単位期間の前記単位画像の表示態様が近似するように、表示装置に表示させる表示制御部と、
前記解析画像から利用者が選択した前記単位画像に対応する1以上の単位期間を含む設定期間について音情報を設定する情報設定部と
を具備する音情報設定装置。
A feature extraction unit that extracts the feature amount of the acoustic signal for each of the plurality of unit periods,
A display device such that the analysis image in which unit images corresponding to each of the plurality of unit periods are arranged is closer to the display mode of the unit image in each unit period as the feature amount of each unit period is similar. A display control unit to be displayed on
A sound information setting device, comprising: an information setting unit that sets sound information for a set period including one or more unit periods corresponding to the unit image selected by the user from the analysis image.
音響信号の特徴量を複数の単位期間の各々について抽出する特徴抽出部と、
前記複数の単位期間の各々に対応する第1単位画像を時間軸に沿って配置した時系列画像と、前記複数の単位期間の各々に対応する第2単位画像を前記各単位期間の前記特徴量の距離に応じた間隔で座標平面に配置した分布画像とを、前記各単位期間の前記特徴量が類似するほど、当該各単位期間の前記第1単位画像の表示態様が近似するとともに当該各単位期間の前記第2単位画像の表示態様が近似するように、表示装置に表示させる表示制御部と、
前記時系列画像から利用者が選択した前記第1単位画像または前記分布画像から利用者が選択した前記第2単位画像に対応する1以上の単位期間を含む設定期間について音情報を設定する情報設定部と
を具備する音情報設定装置。
A feature extraction unit that extracts the feature amount of the acoustic signal for each of the plurality of unit periods,
The time-series image in which the first unit image corresponding to each of the plurality of unit periods is arranged along the time axis, and the second unit image corresponding to each of the plurality of unit periods include the feature amount of each unit period. The distribution image arranged on the coordinate plane at intervals according to the distance, the more similar the feature amount of each unit period is, the more similar the display mode of the first unit image of each unit period is, and each unit unit A display control unit that causes the display device to display such that the display mode of the second unit image during the period is approximated;
Information setting for setting sound information for a set period including one or more unit periods corresponding to the first unit image selected by the user from the time-series image or the second unit image selected by the user from the distribution image Information setting device including a section.
JP2016135965A 2016-07-08 2016-07-08 SOUND INFORMATION SETTING METHOD AND SOUND INFORMATION SETTING DEVICE Active JP6690445B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016135965A JP6690445B2 (en) 2016-07-08 2016-07-08 SOUND INFORMATION SETTING METHOD AND SOUND INFORMATION SETTING DEVICE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016135965A JP6690445B2 (en) 2016-07-08 2016-07-08 SOUND INFORMATION SETTING METHOD AND SOUND INFORMATION SETTING DEVICE

Publications (2)

Publication Number Publication Date
JP2018005171A JP2018005171A (en) 2018-01-11
JP6690445B2 true JP6690445B2 (en) 2020-04-28

Family

ID=60946275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016135965A Active JP6690445B2 (en) 2016-07-08 2016-07-08 SOUND INFORMATION SETTING METHOD AND SOUND INFORMATION SETTING DEVICE

Country Status (1)

Country Link
JP (1) JP6690445B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024237132A1 (en) * 2023-05-16 2024-11-21 パナソニックIpマネジメント株式会社 Information processing method, information processing device, sound registration system, and program

Also Published As

Publication number Publication date
JP2018005171A (en) 2018-01-11

Similar Documents

Publication Publication Date Title
JP2020003537A (en) Audio extraction device, learning device, karaoke device, audio extraction method, learning method and program
CN105740394A (en) Music generation method, terminal, and server
US20140278433A1 (en) Voice synthesis device, voice synthesis method, and recording medium having a voice synthesis program stored thereon
JP2013137520A (en) Music data editing device
JP6724938B2 (en) Information processing method, information processing apparatus, and program
JP2021101252A (en) Information processing method, information processing apparatus, and program
JP6152753B2 (en) Speech synthesis management device
US10453478B2 (en) Sound quality determination device, method for the sound quality determination and recording medium
WO2020110724A1 (en) Acoustic analysis method, acoustic analysis device, and method for building model
JP6690445B2 (en) SOUND INFORMATION SETTING METHOD AND SOUND INFORMATION SETTING DEVICE
JP7419768B2 (en) Music generation method and music generation system
JP6127549B2 (en) Music data editing method, program for realizing the music data editing method, and music data editing apparatus
US20160277864A1 (en) Waveform Display Control of Visual Characteristics
JP2005107029A (en) Musical sound generating device, and program for realizing musical sound generating method
US11437016B2 (en) Information processing method, information processing device, and program
US12014723B2 (en) Information processing method, information processing device, and program
JP4221757B2 (en) Music score display apparatus and program for realizing music score display method
JP6372076B2 (en) Music information display device, music information display method and program
JP2012083564A (en) Music editing device and program
JP6944366B2 (en) Karaoke equipment
JP6683103B2 (en) Speech synthesis method
CN105164747A (en) Setting and editing sound setting information by link
JP7035509B2 (en) Display control method, program and information processing device
WO2026070359A1 (en) Information processing apparatus, method, and non-transitory computer-readable medium
JP6255960B2 (en) Program and music data generating apparatus for realizing music data generating method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200323

R151 Written notification of patent or utility model registration

Ref document number: 6690445

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350