Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7772056B2 - Chord estimation device, training device, chord estimation method, and training method - Google Patents
[go: Go Back, main page]

JP7772056B2 - Chord estimation device, training device, chord estimation method, and training method - Google Patents

Chord estimation device, training device, chord estimation method, and training method

Info

Publication number
JP7772056B2
JP7772056B2 JP2023508892A JP2023508892A JP7772056B2 JP 7772056 B2 JP7772056 B2 JP 7772056B2 JP 2023508892 A JP2023508892 A JP 2023508892A JP 2023508892 A JP2023508892 A JP 2023508892A JP 7772056 B2 JP7772056 B2 JP 7772056B2
Authority
JP
Japan
Prior art keywords
chord
sequence
information
series data
notes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023508892A
Other languages
Japanese (ja)
Other versions
JPWO2022202199A1 (en
Inventor
正博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Publication of JPWO2022202199A1 publication Critical patent/JPWO2022202199A1/ja
Priority to JP2025146660A priority Critical patent/JP2025172909A/en
Application granted granted Critical
Publication of JP7772056B2 publication Critical patent/JP7772056B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10GREPRESENTATION OF MUSIC; RECORDING MUSIC IN NOTATION FORM; ACCESSORIES FOR MUSIC OR MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR, e.g. SUPPORTS
    • G10G3/00Recording music in notation form, e.g. recording the mechanical operation of a musical instrument
    • G10G3/04Recording music in notation form, e.g. recording the mechanical operation of a musical instrument using electrical means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/38Chord

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Auxiliary Devices For Music (AREA)

Description

本発明は、楽器を演奏するためのコードを推定するコード推定装置および方法、並びに、コード推定装置を構築するための訓練装置および方法に関する。 The present invention relates to a chord estimation device and method for estimating chords for playing a musical instrument, and a training device and method for building a chord estimation device.

コードが付記された楽譜がある。演奏者は、ピアノ、ギターなどの楽器を用いてコードを演奏することで、楽器演奏を楽しむことができる。コード付きの楽譜を制作するにあたって、制作者は、音符で示されるメロディ、伴奏音などに基づいてコードを付与する作業を行う。コードを付与する作業は音楽的知識とセンスが必要とされる。下記特許文献1においては、演奏情報または音響信号からコードを推定するコード進行推定検出装置が開示されている。 There are musical scores with chords added. Performers can enjoy playing musical instruments by playing the chords on instruments such as piano and guitar. When creating musical scores with chords, the creator adds chords based on the melody and accompaniment indicated by the notes. The task of adding chords requires musical knowledge and sense. Patent Document 1 listed below discloses a chord progression estimation and detection device that estimates chords from performance information or audio signals.

特許第6151121号公報Patent No. 6151121

特許文献1においては、特定区間毎にコードが推定される。例えば、小節毎に1つのコードが推定される。与えられた音符から、さらに自由度の高いコード推定を行うことができれば、コード付き楽譜の制作を、より適切に支援可能となると期待される。In Patent Document 1, chords are estimated for each specific section. For example, one chord is estimated for each measure. If chord estimation could be performed with greater flexibility from given notes, it is expected that more appropriate support could be provided for the creation of sheet music with chords.

本発明の目的は、音符列に基づいて自由度の高いコード推定を行うことである。 The object of the present invention is to perform highly flexible chord estimation based on a sequence of notes.

本発明の一局面に従うコード推定装置は、複数の音符からなる音符列を含む時系列データを受け付ける受付部と、訓練済モデルを用い、時系列データに基づいて、音符列に対応するコード列を示すコード列情報を推定する推定部とを備える。 A chord estimation device according to one aspect of the present invention includes a receiving unit that receives time series data including a note sequence consisting of a plurality of notes, and an estimation unit that uses a trained model to estimate chord sequence information indicating a chord sequence corresponding to the note sequence based on the time series data.

本発明の他の局面に従う訓練装置は、複数の音符からなる参照音符列を含む入力時系列データを取得する第1の取得部と、参照音符列に対応するコード列を示す出力コード列情報を取得する第2の取得部と、入力時系列データと出力コード列情報との間の入出力関係を習得した訓練済モデルを構築する構築部とを備える。 A training device according to another aspect of the present invention comprises a first acquisition unit that acquires input time series data including a reference note sequence consisting of a plurality of notes, a second acquisition unit that acquires output chord sequence information indicating a chord sequence corresponding to the reference note sequence, and a construction unit that constructs a trained model that has acquired the input/output relationship between the input time series data and the output chord sequence information.

本発明のさらに他の局面に従うコード推定方法は、コンピュータにより実行され、複数の音符からなる音符列を含む時系列データを受け付け、訓練済モデルを用い、時系列データに基づいて、音符列に対応するコード列を示すコード列情報を推定する。 A chord estimation method according to yet another aspect of the present invention is executed by a computer, accepts time series data including a sequence of notes consisting of a plurality of notes, and uses a trained model to estimate chord sequence information indicating a chord sequence corresponding to the sequence of notes based on the time series data.

本発明のさらに他の局面に従う訓練方法は、コンピュータにより実行され、複数の音符からなる参照音符列を含む入力時系列データを取得し、参照音符列に対応するコード列を示す出力コード列情報を取得し、入力時系列データと出力コード列情報との間の入出力関係を習得した訓練済モデルを構築する。 A training method according to yet another aspect of the present invention is executed by a computer, acquires input time series data including a reference note sequence consisting of a plurality of notes, acquires output chord sequence information indicating a chord sequence corresponding to the reference note sequence, and constructs a trained model that has acquired the input/output relationship between the input time series data and the output chord sequence information.

本発明によれば、音符列に基づいて自由度の高いコード推定を行うことができる。 According to the present invention, highly flexible chord estimation can be performed based on a sequence of notes.

図1は本発明の一実施の形態に係るコード推定装置および訓練装置を含む処理システムの構成を示すブロック図である。FIG. 1 is a block diagram showing the configuration of a processing system including a chord estimation device and a training device according to an embodiment of the present invention. 図2は訓練データに含まれる入力時系列データの一例を示す図である。FIG. 2 is a diagram showing an example of input time series data included in the training data. 図3は訓練データに含まれる出力コード列情報の一例を示す図である。FIG. 3 is a diagram showing an example of output code string information included in the training data. 図4は訓練装置およびコード推定装置の構成を示すブロック図である。FIG. 4 is a block diagram showing the configuration of the training device and the chord estimation device. 図5は表示部に表示されるアレンジ楽譜の一例を示す。FIG. 5 shows an example of an arranged musical score displayed on the display unit. 図6は訓練処理の一例を示すフローチャートである。FIG. 6 is a flowchart showing an example of the training process. 図7はコード推定処理の一例を示すフローチャートである。FIG. 7 is a flowchart showing an example of the chord estimation process. 図8は訓練データに含まれる出力コード列情報の変形例を示す図である。FIG. 8 shows a modified example of the output code string information included in the training data.

(1)処理システムの構成
以下、本発明の実施の形態に係るコード推定装置、訓練装置、コード推定方法および訓練方法について図面を用いて詳細に説明する。図1は、本発明の一実施の形態に係るコード推定装置および訓練装置を含む処理システムの構成を示すブロック図である。図1に示すように、処理システム100は、RAM(ランダムアクセスメモリ)110、ROM(リードオンリメモリ)120、CPU(中央演算処理装置)130、記憶部140、操作部150および表示部160を備える。
(1) Configuration of the Processing System A chord estimation device, training device, chord estimation method, and training method according to embodiments of the present invention will now be described in detail with reference to the drawings. Fig. 1 is a block diagram showing the configuration of a processing system including a chord estimation device and training device according to one embodiment of the present invention. As shown in Fig. 1, the processing system 100 includes a RAM (random access memory) 110, a ROM (read only memory) 120, a CPU (central processing unit) 130, a storage unit 140, an operation unit 150, and a display unit 160.

処理システム100は、パーソナルコンピュータ、タブレット端末またはスマートフォン等のコンピュータにより実現される。あるいは、処理システム100は、イーサネット等の通信路により接続された複数のコンピュータの共同動作により実現されてもよいし、電子ピアノ等の演奏機能を備えた電子楽器により実現されてもよい。 The processing system 100 is realized by a computer such as a personal computer, tablet terminal, or smartphone. Alternatively, the processing system 100 may be realized by the cooperative operation of multiple computers connected by a communication path such as Ethernet, or may be realized by an electronic musical instrument with a performance function such as an electronic piano.

RAM110、ROM120、CPU130、記憶部140、操作部150および表示部160は、バス170に接続される。RAM110、ROM120およびCPU130により訓練装置10およびコード推定装置20が構成される。本実施の形態では、訓練装置10とコード推定装置20とは共通の処理システム100により構成されるが、別個の処理システムにより構成されてもよい。 RAM 110, ROM 120, CPU 130, memory unit 140, operation unit 150 and display unit 160 are connected to bus 170. RAM 110, ROM 120 and CPU 130 constitute the training device 10 and chord estimation device 20. In this embodiment, the training device 10 and chord estimation device 20 are constituted by a common processing system 100, but may also be constituted by separate processing systems.

RAM110は、例えば揮発性メモリからなり、CPU130の作業領域として用いられる。ROM120は、例えば不揮発性メモリからなり、訓練プログラムおよびコード推定プログラムを記憶する。CPU130は、ROM120に記憶された訓練プログラムをRAM110上で実行することにより訓練処理を行う。また、CPU130は、ROM120に記憶されたコード推定プログラムをRAM110上で実行することによりコード推定処理を行う。訓練処理およびコード推定処理の詳細については後述する。 RAM 110 is made of, for example, volatile memory and is used as a working area for CPU 130. ROM 120 is made of, for example, non-volatile memory and stores a training program and a chord estimation program. CPU 130 performs training processing by executing the training program stored in ROM 120 on RAM 110. CPU 130 also performs chord estimation processing by executing the chord estimation program stored in ROM 120 on RAM 110. Details of the training processing and chord estimation processing will be described later.

訓練プログラムまたはコード推定プログラムは、ROM120ではなく記憶部140に記憶されてもよい。あるいは、訓練プログラムまたはコード推定プログラムは、コンピュータが読み取り可能な記憶媒体に記憶された形態で提供され、ROM120または記憶部140にインストールされてもよい。あるいは、処理システム100がインターネット等のネットワークに接続されている場合には、当該ネットワーク上のサーバ(クラウドサーバを含む。)から配信された訓練プログラムまたはコード推定プログラムがROM120または記憶部140にインストールされてもよい。The training program or chord estimation program may be stored in the memory unit 140 instead of the ROM 120. Alternatively, the training program or chord estimation program may be provided in a form stored on a computer-readable storage medium and installed in the ROM 120 or the memory unit 140. Alternatively, if the processing system 100 is connected to a network such as the Internet, the training program or chord estimation program may be distributed from a server (including a cloud server) on the network and installed in the ROM 120 or the memory unit 140.

記憶部140は、ハードディスク、光学ディスク、磁気ディスクまたはメモリカード等の記憶媒体を含み、訓練済モデルMおよび複数の訓練データDを記憶する。訓練済モデルMまたは各訓練データDは、記憶部140に記憶されず、コンピュータが読み取り可能な記憶媒体に記憶されていてもよい。あるいは、処理システム100がネットワークに接続されている場合には、訓練済モデルMまたは各訓練データDは、当該ネットワーク上のサーバに記憶されていてもよい。 The storage unit 140 includes a storage medium such as a hard disk, optical disk, magnetic disk, or memory card, and stores the trained model M and multiple pieces of training data D. The trained model M or each piece of training data D may not be stored in the storage unit 140, but may be stored in a computer-readable storage medium. Alternatively, if the processing system 100 is connected to a network, the trained model M or each piece of training data D may be stored on a server on the network.

(2)訓練データ
訓練済モデルMは、コード推定装置20の使用者(以下、演奏者と呼ぶ。)が楽曲を演奏するときに参照するコード列を提示するために訓練された機械学習モデルである。訓練済モデルMは、複数の訓練データDを用いて構築される。訓練装置10の使用者は、操作部150を操作することにより、訓練データDを生成することができる。訓練データDは、参照演奏者の音楽的知識または音楽的センス等に基づいて作成されたデータである。参照演奏者は、楽曲の演奏に関して比較的高い技量を有する。参照演奏者は、楽曲の演奏における演奏者の指導者または師であってもよい。
(2) Training Data The trained model M is a machine learning model trained to present chord sequences that a user of the chord estimation device 20 (hereinafter referred to as a performer) can refer to when playing a piece of music. The trained model M is constructed using multiple sets of training data D. A user of the training device 10 can generate the training data D by operating the operation unit 150. The training data D is data created based on the musical knowledge or musical sense of a reference performer. The reference performer has a relatively high level of skill in playing a piece of music. The reference performer may be the performer's instructor or teacher in playing a piece of music.

訓練データDは、入力時系列データと出力コード列情報との組を示す。入力時系列データは、複数の音符からなる参照音符列を示す。例えば、入力時系列データは、複数の音符によってメロディや伴奏音を構成するデータである。入力時系列データは楽譜の画像を示す画像データであってもよい。出力コード列情報は、参照音符列に対応するコードが時系列に配置されたデータである。参照音符列に対応するコード列は、参照演奏者により付与される。 Training data D represents a set of input time series data and output chord sequence information. The input time series data represents a reference note sequence consisting of multiple notes. For example, the input time series data is data that comprises a melody or accompaniment sound made up of multiple notes. The input time series data may be image data representing an image of musical score. The output chord sequence information is data in which chords corresponding to the reference note sequence are arranged in time series. The chord sequence corresponding to the reference note sequence is assigned by a reference performer.

図2および図3は、各訓練データDの一例を示す図である。図2の例は、複数の音符からなる参照音符列を含む入力時系列データを示す。図3の例は、参照音符列に対応するコード列を示す出力コード列情報を示す。 Figures 2 and 3 show examples of each training data D. The example in Figure 2 shows input time series data including a reference note sequence consisting of multiple notes. The example in Figure 3 shows output chord sequence information indicating the chord sequence corresponding to the reference note sequence.

本実施の形態においては、入力時系列データは、参照音符列に加えて、拍節構造および付加情報を有する。図2に示す入力時系列データAは、曲の先頭の2小節分のデータを抜粋したデータである。入力時系列データAは、“bar”によって小節が区切られ、“beat”によって拍が区切られている。このように、入力時系列データAは、“bar”および“beat”情報により拍節構造を備える。要素A1~A37は、最初の1小節の参照音符列を示す。つまり、要素A1~A37は、要素A1の前の“bar”と要素A37の後の“bar”によって小節に区切られている。また、要素A8、A18、A26の後の“beat”によって拍に区切られている。 In this embodiment, the input time series data has a metrical structure and additional information in addition to a reference note sequence. Input time series data A shown in Figure 2 is an excerpt of the first two bars of a song. Input time series data A is divided into bars by "bars" and into beats by "beats." In this way, input time series data A has a metrical structure based on "bar" and "beat" information. Elements A1 to A37 indicate the reference note sequence of the first bar. In other words, elements A1 to A37 are divided into bars by the "bar" before element A1 and the "bar" after element A37. Furthermore, elements A8, A18, and A26 are divided into beats by the "beats" after them.

要素A0は、付加情報である。付加情報としては、例えば、調情報、ジャンル情報、難易度情報などが利用される。図2の例では、Key要素により調情報が付加されている。調情報は、参照音符列で表現される音楽の調を指定する情報である。Keyに続く数値は調を指定する数値である。付加情報として調情報が指定されることにより、参照音符列および調に応じたコード列が機械学習される。ジャンル情報は、参照音符列で表現される音楽のジャンルを指定する情報である。ジャンル情報としては、例えば、ロック、ポップス、ジャズなどのジャンルが指定される。付加情報としてジャンル情報が指定されることにより、参照音符列およびジャンルに応じたコード列が機械学習される。難易度情報は、参照音符列で示される楽譜の難易度を示す情報である。付加情報として難易度情報が指定されることにより、参照音符列および楽譜の難易度に応じたコード列が機械学習される。例えば、低難易度の楽譜であれば少ない音数から音符の補間を行いつつ機械学習が行われる。また、高難易度の楽譜であれば過剰な音数の中からコードを構成する音符を選択しつつ機械学習が行われる。 Element A0 is additional information. Examples of additional information include key information, genre information, and difficulty level information. In the example of Figure 2, key information is added using the Key element. Key information specifies the key of the music represented by the reference note sequence. The number following Key specifies the key. By specifying key information as additional information, a chord sequence corresponding to the reference note sequence and the key is machine-learned. Genre information specifies the genre of the music represented by the reference note sequence. Examples of genre information include rock, pop, and jazz. By specifying genre information as additional information, a chord sequence corresponding to the reference note sequence and the genre is machine-learned. Difficulty information indicates the difficulty level of the musical score represented by the reference note sequence. By specifying difficulty information as additional information, a chord sequence corresponding to the reference note sequence and the difficulty level of the musical score is machine-learned. For example, for a low-difficulty score, machine learning is performed by interpolating notes from a small number of notes. On the other hand, for a high-difficulty score, machine learning is performed by selecting notes that constitute chords from an excessive number of notes.

入力時系列データAの要素のうち、要素A0、“bar”および“beat”以外の要素は、参照音符列に対応する。要素A1~A37は、1小節目の参照音符列を示す。本例では、要素A0は入力時系列データAにおける先頭、すなわち参照音符列(要素A1~A37)の前に配置されるが、入力時系列データAにおける任意の位置に配置されてもよい。 Of the elements of the input time series data A, elements other than element A0, "bar", and "beat" correspond to the reference note sequence. Elements A1 to A37 indicate the reference note sequence for the first bar. In this example, element A0 is placed at the beginning of the input time series data A, i.e., before the reference note sequence (elements A1 to A37), but it may be placed at any position in the input time series data A.

要素A1~A37に例示するように、参照音符列において、“L”は左手を意味し、“R”は右手を意味し、“L”または“R”に続く数字は音階を意味する。また、“on”および“off”はそれぞれ押鍵および離鍵を意味する。また、“wait”は待機を意味し、“wait”に続く数字は時間の長さを意味する。したがって、要素A1~A5は、右手で音階77および音階74の鍵を押すと同時に、左手で音階53と音階46の鍵を同時に押した後、11単位時間だけ維持することを示す。そして、11単位時間だけ維持した後、要素A6~A8は、左手の音階53と音階46の鍵を同時に離した後、1単位時間だけ維持することを示す。そして、1単位時間だけ維持した後、要素A9~要素A11は、左手で音階53と音階46を再び押した後、5単位時間だけ待機することを示す。As illustrated by elements A1 through A37, in the reference note sequence, "L" represents the left hand, "R" represents the right hand, and the number following "L" or "R" represents the scale. Furthermore, "on" and "off" represent key depression and key release, respectively. Furthermore, "wait" represents waiting, and the number following "wait" represents the length of time. Therefore, elements A1 through A5 indicate that the right hand simultaneously presses keys 77 and 74, while the left hand simultaneously presses keys 53 and 46, and then maintains these positions for 11 time units. After maintaining these positions for 11 time units, elements A6 through A8 indicate that the left hand simultaneously releases keys 53 and 46, and then maintains these positions for one time unit. After maintaining these positions for one time unit, elements A9 through A11 indicate that the left hand again presses keys 53 and 46, and then waits for five time units.

図3に示す出力コード列情報Bは、入力時系列データAに含まれる参照音符列に対応するコード列を示す。入力時系列データAの要素A1~A37に対応するコード列は、要素B1~B3および要素B4~B6で表されている。つまり、要素B1~B6は、入力時系列データAの1小節目に対応するコード列を示す。出力コード列情報Bにおいても、“bar”によって小節が区切られ、“beat”によって拍が区切られている。要素B1の前の“bar”および要素B6の後の“bar”によって区切られた範囲が1小節目に対応している。 The output chord sequence information B shown in Figure 3 indicates a chord sequence corresponding to the reference note sequence contained in the input time series data A. The chord sequence corresponding to elements A1 to A37 of the input time series data A is represented by elements B1 to B3 and elements B4 to B6. In other words, elements B1 to B6 indicate the chord sequence corresponding to the first measure of the input time series data A. In the output chord sequence information B, measures are also separated by "bar" and beats are separated by "beat." The range separated by the "bar" before element B1 and the "bar" after element B6 corresponds to the first measure.

出力コード列情報Bにおいて、1つのコードは3つの要素で示される。要素B1~B3において1小節目の1拍目のコードが規定される。要素B4~B6において1小節目の4拍目のコードが規定される。要素B7~B9において4小節目の1拍目のコードが規定される。コードを示す3つの要素のうち、1番目の要素(B1,B4,B7)は、基本コード情報を示す。基本コード情報(chord)は、12音(C,C#,D,D#,・・・A,A#,B)それぞれについてメジャーコードおよびマイナーコードの種別を指定する1~24の数値を示す。コードを示す3つの要素のうち、2番目の要素(B2,B5,B8)は、コードタイプ情報を示す。コードタイプ情報(type)は、テンションコードの種別を指定する数値を示す。コードを示す3つの要素のうち、3番目の要素(B3,B6,B9)は、コードルート情報を示す。コードルート情報(root)は、オンコードのルート音を指定する数値を示す。 In output chord sequence information B, one chord is represented by three elements. Elements B1 to B3 specify the chord on the first beat of the first measure. Elements B4 to B6 specify the chord on the fourth beat of the first measure. Elements B7 to B9 specify the chord on the first beat of the fourth measure. Of the three elements indicating a chord, the first element (B1, B4, B7) indicates basic chord information. Basic chord information (chord) indicates a number from 1 to 24 specifying the type of major chord or minor chord for each of the 12 notes (C, C#, D, D#, ... A, A#, B). Of the three elements indicating a chord, the second element (B2, B5, B8) indicates chord type information. Chord type information (type) indicates a number specifying the type of tension chord. Of the three elements indicating a chord, the third element (B3, B6, B9) indicates chord root information. The chord root information (root) indicates a numerical value that specifies the root note of the on-chord.

(3)訓練装置およびコード推定装置
図4は、訓練装置10およびコード推定装置20の構成を示すブロック図である。図4に示すように、訓練装置10は、機能部として、第1の取得部11、第2の取得部12および構築部13を含む。図1のCPU130が訓練プログラムを実行することにより、訓練装置10の機能部が実現される。訓練装置10の機能部の少なくとも一部は、電子回路等のハードウエアにより実現されてもよい。
(3) Training Device and Chord Estimation Device Fig. 4 is a block diagram showing the configurations of the training device 10 and the chord estimation device 20. As shown in Fig. 4, the training device 10 includes, as functional units, a first acquisition unit 11, a second acquisition unit 12, and a construction unit 13. The functional units of the training device 10 are realized by the CPU 130 in Fig. 1 executing a training program. At least a part of the functional units of the training device 10 may be realized by hardware such as electronic circuits.

第1の取得部11は、記憶部140等に記憶された各訓練データDから入力時系列データAを取得する。第2の取得部12は、各訓練データDから出力コード列情報Bを取得する。構築部13は、各訓練データDについて、第1の取得部11により取得された入力時系列データAを入力要素とし、第2の取得部12により取得された出力コード列情報Bを出力要素とする機械学習を行う。複数の訓練データDについて機械学習を繰り返すことにより、構築部13は、入力時系列データAと出力コード列情報Bとの間の入出力関係を示す訓練済モデルMを構築する。 The first acquisition unit 11 acquires input time series data A from each training data D stored in the memory unit 140, etc. The second acquisition unit 12 acquires output code sequence information B from each training data D. The construction unit 13 performs machine learning for each training data D, using the input time series data A acquired by the first acquisition unit 11 as an input element and the output code sequence information B acquired by the second acquisition unit 12 as an output element. By repeating machine learning for multiple training data D, the construction unit 13 constructs a trained model M that indicates the input/output relationship between the input time series data A and the output code sequence information B.

本例では、構築部13はTransformerを訓練することにより訓練済モデルMを構築するが、実施の形態はこれに限定されない。構築部13は、時系列を扱う他の方式の機械学習モデルを訓練することにより訓練済モデルMを構築してもよい。構築部13により構築された訓練済モデルMは、例えば記憶部140に記憶される。構築部13により構築された訓練済モデルMは、ネットワーク上のサーバ等に記憶されてもよい。 In this example, the construction unit 13 constructs the trained model M by training the Transformer, but the embodiment is not limited to this. The construction unit 13 may also construct the trained model M by training another type of machine learning model that handles time series. The trained model M constructed by the construction unit 13 is stored, for example, in the storage unit 140. The trained model M constructed by the construction unit 13 may also be stored on a server on a network, etc.

コード推定装置20は、機能部として、受付部21、推定部22および生成部23を含む。図1のCPU130がコード推定プログラムを実行することにより、コード推定装置20の機能部が実現される。コード推定装置20の機能部の少なくとも一部は、電子回路等のハードウエアにより実現されてもよい。 The chord estimation device 20 includes, as functional units, a reception unit 21, an estimation unit 22, and a generation unit 23. The functional units of the chord estimation device 20 are realized by the CPU 130 in Figure 1 executing a chord estimation program. At least some of the functional units of the chord estimation device 20 may be realized by hardware such as electronic circuits.

本実施の形態では、受付部21は、複数の音符からなる音符列を含む時系列データを受け付ける。演奏者は、楽譜の画像を示す画像データを時系列データとして受付部21に与えることができる。あるいは、演奏者は、操作部150を操作することにより時系列データを生成し、受付部21に与えることができる。本例では、時系列データは、図2の入力時系列データAと同様の構成を有する。つまり、時系列データは、音符列に加えて、拍節構造および付加情報を有する。 In this embodiment, the receiving unit 21 receives time series data including a sequence of notes consisting of multiple notes. The performer can provide image data showing an image of a musical score to the receiving unit 21 as time series data. Alternatively, the performer can generate time series data by operating the operation unit 150 and provide it to the receiving unit 21. In this example, the time series data has the same structure as the input time series data A in Figure 2. In other words, the time series data has a metrical structure and additional information in addition to a sequence of notes.

推定部22は、記憶部140等に記憶された訓練済モデルMを用いてコード列情報を推定する。コード列情報は、受付部21により受け付けられた音符列に対応するコード列を示し、音符列および付加情報に基づいて推定される。時系列データが、入力時系列データAと同様の構成を有することにより、コード列情報は出力コード列情報Bと同様の構成を有する。生成部23は、受付部21により受け付けられた時系列データの音符列と、推定部22により推定されたコード列情報とに基づいて楽譜情報を生成する。例えば、楽譜情報は、ピアノのアレンジ楽譜の情報であり、五線譜の上にコード情報が付記されたデータである。あるいは、楽譜情報は、コード列情報が付加されたMIDIデータである。 The estimation unit 22 estimates chord sequence information using a trained model M stored in the memory unit 140 or the like. The chord sequence information indicates a chord sequence corresponding to the note sequence received by the reception unit 21, and is estimated based on the note sequence and additional information. Because the time series data has a structure similar to that of the input time series data A, the chord sequence information has a structure similar to that of the output chord sequence information B. The generation unit 23 generates musical score information based on the note sequence of the time series data received by the reception unit 21 and the chord sequence information estimated by the estimation unit 22. For example, the musical score information is information on an arranged piano score, and is data in which chord information is added to a staff. Alternatively, the musical score information is MIDI data to which chord sequence information has been added.

表示部160には、生成部23により生成された楽譜情報に基づいてコード付き楽譜が表示される。図5は、表示部160に表示されるコード付き楽譜の一例を示す。図5に示すように、コード付き楽譜には、推定部22により推定されたコード列情報が受付部21により受け付けられた音符列の各音符に対応するように示される。The display unit 160 displays a chord-added musical score based on the musical score information generated by the generation unit 23. Figure 5 shows an example of a chord-added musical score displayed on the display unit 160. As shown in Figure 5, the chord-added musical score displays the chord sequence information estimated by the estimation unit 22 in correspondence with each note of the note sequence accepted by the acceptance unit 21.

(4)訓練処理およびコード推定処理
図6は、図4の訓練装置10による訓練処理の一例を示すフローチャートである。図6の訓練処理は、図1のCPU130が訓練プログラムを実行することにより行われる。まず、第1の取得部11は、各訓練データDから入力時系列データAを取得する(ステップS1)。また、第2の取得部12は、各訓練データDから出力コード列情報Bを取得する(ステップS2)。ステップS1,S2は、いずれが先に実行されてもよいし、同時に実行されてもよい。
(4) Training Process and Chord Estimation Process Figure 6 is a flowchart showing an example of training process by the training device 10 of Figure 4. The training process of Figure 6 is performed by the CPU 130 of Figure 1 executing a training program. First, the first acquisition unit 11 acquires input time-series data A from each training data D (step S1). Furthermore, the second acquisition unit 12 acquires output chord string information B from each training data D (step S2). Steps S1 and S2 may be executed first, or may be executed simultaneously.

次に、構築部13は、各訓練データDについて、ステップS1で取得された入力時系列データAを入力要素とし、ステップS2で取得された出力コード列情報Bを出力要素とする機械学習を行う(ステップS3)。続いて、構築部13は、十分な機械学習が実行されたか否かを判定する(ステップS4)。機械学習が不十分な場合、構築部13はステップS3に戻る。十分な機械学習が実行されるまで、パラメータが変化されつつステップS3,S4が繰り返される。機械学習の繰り返し回数は、構築される訓練済モデルMが満たすべき品質条件に応じて変化する。Next, the construction unit 13 performs machine learning for each training data D, using the input time-series data A acquired in step S1 as the input element and the output code string information B acquired in step S2 as the output element (step S3). Subsequently, the construction unit 13 determines whether sufficient machine learning has been performed (step S4). If the machine learning is insufficient, the construction unit 13 returns to step S3. Steps S3 and S4 are repeated while changing the parameters until sufficient machine learning has been performed. The number of times the machine learning is repeated varies depending on the quality conditions that the trained model M to be constructed must satisfy.

十分な機械学習が実行された場合、構築部13は、ステップS3の機械学習により習得した入力時系列データAと出力コード列情報Bとの間の入出力関係を訓練済モデルMとして保存する(ステップS5)。これにより、訓練処理が終了する。 When sufficient machine learning has been performed, the construction unit 13 saves the input/output relationship between the input time series data A and the output code sequence information B acquired through the machine learning in step S3 as a trained model M (step S5). This completes the training process.

図7は、図4のコード推定装置20によるコード推定処理の一例を示すフローチャートである。図7のコード推定処理は、図1のCPU130がコード推定プログラムを実行することにより行われる。まず、受付部21は、時系列データを受け付ける(ステップS11)。次に、推定部22は、訓練処理のステップS5で保存された訓練済モデルMを用いて、ステップS11で受け付けられた時系列データからコード列情報を推定する(ステップS12)。このとき、時系列データに含まれる音符列からは1つ、または複数のコード列を含むコード列情報が推定されるので、自由度の高いコード推定が行われる。また、時間的流れの中でコードチェンジのタイミングも推定されるので、より適切なコード推定が行われる。つまり、時系列データにはコードチェンジの区切りとなる情報は含まれていないが、推定部22は、コードチェンジのタイミングを含めたコード推定を行う。 Figure 7 is a flowchart showing an example of chord estimation processing by the chord estimation device 20 of Figure 4. The chord estimation processing of Figure 7 is performed by the CPU 130 of Figure 1 executing a chord estimation program. First, the reception unit 21 receives time-series data (step S11). Next, the estimation unit 22 estimates chord sequence information from the time-series data received in step S11 using the trained model M saved in step S5 of the training process (step S12). At this time, chord sequence information including one or more chord sequences is estimated from the sequence of notes included in the time-series data, allowing for highly flexible chord estimation. Furthermore, the timing of chord changes over time is also estimated, allowing for more appropriate chord estimation. In other words, although the time-series data does not include information that marks the boundaries of chord changes, the estimation unit 22 performs chord estimation that includes the timing of chord changes.

その後、生成部23は、ステップS11で受け付けられた時系列データの音符列およびステップS12で推定されたコード列情報に基づいて楽譜情報を生成する(ステップS13)。生成された楽譜情報に基づいて、コード付き楽譜が表示部160に表示されてもよい。これにより、コード推定処理が終了する。The generation unit 23 then generates musical score information based on the note sequence of the time-series data received in step S11 and the chord sequence information estimated in step S12 (step S13). Based on the generated musical score information, a musical score with chords may be displayed on the display unit 160. This completes the chord estimation process.

(5)実施の形態の効果
以上説明したように、本実施の形態に係るコード推定装置20は、複数の音符からなる音符列を含む時系列データを受け付ける受付部21と、訓練済モデルMを用いて、音符列に対応するコード列を示すコード列情報を推定する推定部22とを備える。この構成によれば、訓練済モデルMを用いて、時系列データにおける複数の音符の時間的流れから適切なコード列情報が推定される。これにより、音符列を含む時系列データに基づいてコード付き楽譜を提示することができる。音符列からは1つ、または複数のコード列が推定されるので、自由度の高いコード推定が行われる。
(5) Effects of the Embodiment As described above, the chord estimation device 20 according to the present embodiment includes a receiving unit 21 that receives time-series data including a note sequence consisting of a plurality of notes, and an estimation unit 22 that uses a trained model M to estimate chord sequence information indicating a chord sequence corresponding to the note sequence. With this configuration, the trained model M is used to estimate appropriate chord sequence information from the temporal flow of a plurality of notes in the time-series data. This makes it possible to present a musical score with chords based on time-series data including a note sequence. Since one or more chord sequences are estimated from a note sequence, chord estimation can be performed with a high degree of flexibility.

訓練済モデルMは、複数の音符からなる参照音符列を含む入力時系列データAと、参照音符列の各音符に対応するコード列を示す出力コード列情報Bとの間の入出力関係を習得した機械学習モデルであってもよい。この場合、時系列データからコード列情報を容易に推定することができる。The trained model M may be a machine learning model that has learned the input/output relationship between input time-series data A including a reference note sequence consisting of multiple notes, and output chord sequence information B indicating the chord sequence corresponding to each note in the reference note sequence. In this case, the chord sequence information can be easily estimated from the time-series data.

推定部22は、コード列におけるコードチェンジのタイミングについても推定してもよい。これにより、音符列に対応した、より適切なコード推定が行われる。 The estimation unit 22 may also estimate the timing of chord changes in the chord sequence. This allows for more appropriate chord estimation corresponding to the note sequence.

入力時系列データAは、参照音符列で表現される音楽のジャンルを指定するジャンル情報を含んでもよい。また、時系列データは、音符列で表現される音楽のジャンルを指定するジャンル情報を含んでもよい。そして、推定部22は、ジャンル情報を含む時系列データに基づいて、コード列情報を推定してもよい。これにより、音楽のジャンルに適したコード推定が行われる。 The input time series data A may include genre information specifying the genre of music represented by the reference note sequence. The time series data may also include genre information specifying the genre of music represented by the note sequence. The estimation unit 22 may then estimate chord sequence information based on the time series data including genre information. This allows chord estimation appropriate for the music genre.

入力時系列データAは、参照音符列で表現される音楽の調を指定する調情報を含んでもよい。また、時系列データは、音符列で表現される音楽の調を指定する調情報を含んでもよい。そして、推定部22は、調情報を含む時系列データに基づいて、コード列情報を推定してもよい。これにより、音楽の調に適したコード推定が行われる。 The input time series data A may include key information specifying the key of the music expressed by the reference note sequence. The time series data may also include key information specifying the key of the music expressed by the note sequence. The estimation unit 22 may then estimate chord sequence information based on the time series data including key information. This allows chord estimation appropriate to the key of the music.

入力時系列データAは、参照音符列で示される楽譜の難易度を指定する難易度情報を含んでもよい。また、時系列データは、音符列で示される楽譜の難易度を指定する難易度情報を含んでもよい。そして、推定部22は、難易度情報を含む時系列データに基づいて、コード列情報を推定してもよい。これにより、音符列で示される楽譜の難易度に応じて適切なコード推定が行われる。 The input time series data A may include difficulty level information that specifies the difficulty level of the musical score represented by the reference note sequence. The time series data may also include difficulty level information that specifies the difficulty level of the musical score represented by the note sequence. The estimation unit 22 may then estimate chord sequence information based on the time series data that includes the difficulty level information. This allows appropriate chord estimation to be performed according to the difficulty level of the musical score represented by the note sequence.

コード推定装置20は、音符列の各音符に対応するようにコード列情報が付されたコード付き楽譜を示す楽譜情報を生成する生成部23をさらに備えてもよい。 The chord estimation device 20 may further include a generation unit 23 that generates musical score information indicating a chord-attached musical score to which chord sequence information is attached to correspond to each note in the musical note sequence.

本実施の形態に係る訓練装置10は、複数の音符からなる参照音符列を含む入力時系列データAを取得する第1の取得部11と、参照音符列に対応するコード列を示す出力コード列情報Bを取得する第2の取得部12と、入力時系列データAと出力コード列情報Bとの間の入出力関係を習得した訓練済モデルMを構築する構築部13とを備える。この構成によれば、入力時系列データAと出力コード列情報Bとの間の入出力関係を習得した訓練済モデルMを容易に構築することができる。 The training device 10 according to this embodiment comprises a first acquisition unit 11 that acquires input time series data A including a reference note sequence consisting of a plurality of notes, a second acquisition unit 12 that acquires output chord sequence information B indicating a chord sequence corresponding to the reference note sequence, and a construction unit 13 that constructs a trained model M that has learned the input-output relationship between the input time series data A and the output chord sequence information B. This configuration makes it easy to construct a trained model M that has learned the input-output relationship between the input time series data A and the output chord sequence information B.

(6)他の実施の形態
上記実施の形態において、入力時系列データAは付加情報を含み、時系列データは付加情報を含むが、実施の形態はこれに限定されない。入力時系列データAは、参照音符列を含めばよく、付加情報を含まなくてもよい。同様に、時系列データは、音符列を含めばよく、付加情報を含まなくてもよい。
(6) Other Embodiments In the above embodiment, the input time series data A includes additional information, and the time series data includes additional information, but the embodiment is not limited to this. The input time series data A only needs to include a reference sequence of notes, and does not need to include additional information. Similarly, the time series data only needs to include a sequence of notes, and does not need to include additional information.

上記実施の形態において、入力時系列データAは拍節構造として“bar”および“beat”情報を有するが、実施の形態はこれに限定されない。入力時系列データAは拍節構造を有していなくてもよい。図8は、拍節構造を有していない入力時系列データAに対応して準備された出力コード列情報Bの一例を示す図である。図8に示すように、出力コード列情報Bは、“bar”および“beat”情報からなる拍節構造を有していない。 In the above embodiment, the input time series data A has "bar" and "beat" information as a metrical structure, but the embodiment is not limited to this. The input time series data A does not have to have a metrical structure. Figure 8 is a diagram showing an example of output chord sequence information B prepared in response to input time series data A that does not have a metrical structure. As shown in Figure 8, the output chord sequence information B does not have a metrical structure consisting of "bar" and "beat" information.

上記実施の形態において、入力時系列データAは付加情報として調情報、ジャンル情報および難易度情報を有する場合を例に説明した。構築部13は、付加情報の種類に応じて異なる訓練済モデルMを構築してもよいし、1つの訓練済モデルMを構築してもよい。あるいは、入力時系列データAは付加情報として、調情報、ジャンル情報および難易度情報のうち複数の情報を含めてもよい。 In the above embodiment, the input time series data A includes tone information, genre information, and difficulty level information as additional information. The construction unit 13 may construct different trained models M depending on the type of additional information, or may construct a single trained model M. Alternatively, the input time series data A may include multiple pieces of information selected from tone information, genre information, and difficulty level information as additional information.

また、上記実施の形態において、コード推定装置20は生成部23を含むが、実施の形態はこれに限定されない。演奏者は、推定部22により推定されたコード列情報を所望の楽譜に転記することによりコード付き楽譜を作成することができる。そのため、コード推定装置20は、生成部23を含まなくてもよい。 In addition, in the above embodiment, the chord estimation device 20 includes the generation unit 23, but the embodiment is not limited to this. A performer can create a score with chords by transcribing the chord sequence information estimated by the estimation unit 22 into a desired musical score. Therefore, the chord estimation device 20 does not need to include the generation unit 23.

上記実施の形態において、訓練データDはピアノにより演奏を行う際のコード列情報を推定するように訓練されるが、実施の形態はこれに限定されない。訓練データDは、ギター、ドラム等の他の楽器により演奏を行う際のコード列情報を推定するように訓練されてもよい。 In the above embodiment, the training data D is trained to estimate chord sequence information when playing on a piano, but the embodiment is not limited to this. The training data D may also be trained to estimate chord sequence information when playing on other instruments such as a guitar or drums.

上記実施の形態において、コード推定装置20の使用者が演奏者である場合を例に説明したが、コード推定装置20の使用者は、例えば、楽譜の制作会社のスタッフであってもよい。また、訓練装置10による機械学習は、楽譜の制作会社のスタッフにより事前に行われてもよい。 In the above embodiment, the user of the chord estimation device 20 is a performer, but the user of the chord estimation device 20 may also be, for example, a staff member of a music score production company. Furthermore, machine learning by the training device 10 may be performed in advance by a staff member of the music score production company.

Claims (14)

複数の音符からなる音符列を含む時系列データを受け付ける受付部と、
訓練済モデルを用い、前記時系列データに基づいて、前記音符列に対応するコード列を示す情報であって、コードチェンジタイミングが記録されたコード列情報を推定する推定部と、を備え、
前記推定部は、前記コード列におけるコードチェンジのタイミングについても推定するコード推定装置。
a receiving unit that receives time-series data including a musical note sequence consisting of a plurality of musical notes;
an estimation unit that estimates chord sequence information indicating a chord sequence corresponding to the musical note sequence, the chord sequence information including chord change timings, based on the time-series data, using a trained model;
The chord estimation device, wherein the estimation unit also estimates the timing of chord changes in the chord sequence.
前記訓練済モデルは、複数の音符からなる参照音符列を含む入力時系列データと、前記参照音符列に対応するコード列を示す出力コード列情報との間の入出力関係を習得したモデルである、請求項1に記載のコード推定装置。 The chord estimation device of claim 1, wherein the trained model is a model that has learned the input/output relationship between input time-series data including a reference note sequence consisting of a plurality of notes and output chord sequence information indicating a chord sequence corresponding to the reference note sequence. 前記入力時系列データは、前記参照音符列で表現される音楽のジャンルを指定するジャンル情報を含み、
前記時系列データは、前記音符列で表現される音楽のジャンルを指定するジャンル情報を含み、
前記推定部は、ジャンル情報を含む前記時系列データに基づいて、前記コード列情報を推定する、請求項2に記載のコード推定装置。
the input time-series data includes genre information that specifies the genre of music expressed by the reference sequence of notes;
the time-series data includes genre information that specifies the genre of music expressed by the sequence of notes;
The chord estimation device according to claim 2 , wherein the estimation unit estimates the chord string information based on the time-series data including genre information.
前記入力時系列データは、前記参照音符列で表現される音楽の調を指定する調情報を含み、
前記時系列データは、前記音符列で表現される音楽の調を指定する調情報を含み、
前記推定部は、調情報を含む前記時系列データに基づいて、前記コード列情報を推定する、請求項2に記載のコード推定装置。
the input time-series data includes key information that specifies the key of the music expressed by the reference sequence of notes;
the time-series data includes key information that specifies the key of the music expressed by the sequence of notes;
The chord estimation device according to claim 2 , wherein the estimation unit estimates the chord string information based on the time-series data including key information.
前記入力時系列データは、前記参照音符列で示される楽譜の難易度を指定する難易度情報を含み、
前記時系列データは、前記音符列で示される楽譜の難易度を指定する難易度情報を含み、
前記推定部は、難易度情報を含む前記時系列データに基づいて、前記コード列情報を推定する、請求項2に記載のコード推定装置。
the input time-series data includes difficulty level information that specifies the difficulty level of the musical score indicated by the reference note sequence,
the time-series data includes difficulty level information that specifies the difficulty level of the musical score represented by the sequence of notes,
The chord estimation device according to claim 2 , wherein the estimation unit estimates the chord string information based on the time-series data including difficulty level information.
前記音符列の各音符に対応するように前記コード列情報が付されたコード付き楽譜を示す楽譜情報を生成する生成部をさらに備える、請求項1~5のいずれか一項に記載のコード推定装置。 The chord estimation device according to any one of claims 1 to 5, further comprising a generation unit that generates musical score information indicating a chord-attached musical score to which the chord sequence information is attached so as to correspond to each note of the musical note sequence. 複数の音符からなる参照音符列を含む入力時系列データを取得する第1の取得部と、
前記参照音符列に対応するコード列を示す情報であって、コードチェンジタイミングが記録された出力コード列情報を取得する第2の取得部と、
前記コード列におけるコードチェンジのタイミングを含め、前記入力時系列データと前記出力コード列情報との間の入出力関係を習得した訓練済モデルを構築する構築部と、を備える訓練装置。
a first acquisition unit that acquires input time-series data including a reference note sequence consisting of a plurality of notes;
a second acquisition unit that acquires output chord sequence information, which is information indicating a chord sequence corresponding to the reference note sequence and in which chord change timings are recorded;
a construction unit that constructs a trained model that has learned the input/output relationship between the input time series data and the output code sequence information, including the timing of code changes in the code sequence.
複数の音符からなる音符列を含む時系列データを受け付け、
訓練済モデルを用い、前記時系列データに基づいて、前記音符列に対応するコード列を示す情報であって、コードチェンジタイミングが記録されたコード列情報を推定し、
前記コード列におけるコードチェンジのタイミングについても推定する、コンピュータにより実行されるコード推定方法。
Accepts time series data containing a sequence of multiple notes,
using the trained model, based on the time-series data, to estimate chord sequence information indicating a chord sequence corresponding to the musical note sequence, the chord sequence information including chord change timings;
The computer-implemented chord estimation method also estimates the timing of chord changes in the chord sequence.
前記訓練済モデルは、複数の音符からなる参照音符列を含む入力時系列データと、前記参照音符列に対応するコード列を示す出力コード列情報との間の入出力関係を習得したモデルである、請求項8に記載のコンピュータにより実行されるコード推定方法。 The computer-executed chord estimation method of claim 8, wherein the trained model is a model that has learned the input/output relationship between input time-series data including a reference note sequence consisting of multiple notes and output chord sequence information indicating a chord sequence corresponding to the reference note sequence. 前記入力時系列データは、前記参照音符列で表現される音楽のジャンルを指定するジャンル情報を含み、
前記時系列データは、前記音符列で表現される音楽のジャンルを指定するジャンル情報を含み、
前記推定することは、ジャンル情報を含む前記時系列データに基づいて、前記コード列情報を推定する、請求項9に記載のコンピュータにより実行されるコード推定方法。
the input time-series data includes genre information that specifies the genre of music expressed by the reference sequence of notes;
the time-series data includes genre information that specifies the genre of music expressed by the sequence of notes;
10. The computer-implemented chord estimation method of claim 9 , wherein said estimating comprises estimating said chord string information based on said time-series data including genre information.
前記入力時系列データは、前記参照音符列で表現される音楽の調を指定する調情報を含み、
前記時系列データは、前記音符列で表現される音楽の調を指定する調情報を含み、
前記推定することは、調情報を含む前記時系列データに基づいて、前記コード列情報を推定する、請求項9に記載のコンピュータにより実行されるコード推定方法。
the input time-series data includes key information that specifies the key of the music expressed by the reference sequence of notes;
the time-series data includes key information that specifies the key of the music expressed by the sequence of notes;
10. The computer-implemented chord estimation method of claim 9, wherein said estimating comprises estimating said chord string information based on said time-series data including key information.
前記入力時系列データは、前記参照音符列で示される楽譜の難易度を指定する難易度情報を含み、
前記時系列データは、前記音符列で示される楽譜の難易度を指定する難易度情報を含み、
前記推定することは、難易度情報を含む前記時系列データに基づいて、前記コード列情報を推定する、請求項9に記載のコンピュータにより実行されるコード推定方法。
the input time-series data includes difficulty level information that specifies the difficulty level of the musical score indicated by the reference note sequence,
the time-series data includes difficulty level information that specifies the difficulty level of the musical score represented by the sequence of notes,
10. The computer-implemented chord estimation method of claim 9, wherein said estimating comprises estimating said chord string information based on said time-series data including difficulty level information.
さらに、前記音符列の各音符に対応するように前記コード列情報が付されたコード付き楽譜を示す楽譜情報を生成する、請求項8~12のいずれか一項に記載のコンピュータにより実行されるコード推定方法。 The computer-implemented chord estimation method described in any one of claims 8 to 12 further generates musical score information indicating a chord-attached musical score to which the chord sequence information is attached so as to correspond to each note of the musical note sequence. 複数の音符からなる参照音符列を含む入力時系列データを取得し、
前記参照音符列に対応するコード列を示す情報であって、コードチェンジタイミングが記録された出力コード列情報を取得し、
前記コード列におけるコードチェンジのタイミングを含め、前記入力時系列データと前記出力コード列情報との間の入出力関係を習得した訓練済モデルを構築する、コンピュータにより実行される訓練方法。
Obtain input time series data including a reference note sequence consisting of a plurality of notes;
obtain output chord sequence information indicating a chord sequence corresponding to the reference note sequence, the output chord sequence information including recorded chord change timings;
A computer-implemented training method for constructing a trained model that has learned the input-output relationship between the input time-series data and the output code sequence information, including the timing of code changes in the code sequence.
JP2023508892A 2021-03-26 2022-03-03 Chord estimation device, training device, chord estimation method, and training method Active JP7772056B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2025146660A JP2025172909A (en) 2021-03-26 2025-09-04 Code estimation device and code estimation method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2021052532 2021-03-26
JP2021052532 2021-03-26
PCT/JP2022/009233 WO2022202199A1 (en) 2021-03-26 2022-03-03 Code estimation device, training device, code estimation method, and training method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2025146660A Division JP2025172909A (en) 2021-03-26 2025-09-04 Code estimation device and code estimation method

Publications (2)

Publication Number Publication Date
JPWO2022202199A1 JPWO2022202199A1 (en) 2022-09-29
JP7772056B2 true JP7772056B2 (en) 2025-11-18

Family

ID=83396894

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2023508892A Active JP7772056B2 (en) 2021-03-26 2022-03-03 Chord estimation device, training device, chord estimation method, and training method
JP2025146660A Pending JP2025172909A (en) 2021-03-26 2025-09-04 Code estimation device and code estimation method

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2025146660A Pending JP2025172909A (en) 2021-03-26 2025-09-04 Code estimation device and code estimation method

Country Status (3)

Country Link
JP (2) JP7772056B2 (en)
CN (1) CN117043852A (en)
WO (1) WO2022202199A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7786153B2 (en) * 2021-11-24 2025-12-16 ヤマハ株式会社 Musical piece inference device, music piece inference method, music piece inference program, model generation device, model generation method, and model generation program

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268636A (en) 2001-03-06 2002-09-20 Yamaha Corp Device for automatic musical symbol determination based upon music data, device for musical score display control based upon music data, and program for automatic musical symbol determination based upon music data
JP2004184510A (en) 2002-11-29 2004-07-02 Pioneer Electronic Corp Device and method for preparing musical data
JP2015031738A (en) 2013-07-31 2015-02-16 株式会社河合楽器製作所 Chord progression estimation and detection device and chord progression estimation and detection program
WO2015159475A1 (en) 2014-04-18 2015-10-22 ソニー株式会社 Information processing device and information processing method
US20160027420A1 (en) 2012-04-30 2016-01-28 Nokia Corporation Evaluation of beats, chords and downbeats from a musical audio signal
JP2017215610A (en) 2017-08-08 2017-12-07 ヤマハ株式会社 Chord progression information generation apparatus and program for implementing chord progression information generation method
WO2020080239A1 (en) 2018-10-19 2020-04-23 ソニー株式会社 Information processing method, information processing device, and information processing program
JP2020095200A (en) 2018-12-14 2020-06-18 株式会社Nttドコモ Music analysis system
WO2020145326A1 (en) 2019-01-11 2020-07-16 ヤマハ株式会社 Acoustic analysis method and acoustic analysis device

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002268636A (en) 2001-03-06 2002-09-20 Yamaha Corp Device for automatic musical symbol determination based upon music data, device for musical score display control based upon music data, and program for automatic musical symbol determination based upon music data
JP2004184510A (en) 2002-11-29 2004-07-02 Pioneer Electronic Corp Device and method for preparing musical data
US20160027420A1 (en) 2012-04-30 2016-01-28 Nokia Corporation Evaluation of beats, chords and downbeats from a musical audio signal
JP2015031738A (en) 2013-07-31 2015-02-16 株式会社河合楽器製作所 Chord progression estimation and detection device and chord progression estimation and detection program
WO2015159475A1 (en) 2014-04-18 2015-10-22 ソニー株式会社 Information processing device and information processing method
JP2017215610A (en) 2017-08-08 2017-12-07 ヤマハ株式会社 Chord progression information generation apparatus and program for implementing chord progression information generation method
WO2020080239A1 (en) 2018-10-19 2020-04-23 ソニー株式会社 Information processing method, information processing device, and information processing program
JP2020095200A (en) 2018-12-14 2020-06-18 株式会社Nttドコモ Music analysis system
WO2020145326A1 (en) 2019-01-11 2020-07-16 ヤマハ株式会社 Acoustic analysis method and acoustic analysis device

Also Published As

Publication number Publication date
CN117043852A (en) 2023-11-10
WO2022202199A1 (en) 2022-09-29
JP2025172909A (en) 2025-11-26
JPWO2022202199A1 (en) 2022-09-29

Similar Documents

Publication Publication Date Title
JP5454317B2 (en) Acoustic analyzer
JP3582359B2 (en) Music score allocating apparatus and computer readable recording medium recording music score allocating program
CN115004294B (en) Arrangement generation method, arrangement generation device, and computer program product
US9734810B2 (en) Automatic harmony generation system
CN113870818B (en) Training method, device, medium and computing equipment for song chord arrangement model
JP2025172909A (en) Code estimation device and code estimation method
CN110959172B (en) Performance analysis method, performance analysis device and storage medium
JP6565528B2 (en) Automatic arrangement device and program
JP6760450B2 (en) Automatic arrangement method
JP2012123120A (en) Musical piece order determination device, musical piece order determination method, and musical piece order determination program
JP6175812B2 (en) Musical sound information processing apparatus and program
JP4333700B2 (en) Chord estimation apparatus and method
JPWO2022113914A5 (en)
WO2025100264A1 (en) Information processing method, information processing system, and program
KR102490769B1 (en) Method and device for evaluating ballet movements based on ai using musical elements
JP7841641B2 (en) Fingering display device, training device, fingering display method, and training method
WO2022215250A1 (en) Music selection device, model creation device, program, music selection method, and model creation method
WO2020171035A1 (en) Sound signal synthesis method, generative model training method, sound signal synthesis system, and program
US20240420668A1 (en) Systems, methods, and computer program products for generating motif structures and music conforming to motif structures
WO2026088707A1 (en) Information processing method, information processing system, and program
JP3788076B2 (en) Automatic composer and storage medium
JP5988672B2 (en) Musical score playing apparatus and musical score playing program
JP5119708B2 (en) Performance evaluation system and performance evaluation program
JP2026074295A (en) Music generation device, music generation method, music generation program, model generation device, model generation method, and model generation program
JP5119709B2 (en) Performance evaluation system and performance evaluation program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241022

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20250610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250904

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20251007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20251020

R150 Certificate of patent or registration of utility model

Ref document number: 7772056

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150