JP3546779B2 - Acoustic signal analysis method - Google Patents
Acoustic signal analysis method Download PDFInfo
- Publication number
- JP3546779B2 JP3546779B2 JP31509999A JP31509999A JP3546779B2 JP 3546779 B2 JP3546779 B2 JP 3546779B2 JP 31509999 A JP31509999 A JP 31509999A JP 31509999 A JP31509999 A JP 31509999A JP 3546779 B2 JP3546779 B2 JP 3546779B2
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- acoustic signal
- sound
- component
- resonance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 title claims description 37
- 230000005236 sound signal Effects 0.000 claims description 40
- 238000010183 spectrum analysis Methods 0.000 claims description 12
- 238000000034 method Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 24
- 101100194363 Schizosaccharomyces pombe (strain 972 / ATCC 24843) res2 gene Proteins 0.000 description 11
- 239000011295 pitch Substances 0.000 description 6
- 230000002194 synthesizing effect Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 101100115709 Mus musculus Stfa2 gene Proteins 0.000 description 4
- 230000000994 depressogenic effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、特定の成分音を含む音響信号と前記特性の成分音を含まない音響信号とから、前記特定の成分音を抽出することのできる音響信号の分析方法に関する。
【0002】
【従来の技術】
ピアノの音は、主に鍵盤操作(タッチ)でコントロールされるが、ダンパーペダル(サステインペダル)の操作による音色制御(共鳴制御)も演奏表現に重大な影響力を有している。
電子ピアノなどの電子楽器において、このようなピアノの音を再現しようとする場合、ダンパーペダルON時、OFF時それぞれの楽音波形をサンプリングしておき、それらをペダル操作量に応じて重み付け混合(クロスフェード)することが行われている。しかしながら、この方法では、自然な音色変化を得るのが難しいという問題点がある。
そこで、通常押鍵音にダンパーペダル操作量に応じて音量やその変化態様(特に、リリースレート)が制御された共鳴音成分を加える方法が知られている。この方法による電子楽器においては、ノートオンが来るとノーマル音と共鳴音を同時にスタートし、共鳴音の音量、リリースレートをダンパーペダル(サステインペダル)の踏み込み量に応じて制御するようにしている。これによって、パー不良行きの微妙なペダルのコントロールに応じて響き具合を変化させたり、打鍵した後からペダルが踏まれた場合の共鳴効果を再現することができ、より自然な音色変化を得ることができる。
【0003】
【発明が解決しようとする課題】
そこで、残る問題は、ダンパーペダルをONとしたときの共鳴音成分をピアノのサンプリング音からどうやって抽出するかという点になる。
単純には、ダンパーペダルON時、OFF時それぞれにおけるピアノの楽音をサンプリングし、両者の差をとれば共鳴音成分が抽出されるはずであるが、両者の倍音構造、位相関係の違いなどから、通常押鍵音にこの単純差分による共鳴音成分を加算しても、自然な共鳴感は得られず、本物のピアノらしい、うなり感、にごり感を再現することができないというのが現状である。
【0004】
そこで、本発明は、共鳴音成分などの特定の成分音を含まない音響信号に加算したときに、不自然さがない前記特定の成分音を抽出することのできる音響信号分析方法を提供することを目的としている。
【0005】
【課題を解決するための手段】
上記目的を達成するために、本発明の音響信号分析方法は、特定の成分音を含む第1の音響信号と、該第1の音響信号と同一音高であって前記特定の成分音を含まない第2の音響信号とから、前記特定の成分音を抽出する音響信号分析方法であって、前記第1の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得るステップと、前記第2の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得るステップと、前記第1の音響信号の振幅情報と前記第2の音響信号の位相情報とにより、第3の音響信号波形を生成するステップと、該第3の音響信号波形と前記第2の音響信号波形とから前記特定の成分音波形の倍音成分を求めるステップとを有するものである。
【0006】
また、本発明の他の音響信号分析方法は、特定の成分音を含む第1の音響信号と、該第1の音響信号と同一音高であって前記特定の成分音を含まない第2の音響信号とから、前記特定の成分音を抽出する音響信号分析方法であって、前記第1の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得るステップと、前記第2の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得るステップと、前記第1の音響信号の振幅情報と位相情報および前記第2の音響信号の振幅情報と位相情報から、それぞれ、前記第1の音響信号波形と前記第2の音響信号波形に共通して含まれている倍音成分を抜き出した結果に基づいて、第3の音響信号波形を生成するステップと、前記第3の音響信号波形と前記第2の音響信号波形とから前記特定の成分音波形の倍音成分を求めるステップとを有するものである。
【0007】
さらに、本発明のさらに他の音響信号分析方法は、特定の成分音を含む第1の音響信号と、該第1の音響信号と同一音高であって前記特定の成分音を含まない第2の音響信号とから、前記特定の成分音を抽出する音響信号分析方法であって、前記第1の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得る第1のステップと、前記第2の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得る第2のステップと、前記第1の音響信号波形から、前記第1の音響信号波形と前記第2の音響信号波形に共通して含まれている倍音成分を抜き出した結果に基づいて、前記特定の成分音を含む第3の音響信号波形を生成する第3のステップと、前記第2の音響信号波形から、前記第1の音響信号波形と前記第2の音響信号波形に共通して含まれている倍音成分を抜きだした結果に基づいて、前記特定の成分音を含まない第4の音響信号波形を生成する第4のステップと、前記第3の音響信号波形のうちの非倍音成分波形の複数の帯域毎の成分を求める第5のステップと、前記第4の音響信号波形のうちの非倍音成分波形の複数の帯域毎の成分を求める第6のステップと、前記第5のステップと前記第6のステップにより求められた前記各帯域毎の成分から前記特定の成分音の非倍音成分波形を求めるステップとを有するものである。
【0008】
【発明の実施の形態】
図1は、本発明の音響信号分析方法が実行される楽音分析合成装置のハードウエア構成の一例を示すブロック図である。
この図において、1はこの楽音分析合成装置全体の制御を行うCPU、2はCPU1が実行する各種制御プログラム、楽音分析プログラムおよび楽音合成プログラムなどの各種プログラムを記憶するプログラムメモリ、3は各種制御情報、後述する各種のデータの記憶および一時記憶領域(バッファ)やワークエリアとして使用されるデータメモリ、4は表示装置、5はキーボードおよびポインティングデバイスなどの入力装置、6は鍵盤などの演奏操作子、7は楽音を合成する楽音合成部(シンセサイズユニット)、8は楽音波形サンプルをアナログ信号に変換し、図示しないサウンドシステムに出力するデジタルアナログ変換器(DAC)である。また、9は電話回線、インターネット、LANなどの通信ネットワーク11と接続するためのネットワークインターフェース回路、10はシステムバスである。
なお、図示していないが、CD−ROM、DVD、MO、FDなどの外部記憶媒体の駆動装置を接続してもよいことは当然である。
【0009】
前記楽音分析プログラムおよび楽音合成プログラムは、いわゆる分析・再合成(Analysis & Resynthesis)方式の楽音合成を行なうものである。すなわち、楽音波形をスペクトル解析してその楽音に含まれている基音周波数およびその倍音周波数に対応する線スペクトル成分を抽出する。具体的には、分析対象となる音響信号波形サンプルに時間窓を掛けてフーリエ分析を行ない、振幅、位相、周波数のデータを得(短時間フーリエ分析(STF:Short Time Fourier analysis))、該フーリエ分析出力の振幅データからピークを成す全ての周波数位置を検出する処理を、前記時間窓を移動しながら行い、各フレームにおけるピークのうち軌跡をなすものを追跡する(以下、特に断りがない限り、この対象音の短時間フーリエ分析からピーク追跡に至る処理をここではSTF分析処理と呼ぶことにする)。そして、このようにして得られた軌跡のうち、所望のデータを選択し、それらを正弦波合成することにより、元の楽音波形のうちの決定論的(確定的)成分(Deterministic成分)波形を合成する。そして、前記元の楽音波形から、このDeterministic成分波形を減算することにより、残余(確率的、非決定論的)成分(Residual成分)波形を得る。
合成時には、前記軌跡のデータをモディファイして再合成することにより、Deterministic波形をモディファイし、前記Residual波形については、イコライザなどによる信号処理によりモディファイして、両者を加算することにより所望の波形を得ることができる。
【0010】
次に、本発明の音響信号分析方法について、図2〜5のフローチャートを参照して説明する。
本発明の音響信号分析方法は、共鳴音などの特定の成分音を、該特定の成分音を含む音響信号波形データと含まない音響信号波形データから算出するものであり、その概要は、まず、前記特定の成分音を含む音響信号波形データと含まない音響信号波形データの両者を前述した短時間フーリエ分析によりDeterministic成分とResidual成分とに分離し、Deterministic成分については、特定の成分音を含む波形の位相を特定の成分音を含まない波形の位相に揃えて引き算し、Residual成分については、両者のResidual成分を帯域フィルタ群により帯域分割し、各帯域のエンベロープの差を使って引き算し、前記Deterministic成分の引き算結果と前記Residual成分の引き算結果を加算することにより、前記特定の成分音のみの音響信号波形を生成するものである。
【0011】
以下、特定の成分音としてピアノのダンパーペダルをオンとしたときの共鳴音成分を含む楽音波形サンプルデータ(P_kc_t_D.wave)とそのような共鳴音成分を含まない通常押鍵時の楽音波形サンプルデータ(P_KC_t_ND.wave)を入力として、前記ダンパーペダルをオンとしたときの共鳴音成分波形を抽出する場合を例にとって説明する。ここで、前記データの名称中の、Pは楽器名(ピアノ)を示し、kcはキーコード(音高)、tはタッチ、Dはダンパーペダルがオンであること、NDはダンパーペダルがオフであることを示している。
図6は、このような入力データの一例を示す図であり、(a)はダンパーペダルをオンとしたときのピアノのG3音(P_3G_t_D.wave)、(b)はダンパーペダルが踏み込まれていないときのピアノのG3音(P_3G_t_ND.wave)を示している。
【0012】
図2のステップS1において、まず、前記両入力データの波形の頭出し処理、すなわち、両入力波形データの時間軸を合わせる処理を行ない、両入力データの不要区間を除いた波形データを生成する。この処理は、例えば、入力データのうちの一方を基準とし、両者の相関が最大となるように、他方の波形データのタイミングを調節することにより行われる。ここでは、共鳴音成分を含まない波形データ(P_KC_t_ND.wave)を基準に共鳴音成分を含む波形データ(P_kc_t_D.wave)のタイミングを調節するものとする。したがって、このステップS1の時間軸合せ&波形切り出し処理の結果、頭出しされた共鳴音成分を含む波形データ(P_kc_t_D_ASYNC.wave)が生成される。
【0013】
次に、ステップS2において、前記頭出しされた共鳴音成分を含む波形データ(P_kc_t_D_ASYNC.wave)と前記共鳴音成分を含まない波形データ(P_KC_t_ND.wave)それぞれについて、先に述べた短時間フーリエ分析に基づくSTF分析処理が実行される。これにより、前述のように、前記共鳴音成分を含む波形データ(P_kc_t_D_ASYNC.wave)をSTF分析したデータ(STFデータ)(P_kc_t_D_ASYNC.stf)が生成され、その軌跡をなすデータからDeterministic波形データ(P_kc_t_D_ASYNC.det)が合成され、さらに、元の波形データから前記Deterministic波形データを減算することによりResidual波形データ(P_kc_t_D_ASYNC.res)が生成される。
また、同様に、前記共鳴音成分を含まない波形データ(P_KC_t_ND.wave)から、STFデータ(P_KC_t_ND.stf)、Deterministic波形データ(P_KC_t_ND.det)、および、Residual波形データ(P_KC_t_ND.res)が生成される。
【0014】
図7の(a)は前記図6の(b)に示した共鳴音成分を含まない楽音波形(P_3G_t_ND.wave)のSTFデータ(P_3G_t_ND.stf)を示し、図7の(b)は、前記図6の(a)に示した共鳴音成分を含む楽音波形(P_3G_t_D.wave)を頭出しした楽音波形のSTFデータ(P_kc_t_D_ASYNC.stf)を示している。この図7の(a)および(b)に示すように、STF分析処理により、各倍音成分ごとに、その振幅情報(すなわち、エンベロープの時間変化)およびその位相情報(すなわち、ピッチの時間変動)を求めることができる。
【0015】
次に、このように生成された各データにもとづいて、共鳴音成分のDeterministic波形およびResidual波形の抽出が行われる。
まず、共鳴音成分のDeterministic波形の抽出処理が行われる。共鳴音成分のDeterministic波形を抽出するためには、共鳴音成分を含む波形データのDeterministic波形から共鳴音成分を含まない波形データのDeterministic波形を減算すればよいのであるが、前記図7の(a)および(b)に示すように、両波形の倍音成分は必ずしも一致していない。すなわち、図7の(a)に示した共鳴音成分を含まない波形においては、第13倍音成分が含まれていないのに対し、図7の(b)に示した共鳴音成分を含む波形においては、第14倍音成分が含まれていない。したがって、両波形のDeterministic波形成分同士の減算を行なうためには、両者に含まれている倍音成分を一致させることが必要となる。
【0016】
そこで、図3のステップS3において、前記各STFデータ(P_kc_t_D_ASYNC.stfおよびP_kc_t_ND.stf)からそれらに共通に含まれている倍音成分のみを抜き出して新たなSTFデータ(P_kc_t_D_ASYNC_COM.stfおよびP_kc_t_ND_COM.stf)を作成する。このとき、Deterministic波形データP_kc_t_D_ASYNC.det2およびP_kc_t_ND_.det2、ならびに、Residual波形データP_kc_t_D_ASYNC.res2およびP_kc_t_ND.res2も作り直される。すなわち、Deterministic波形データは、それぞれ第12倍音までのデータを含むものとなり、残された倍音成分(第13倍音成分あるいは第14倍音成分)は、それぞれ、Residual波形に移行される。具体的には、それぞれ、前記共通の倍音成分を有する新たなSTFデータに基づいて、それぞれ、新たなDeterministic波形データを合成する。そして、この再合成された波形データをそれぞれの元波形データから減算してそれぞれ対応する新たなResidual波形データを求める。
【0017】
前記図7に示した例においては、各STFデータから第12倍音までを含む新たなSTFデータ(P_3G_t_D_ASYNC_COM.stfおよびP_3G_t_ND_COM.stf)、Deterministic波形データ(P_3G_t_D_ASYNC.det2およびP_3G_t_ND.det2)、および、Residual波形データ(P_3G_t_D_ASYNC.res2およびP_3G_t_ND.res2)を生成する。このとき、新たなSTFデータに含まれなかった第13倍音あるいは第14倍音のDeterministic成分は、それぞれResidual成分の中に移行されることとなる。図8の(a)および(b)は、このようにして生成された新たなSTFデータ(P_3G_t_D_ASYNC_COM.stfおよびP_3G_t_ND_COM.stf)を示している。この図8の(a)と(b)とを比較すると明らかなように、新たに生成されたSTFデータは、ともに第12倍音までのデータとなっている。
【0018】
このように共通の倍音成分のみを含む新たなSTFデータを生成した後、ステップS4(図3)に進み、共鳴音を含む楽音の振幅情報と共鳴音を含まない楽音の位相情報を持つ波形データを生成する。すなわち、前記P_kc_t_D_COM.stfの振幅情報と前記P_kc_t_ND_COM.stfの位相情報(周波数情報)を用いて、再合成を行ない、共鳴音を含む波形データP_kc_T_D.det#を生成する。この処理により、得られた共鳴音を含む波形データP_kc_T_D.det#から前記作り直した共鳴音を含まないDeterministic波形データ(P_kc_t_ND_.det2)を減算して得られる波形データは、位相を揃えて減算しているため、前記元の共鳴音を含む波形データ(P_kc_t_D_ASYNC.det2)から前記作り直した共鳴音を含まないDeterministic波形データ(P_kc_t_ND_.det2)を減算して得られたデータと比較して、振幅の差のみを含むものとなっている。
【0019】
このようにして求めた波形データは、これを前記共鳴音を含まないDeterministic波形データ(P_kc_t_ND_.det2)に加算することにより、前記共鳴音を含む波形データP_kc_T_D.det#となるのであるから、この波形をそのまま共鳴音のDeterministic波形として使用することもできる。しかしながら、この場合には、この波形を前記元の共鳴音を含まない波形データ(P_kc_t_ND.det2)に加算したときに、元の音のアタック部にも波形データが加算されてしまうこととなるので、アタック部分でフェードインするように変更する。図3のステップS5において、このアタック部に含まれる成分音の処理が行われる。
【0020】
図5は、このアタック部に含まれる成分音の処理の内容を示すフローチャートである。図5のステップS11において、まず、前記共鳴音を含まないResidual波形(P_kc_t_ND.res2)を調べる。図9は、この例における共鳴音を含まないResidual波形データP_3G_t_ND.res2を示す図である。この例では、図9に示すように、立上がりから約200msの期間には、鍵盤を押したときに鍵盤下部が鍵盤を保持する棚板に当たり発生する震動音(棚板音)が含まれていることがわかる。周知のように、ピアノでは、概略、押鍵操作開始→棚板音(下死点到達)→共鳴音(上死点到達)→ハンマー打撃(弦震動音)というシーケンスとなる。したがって、この棚板音の部分については、共鳴音を含まないようにして、元の音を保持するようにしている。
【0021】
このステップS11において、アタック部分のチェックをした結果、棚板音などの重畳成分音が含まれていないときには、ステップS12の判断結果がNOとなり、ステップS14に進む。
一方、前記図9に示した例のように、重畳成分音が含まれているときには、ステップS13に進み、その重畳成分音(棚板音)の含まれている区間時間Tnを計測する。図9に示した例では、この区間時間Tnは200msとなる。
そして、ステップS14に進み、前記区間時間Tn経過後の時刻から所定時間区間Tx(例えば、100ms)で、前記P_kc_t_ND_COM.stfと前記P_kc_t_D_COM.stfとをクロスフェード処理して、新たなSTFデータP_kc_t_XF.stf2を生成する。図示した例では、アタックの開始時点からTn(200ms)までは、前記共鳴音を含まないSTFデータP_kc_t_ND_COM.stfとし、TnからTxの時間、すなわち、200msから300msまでの時間で、前記共鳴音を含まないSTFデータP_3G_t_ND_COM.stfから前記共鳴音を含むSTFデータP_3G_t_D_COM.stfにフェードインを行ない、300ms以降の区間では共鳴音を含むSTFデータP_3G_t_D_COM.stfとなるような、新たなSTFデータP_3G_t_XF.stf2を生成する。
【0022】
このようにして、このステップS5(図3)において、棚板音の区間は共鳴音を含まず、その後共鳴音を含む楽音のSTFデータP_3G_t_XF.stf2が生成される。
そして、ステップS6に進み、共鳴音のDeterministic波形データP_kc_t_DMP.detを生成する。この処理は、前記ステップS5において生成したSTFデータP_3G_t_XF.stf2からDeterministic波形データを再合成し、この再合成したDeterministic波形データを前記共鳴音を含まないDeterministic波形データP_kc_t_ND.det2から減算することにより、共鳴音の倍音成分Deterministic波形データP_kc_t_DMP.detを生成する処理である。
図10は、このようにして生成されたピアノのG3音のDeterministic波形データP_3G_t_DMP.detを示している。
以上により、共鳴音成分のDeterministic波形データを得ることができた。
【0023】
次に、共鳴音成分のResidual波形データの抽出について説明する。
共鳴音(全弦開放状態での響き)は、多数の異なる音高の弦の微妙な振動の重なりや干渉に基づくものであり、共鳴音を含む楽音のResidual波形と共鳴音を含まない楽音のResidual波形の差を単純にとるだけでは、自然な共鳴感のある楽音を得ることができない。そこで、本発明においては、次に説明するように、帯域分割を行ない、Residual波形データを抽出するようにしている。
Residual波形データを抽出するために、本発明では、共鳴音を含む楽音のResidual波形データと共鳴音を含まない楽音のResidual波形データそれぞれについて帯域フィルタ群(帯域フィルタバンク)を用いて各帯域毎のエンベロープを求め、該エンベロープ同士の引き算を行ない、その結果を前記共鳴音を含む楽音のResidual波形に乗算するという処理を行なう。
【0024】
図4のステップS7において、前記共鳴音を含む楽音のResidual波形データ(P_kc_t_D_ASYNC.res2)と前記共鳴音を含まない楽音のResidual波形データ(P_kc_t_ND.res2)それぞれを帯域分割し、各帯域毎のResidual成分波形データを求め、該各帯域毎のResidual成分波形データからそれぞれ振幅エンベロープを生成する。
図11は、この帯域分割に用いられる帯域フィルタバンクの特性の一例を示す図であり、ここでは、この図11に示すような、対数間隔で設定された周波数間隔を有する中心周波数の異なる複数個のバンドパスフィルタからなる帯域フィルタバンクを用いて、(a)〜(e)に5つの帯域に分割するものとして説明する。なお、分割帯域数は、これに限らず、任意の数とすることができる。
【0025】
前記共鳴音を含む楽音のResidual波形データ(P_kc_t_D_ASYNC.res2)を帯域フィルタバンクに通すことにより、各帯域毎のResidual波形データ(P_kc_t_D_res2_B1.res、…、P_kc_t_D_res2_Bn.res)が得られる。そして、該得られた各帯域毎のResidual波形データから、それぞれ、その振幅エンベロープ(P_kc_t_D_res2_B1.env、…、P_kc_t_D_res2_Bn.env)を算出する。
また、前記共鳴音を含まない楽音のResidual波形データ(P_kc_t_ND.res2)を前記帯域フィルタバンクに通すことにより、各帯域毎のResidual波形データ(P_kc_t_ND_res2_B1.res、…、P_kc_t_ND_res2_Bn.res)を求める。そして、該各帯域毎のResidual波形データから、それぞれの振幅エンベロープ(P_kc_t_ND_res2_B1.env、…、P_kc_t_ND_res2_Bn.env)を算出する。
【0026】
図12の(a)〜(e)は、共鳴音を含む前記P_3G_t_D_ASYNC.res2を前記図11に示した帯域フィルタバンクに入力したときの各帯域毎の波形データ、P_3G_t_D_res2_B1.res〜P_3G_t_D_res2_B5.resを示している。
また、図13の(a)〜(e)は、前記図12に示した各帯域毎のResidual波形データの振幅エンベロープP_3G_t_D_res2_B1.env〜P_3G_t_D_res2_B5.envを示している。なお、この振幅エンベロープは、それぞれ、その最大値を100とするように正規化して示している。
さらに、図14の(a)〜(e)は、共鳴音を含まない前記P_3G_t_ND.res2を前記図11に示した帯域フィルタバンクに入力したときの各帯域毎のResidual波形データP_3G_t_ND_res2_B1.res〜P_3G_t_ND_res2_B5.resを示しており、図15の(a)〜(e)は、該各帯域毎のResidual波形データP_3G_t_ND_res2_B1.res〜P_3G_t_ND_res2_B5.resからそれぞれ算出した各帯域毎の振幅エンベロープP_3G_t_ND_res2_B1.env〜P_3G_t_ND_res2_B5.envを示している。
【0027】
このようにして求めた共鳴音を含む楽音の各帯域毎のResidual波形の振幅エンベロープ(図13)をターゲットとし、共鳴音を含まない楽音の各帯域毎の振幅エンベロープ(図15)をリファレンスとして、同じ帯域同士の減算をすればよいのであるが、このまま減算を行なった結果を用いると、この結果(ターゲット)−(リファレンス)をリファレンスに加算したときに、リファレンスのアタック部を劣化させてしまう可能性がある。また、響きの楽音の引き算を行なうという意味からも、ここでは、アタック部については引き算は行なわず、そのまま保存することとしている。そのため、各エンベロープの立上がりをマスクしたのち、引き算を行なうようにしている。
【0028】
図4のステップS8は、このマスク処理を行なうものであり、各エンベロープP_3G_t_D_res2_B1.env〜P_3G_t_D_res2_B5.env、P_3G_t_ND_res2_B1.env〜P_3G_t_ND_res2_B5.envそれぞれについて、時刻0〜最大レベル到達時間までの区間(アタック区間)のエンベロープを最大値(100)に変更する処理を行なう。
図16は、このステップS8によりマスク処理が行われた共鳴音を含むResidual波形(ターゲット)の各帯域毎の振幅エンベロープ(P_3G_t_D_res2_B1.env#〜P_3G_t_D_res2_B5.env#)を示す図であり、図17は、同じくマスク処理が行われた共鳴音を含まないResidual波形(リファレンス)の各帯域毎の振幅エンベロープP_3G_t_ND_res2_B1.env#〜P_3G_t_ND_res2_B5.env#を示す図である。
【0029】
次に、ステップS9に進み、前記ステップS8においてマスク処理された各帯域毎の振幅エンベロープから各帯域毎の共鳴音のエンベロープ(P_kc_t_RS_B1.env〜P_kc_t_RS_B5.env)を算出する。この計算は、次の式(1)に基づいて実行される。
【数1】
この式(1)により得られるエンベロープP_kc_t_RS_B1.env〜P_kc_t_RS_B5.envは、各帯域における共鳴音の差によるエンベロープであると考えられる。
【0030】
次に、ステップS10に進み、前記ステップS9において算出した各帯域毎の共鳴音のエンベロープを対応する各帯域毎のターゲットの波形データ、すなわち、共鳴音を含む楽音の波形データP_kc_t_D_res2_Bx.res (x=1,2,...,n)と乗算して、各帯域毎の差の波形データP_kc_t_RS_Bx.wave(x=1,2,...,n)を求める。
【数2】
図18の(a)〜(e)は、このようにして算出した、前述した例における各帯域毎の共鳴音成分のResidual波形データ(P_kc_t_RS_B1.wave〜P_kc_t_RS_B5.wave)を示している。
【0031】
そして、このようにして算出した各帯域毎の共鳴音成分のResidual波形データを加算した後、係数Psrを乗算して、共鳴音成分のResidual波形データ(P_kc_t_DMP.res)を算出する。
すなわち、
【数3】
ここで、係数Prsは、共鳴音を含む楽音のResidual波形(ターゲット)と共鳴音を含まない楽音のResidual波形(リファレンス)の差のパワーと、これまでのステップで算出した共鳴音のResidual波形のパワーとを一致させるために乗ぜられる係数である。
図19は、このようにして算出されたピアノのG3音の共鳴音成分のResidual波形データ(P_3G_t_DMP.res)を示す図である。
【0032】
このようにして、共鳴音成分のResidual波形データを得ることができた。
次に、前記ステップS6で求めた共鳴音成分のDeterministic波形データ(図10)と前記共鳴音成分のResidual波形データ(図19)とを加算して、共鳴音成分P_kc_t_DMP.waveを算出する。
すなわち、
【数4】
図20は、このようにして算出したピアノのG3音の共鳴音成分(P_G3_t_DMP.wave)を示す図である。
このようにして、共鳴音成分を抽出することができた。
【0033】
図21は、このようにして抽出した共鳴音成分を楽音生成に使用する場合の例を示す概念図である。
この図において、21は前述した共鳴音成分を含まない楽音波形データ(P_kc_t_ND.wave)、22は前述のようにして抽出した共鳴音成分の波形データ(P_kc_t_DMP.wave)、23は利得調節器であり、図示するように、ダンパーペダルの踏み込み量によりゲインが制御されるようになされている。また、24は前記共鳴音成分を含まない楽音波形データ(P_kc_t_ND.wave)21と前記共鳴音成分の波形データ(P_kc_t_DMP.wave)とを加算して出力する加算器である。このように、ダンパーペダルの踏み込み量に応じた重みを付けられた共鳴音成分を共鳴音成分を含まない楽音波形に加算することにより、自然な共鳴音を有する楽音波形を生成することができる。特に、微妙なペダルのコントロールに応じて音の響き具合を変化させたり、打鍵した後からペダルが踏まれた場合の共鳴効果を再現することが可能となる。
【0034】
なお、以上においては、特定の成分音として、共鳴音成分、特に、ダンパーペダルを操作したときの共鳴音成分を例にとって説明したが、本発明の楽音分析方法は、これに限られることはなく、タッチの異なる楽音、例えば、ff(フォルテッシモ)とmf(メゾフォルテ)の楽音とを分析対象として、ff−mfの楽音波形を作成して、タッチの違いによる成分音を抽出するようにするなど、各種の場合に適用することができる。
また、楽音に限らず、2つあるいは複数の音響信号を対象として、一方には含まれず、他方には含まれているような特定の成分音を抽出する場合に同様に適用することができる。
さらに、上述においては、楽音分析合成装置において実行するものとして説明したが、本発明の音響信号分析方法は、汎用のコンピュータ上のソフトウエアとして実現することもでき、あるいは、専用のハードウエア構成として実現することも可能である。
【0035】
【発明の効果】
以上説明したように、本発明の音響信号分析方法によれば、特定の成分音を含む音響信号と特定の成分音を含まない音響信号とから、前記特定の成分音を含まない音響信号と加算しても不自然さの無い特定の成分音を抽出することが可能となる。
【図面の簡単な説明】
【図1】本発明の音響信号分析方法が適用される装置の構成例を示すブロック図である。
【図2】本発明の音響信号分析方法を説明するためのフローチャートその1である。
【図3】本発明の音響信号分析方法を説明するためのフローチャートその2である。
【図4】本発明の音響信号分析方法を説明するためのフローチャートその3である。
【図5】アタック部に含まれる成分音の処理を説明するための図である。
【図6】処理対象となる楽音波形の例を示す図であり、(a)は共鳴音成分を含む楽音波形、(b)は共鳴音成分を含まない楽音波形である。
【図7】処理対象となる楽音波形の短時間フーリエ分析結果を示す図であり、(a)は共鳴音成分を含まない楽音波形の分析結果、(b)は共鳴音成分を含む楽音波形の分析結果である。
【図8】図7の結果から、共通の倍音成分を抜きだした結果を示す図であり、(a)は共鳴音成分を含まない楽音、(b)は共鳴音成分を含む楽音である。
【図9】共鳴音を含まないResidual波形データを示す図である。
【図10】共鳴音成分のDeterministic波形データを示す図である。
【図11】帯域フィルタバンクの特性の例を示す図である。
【図12】共鳴音成分を含む楽音のResidual成分を帯域フィルタバンクに通したときの各帯域の出力波形を示す図である。
【図13】図12の出力の振幅エンベロープを示す図である。
【図14】共鳴音成分を含まない楽音のResidual成分を帯域フィルタバンクに通したときの各帯域の出力波形を示す図である。
【図15】図14の出力波形の振幅エンベロープを示す図である。
【図16】図13の振幅エンベロープにマスク処理を施した結果を示す図である。
【図17】図15の振幅エンベロープのマスク処理を施した結果を示す図である。
【図18】共鳴音成分のResidual波形の各帯域毎の成分を示す図である。
【図19】算出された共鳴音成分のResidual波形を示す図である。
【図20】抽出された共鳴音成分の波形を示す図である。
【図21】本発明の音響信号分析方法により抽出された共鳴音成分を使用するときの概念図である。
【符号の説明】
1 CPU、2 プログラムメモリ、3 データメモリ、4 表示装置、5 入力装置、6 演奏操作子、7 楽音合成部、8 DAC、9 ネットワークインターフェース、10 システムバス、11 通信ネットワーク[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an acoustic signal analysis method capable of extracting the specific component sound from an audio signal including a specific component sound and an audio signal not including the characteristic component sound.
[0002]
[Prior art]
The sound of the piano is mainly controlled by keyboard operation (touch), but timbre control (resonance control) by operating a damper pedal (sustain pedal) also has a significant influence on performance expression.
To reproduce the sound of such a piano in an electronic musical instrument such as an electronic piano, each tone waveform is sampled when the damper pedal is ON and OFF, and weighted mixing (crossing) is performed according to the pedal operation amount. Fade) is being done. However, this method has a problem that it is difficult to obtain a natural tone color change.
Therefore, there is known a method of adding a resonance tone component whose volume and its change mode (particularly, release rate) are controlled in accordance with the damper pedal operation amount to the normal key depression sound. In the electronic musical instrument according to this method, when a note-on comes, a normal sound and a resonance sound are started at the same time, and the volume and release rate of the resonance sound are controlled in accordance with the depression amount of a damper pedal (sustain pedal). This makes it possible to change the sound level according to the subtle pedal control for poor par and reproduce the resonance effect when the pedal is depressed after hitting the key, and obtain a more natural tone change Can be.
[0003]
[Problems to be solved by the invention]
Therefore, the remaining problem is how to extract the resonance component when the damper pedal is turned on from the sampled sound of the piano.
Simply, when the damper pedal is ON and OFF, the piano tone is sampled and the difference between the two is taken, so that the resonance component should be extracted. At present, even if a resonance component based on this simple difference is added to a normal key depression sound, a natural resonance feeling cannot be obtained, and it is not possible to reproduce a beat, a feeling of smell, and a feeling of a real piano.
[0004]
Therefore, the present invention provides an acoustic signal analysis method capable of extracting the specific component sound having no unnaturalness when added to an audio signal not including a specific component sound such as a resonance component. It is an object.
[0005]
[Means for Solving the Problems]
In order to achieve the above object, an acoustic signal analysis method according to the present invention includes a first acoustic signal including a specific component sound, At the same pitch as the first acoustic signal, An audio signal analysis method for extracting the specific component sound from a second audio signal that does not include the specific component sound, the spectrum analysis of the first audio signal waveform, To the time axis Amplitude information and To the time axis Obtaining phase information; and performing a spectrum analysis on the second acoustic signal waveform. To the time axis Amplitude information and To the time axis Obtaining phase information; generating a third audio signal waveform based on the amplitude information of the first audio signal and the phase information of the second audio signal; From the second acoustic signal waveform and the specific component sound waveform Overtone Obtaining a component.
[0006]
Further, another acoustic signal analysis method of the present invention provides a method of analyzing a first acoustic signal including a specific component sound. At the same pitch as the first acoustic signal, An audio signal analysis method for extracting the specific component sound from a second audio signal that does not include the specific component sound, the spectrum analysis of the first audio signal waveform, To the time axis Amplitude information and To the time axis Obtaining phase information; and performing a spectrum analysis on the second acoustic signal waveform. To the time axis Amplitude information and To the time axis Obtaining phase information; and obtaining the first sound signal waveform and the second sound from the amplitude information and the phase information of the first sound signal and the amplitude information and the phase information of the second sound signal, respectively. Generating a third acoustic signal waveform based on a result of extracting a harmonic component commonly included in the signal waveform; and generating the third acoustic signal waveform from the third acoustic signal waveform and the second acoustic signal waveform. Specific component Overtone Obtaining a component.
[0007]
Further, still another method for analyzing an acoustic signal according to the present invention includes the first acoustic signal including a specific component sound, At the same pitch as the first acoustic signal, An audio signal analysis method for extracting the specific component sound from a second audio signal that does not include the specific component sound, the spectrum analysis of the first audio signal waveform, To the time axis Amplitude information and To the time axis A first step of obtaining phase information, and a spectrum analysis of the second acoustic signal waveform, To the time axis Amplitude information and To the time axis A second step of obtaining phase information, and a result of extracting, from the first acoustic signal waveform, harmonic components commonly included in the first acoustic signal waveform and the second acoustic signal waveform. A third step of generating a third sound signal waveform including the specific component sound based on the first sound signal waveform and the second sound signal waveform from the second sound signal waveform. A fourth step of generating a fourth acoustic signal waveform that does not include the specific component sound based on a result of extracting a harmonic component that is included in common; Non Overtone A fifth step of obtaining a component of each of the plurality of bands of the component waveform; Overtone A sixth step of obtaining a component for each of a plurality of bands of the component waveform; and determining a non-specific sound of the specific component sound from the components of each band obtained in the fifth step and the sixth step. Overtone Obtaining a component waveform.
[0008]
BEST MODE FOR CARRYING OUT THE INVENTION
FIG. 1 is a block diagram showing an example of a hardware configuration of a musical sound analysis / synthesis apparatus on which an acoustic signal analysis method of the present invention is executed.
In FIG. 1,
Although not shown, a driving device for an external storage medium such as a CD-ROM, DVD, MO, or FD may be connected.
[0009]
The tone analysis program and tone synthesis program perform tone synthesis according to the so-called analysis and resynthesis (Analysis & Synthesis) method. That is, the spectrum of the musical tone waveform is analyzed to extract a line spectral component corresponding to the fundamental frequency included in the musical tone and its harmonic frequency. Specifically, a time window is applied to the acoustic signal waveform sample to be analyzed to perform Fourier analysis to obtain amplitude, phase, and frequency data (Short Time Fourier Analysis (STF)). The process of detecting all frequency positions forming peaks from the amplitude data of the analysis output is performed while moving the time window, and the trajectory of peaks in each frame is tracked (hereinafter, unless otherwise specified, The processing from the short-time Fourier analysis of the target sound to the peak tracking will be referred to herein as STF analysis processing). Then, desired data is selected from the trajectories obtained in this way, and the selected data is sine-wave-synthesized to form a deterministic (deterministic) component waveform of the original musical sound waveform. Combine. Then, the residual (probabilistic, non-deterministic) component (residual component) waveform is obtained by subtracting this deterministic component waveform from the original musical sound waveform.
At the time of synthesis, the deterministic waveform is modified by modifying and re-synthesizing the data of the trajectory, and the Residual waveform is modified by signal processing using an equalizer or the like, and a desired waveform is obtained by adding both. be able to.
[0010]
Next, the acoustic signal analysis method of the present invention will be described with reference to the flowcharts of FIGS.
The acoustic signal analysis method of the present invention is a method of calculating a specific component sound such as a resonance sound from audio signal waveform data including the specific component sound and audio signal waveform data not including the specific component sound. Both the acoustic signal waveform data including the specific component sound and the acoustic signal waveform data not including the specific component sound are separated into a Deterministic component and a Residual component by the short-time Fourier analysis described above, and the Deterministic component has a waveform including the specific component sound. Is subtracted by aligning the phase of the waveform with the phase of a waveform that does not include the specific component sound. The subtraction result of the Deterministic component and the Residual component By adding the can calculation result, and generates a sound signal waveform of only the specific component tones.
[0011]
Hereinafter, tone waveform sample data (P_kc_t_D.wave) containing a resonance component when the damper pedal of the piano is turned on as a specific component tone, and tone waveform sample data at the time of normal key pressing that does not contain such a resonance component (P_KC_t_ND.wave) will be described as an example to extract a resonance sound component waveform when the damper pedal is turned on. Here, in the name of the data, P indicates a musical instrument name (piano), kc is a key code (pitch), t is touch, D is a damper pedal is on, and ND is a damper pedal is off. It indicates that there is.
FIG. 6 is a diagram showing an example of such input data. FIG. 6A shows a piano G3 sound (P_3G_t_D.wave) when the damper pedal is turned on, and FIG. 6B shows a state in which the damper pedal is not depressed. G3 sound (P_3G_t_ND.wave) of the piano at the time.
[0012]
In step S1 of FIG. 2, first, a cueing process of the waveforms of both input data, that is, a process of adjusting the time axis of both input waveform data, is performed to generate waveform data excluding unnecessary sections of both input data. This processing is performed, for example, by adjusting one of the input data as a reference and adjusting the timing of the other waveform data so that the correlation between the two becomes maximum. Here, it is assumed that the timing of the waveform data (P_kc_t_D.wave) including the resonance component is adjusted based on the waveform data (P_KC_t_ND.wave) not including the resonance component. Therefore, as a result of the time axis alignment & waveform cutout processing in step S1, waveform data (P_kc_t_D_ASYNC.wave) including the cueed resonance component is generated.
[0013]
Next, in step S2, the short-time Fourier analysis described above is performed on the waveform data (P_kc_t_D_ASYNC.wave) including the cueed resonance component and the waveform data (P_KC_t_ND.wave) not including the resonance component, respectively. Is performed based on the STF. As a result, as described above, data (STF data) (P_kc_t_D_ASYNC.stf) obtained by subjecting the waveform data (P_kc_t_D_ASYNC.wave) including the resonance component to STF analysis is generated. .Det) and Residual waveform data (P_kc_t_D_ASYNC.res) is generated by subtracting the Deterministic waveform data from the original waveform data.
Similarly, STF data (P_KC_t_ND.stf), Deterministic waveform data (P_KC_t_ND.det), and Residual waveform data (P_KC_t_ND.res) are derived from waveform data (P_KC_t_ND.wave) that does not include the resonance component. Is done.
[0014]
FIG. 7A shows the STF data (P_3G_t_ND.stf) of the tone waveform (P_3G_t_ND.wave) that does not include the resonance component shown in FIG. 6B, and FIG. 7B shows the STF data. 7 shows STF data (P_kc_t_D_ASYNC.stf) of a musical sound waveform obtained by cueing out a musical sound waveform (P_3G_t_D.wave) including a resonance component shown in FIG. 6A. As shown in FIGS. 7A and 7B, the amplitude information (ie, time change of the envelope) and the phase information (ie, time change of the pitch) are obtained by the STF analysis process for each harmonic component. Can be requested.
[0015]
Next, a Deterministic waveform and a Residual waveform of a resonance component are extracted based on each data thus generated.
First, a process of extracting a deterministic waveform of a resonance component is performed. In order to extract the Deterministic waveform of the resonance component, the Deterministic waveform of the waveform data not including the resonance component may be subtracted from the Deterministic waveform of the waveform data including the resonance component. ) And (b), the harmonic components of both waveforms do not always match. That is, while the waveform containing no resonance component shown in FIG. 7A does not include the thirteenth harmonic component, the waveform containing the resonance component shown in FIG. Does not include the 14th harmonic component. Therefore, in order to subtract the Deterministic waveform components of both waveforms, it is necessary to match the harmonic components contained in both.
[0016]
Therefore, in step S3 of FIG. 3, only the harmonic components that are commonly included in each of the STF data (P_kc_t_D_ASYNC.stf and P_kc_t_ND.stf) are extracted and new STF data (P_kc_t_D_ASYNC_COM.stf and P_kc_N_st.Pf). Create At this time, the Deterministic waveform data P_kc_t_D_ASYNC. det2 and P_kc_t_ND_. det2 and Residual waveform data P_kc_t_D_ASYNC. res2 and P_kc_t_ND. res2 is also recreated. That is, the Deterministic waveform data includes data up to the twelfth harmonic, and the remaining harmonic components (the thirteenth harmonic component or the fourteenth harmonic component) are respectively shifted to Residual waveforms. Specifically, new Deterministic waveform data is synthesized based on the new STF data having the common harmonic components, respectively. Then, the re-synthesized waveform data is subtracted from the respective original waveform data to obtain corresponding new Residual waveform data.
[0017]
In the example shown in FIG. 7, new STF data (P_3G_t_D_ASYNC_COM.stf and P_3G_t_ND_COM.stf) including each STF data to the twelfth harmonic, Deterministic waveform data (P_3G_t_D_ASYNC.det_d_Nt.Det2_D_N_d.Det2_d_D_A_N_d.Det2_d_D_A_N_d.Det2_Dt2D.det2D.det2D.det2.Det2.Det2.Det2.Dt2D.det3.Dt2D.Det2D.Det2.Det2.Det2.Dt2.Dt2D3D.Det2D.Det2.Det2.Det2.Det2.Dt2D.Det2.Det2.Det2.Det3. Generate waveform data (P_3G_t_D_ASYNC.res2 and P_3G_t_ND.res2). At this time, the Deterministic components of the thirteenth harmonic and the fourteenth harmonic that are not included in the new STF data are respectively transferred to the Residual components. FIGS. 8A and 8B show new STF data (P_3G_t_D_ASYNC_COM.stf and P_3G_t_ND_COM.stf) generated in this manner. As is apparent from a comparison between FIGS. 8A and 8B, the newly generated STF data is data up to the twelfth harmonic.
[0018]
After the new STF data including only the common harmonic component is generated, the process proceeds to step S4 (FIG. 3), where the waveform data having the amplitude information of the tone including the resonance and the phase information of the tone not including the resonance is generated. Generate That is, the P_kc_t_D_COM. stf amplitude information and P_kc_t_ND_COM. The re-synthesis is performed using the phase information (frequency information) of the stf and the waveform data P_kc_T_D. Generate det #. By this processing, the waveform data P_kc_T_D. Since the waveform data obtained by subtracting the Deterministic waveform data (P_kc_t_ND_.det2) that does not include the recreated resonance sound from det # is phase-aligned and subtracted, the waveform data (P_kc_t_D_ASYNC) including the original resonance sound is subtracted. .Det2) is compared with data obtained by subtracting the recreated Deterministic waveform data (P_kc_t_ND_.det2) that does not include the resonance sound, and includes only the amplitude difference.
[0019]
The waveform data thus obtained is added to the Deterministic waveform data (P_kc_t_ND_.det2) that does not include the resonance, thereby obtaining the waveform data P_kc_T_D. Since it is det #, this waveform can also be used as it is as a deterministic waveform of the resonance sound. However, in this case, when this waveform is added to the waveform data (P_kc_t_ND.det2) that does not include the original resonance sound, the waveform data is also added to the attack portion of the original sound. , Change to fade in at the attack part. In step S5 in FIG. 3, the processing of the component sound included in the attack portion is performed.
[0020]
FIG. 5 is a flowchart showing the content of processing of the component sound included in the attack unit. In step S11 of FIG. 5, first, a Residual waveform (P_kc_t_ND.res2) not including the resonance sound is examined. FIG. 9 shows Residual waveform data P_3G_t_ND. It is a figure showing res2. In this example, as shown in FIG. 9, during a period of about 200 ms from the rise, a vibration sound (shelf sound) generated when the lower part of the keyboard hits the shelf holding the keyboard when the keyboard is pressed. You can see that. As is well known, in a piano, the sequence is roughly as follows: key depression operation start → shelf sound (at bottom dead center) → resonance sound (at top dead center) → hammer strike (string vibration sound). Therefore, the portion of the shelf sound does not include the resonance sound, and the original sound is retained.
[0021]
In step S11, if the result of checking the attack portion indicates that no superimposed component sound such as a shelf sound is included, the determination result in step S12 is NO, and the process proceeds to step S14.
On the other hand, when the superposed component sound is included as in the example shown in FIG. 9, the process proceeds to step S13, and the section time Tn including the superposed component sound (shelf sound) is measured. In the example shown in FIG. 9, the section time Tn is 200 ms.
Then, the process proceeds to step S14, and at a predetermined time interval Tx (for example, 100 ms) from the time after the lapse of the interval time Tn, the P_kc_t_ND_COM. stf and the P_kc_t_D_COM. stf and a new STF data P_kc_t_XF. Generate stf2. In the illustrated example, from the start of the attack to Tn (200 ms), the STF data P_kc_t_ND_COM. STF data P_3G_t_ND_COM. which does not include the resonance sound in a time from Tn to Tx, that is, a time from 200 ms to 300 ms. stf data P_3G_t_D_COM. In the section after 300 ms, the STF data P_3G_t_D_COM. new STF data P_3G_t_XF. Generate stf2.
[0022]
Thus, in this step S5 (FIG. 3), the section of the shelf sound does not include the resonance sound, and thereafter, the STF data P_3G_t_XF. stf2 is generated.
Then, the process proceeds to step S6, where the deterministic waveform data P_kc_t_DMP. Generate det. This process is based on the STF data P_3G_t_XF. Deterministic waveform data is re-synthesized from stf2, and the re-synthesized Deterministic waveform data is converted to Deterministic waveform data P_kc_t_ND. det2 to obtain the overtone component Deterministic waveform data P_kc_t_DMP. This is a process for generating det.
FIG. 10 shows Deterministic waveform data P_3G_t_DMP. det.
As described above, Deterministic waveform data of the resonance component was obtained.
[0023]
Next, extraction of Residual waveform data of a resonance component will be described.
The resonance sound (sound in a full string open state) is based on the overlapping or interference of subtle vibrations of a large number of strings with different pitches, and includes a Residual waveform of a musical tone including a resonance tone and a musical tone not including a resonance tone. Simply taking the difference between the Residual waveforms cannot provide a musical tone with a natural resonance. Therefore, in the present invention, as described below, band division is performed to extract Residual waveform data.
In order to extract Residual waveform data, in the present invention, a band filter group (band filter bank) is used for each of the Residual waveform data of a musical tone including a resonance tone and the Residual waveform data of a musical tone not including a resonance tone. An envelope is obtained, the envelopes are subtracted from each other, and the result is multiplied by a Residual waveform of a musical tone including the resonance sound.
[0024]
In step S7 of FIG. 4, the Residual waveform data (P_kc_t_D_ASYNC.res2) of the tone including the resonance and the Residual waveform data (P_kc_t_ND.res2) of the tone not including the resonance are band-divided, and the Residual of each band is divided. Component waveform data is obtained, and an amplitude envelope is generated from the Residual component waveform data for each band.
FIG. 11 is a diagram showing an example of the characteristics of a band filter bank used for this band division. In this case, as shown in FIG. 11, a plurality of bands having different center frequencies having frequency intervals set in logarithmic intervals are used. The description will be made assuming that the band is divided into five bands in (a) to (e) using a band filter bank including the band-pass filters described above. The number of divided bands is not limited to this, and may be any number.
[0025]
By passing Residual waveform data (P_kc_t_D_ASYNC.res2) of the musical tone including the resonance tone through a band filter bank, Residual waveform data (P_kc_t_D_res2_B1.res,..., P_kc_t_D_res2_Bn.res) for each band is obtained. Then, the amplitude envelopes (P_kc_t_D_res2_B1.env,..., P_kc_t_D_res2_Bn.env) are calculated from the obtained Residual waveform data for each band.
Further, by passing Residual waveform data (P_kc_t_ND.res2) of the musical tone not including the resonance tone through the band filter bank, Residual waveform data (P_kc_t_ND_res2_B1.res,..., P_kc_t_ND_res2_Bn.res.) For each band is obtained. Then, respective amplitude envelopes (P_kc_t_ND_res2_B1.env,..., P_kc_t_ND_res2_Bn.env) are calculated from the Residual waveform data for each band.
[0026]
(A) to (e) of FIG. 12 show the P_3G_t_D_ASYNC. res2 is input to the bandpass filter bank shown in FIG. 11, and the waveform data for each band, P_3G_t_D_res2_B1. res to P_3G_t_D_res2_B5. Res is shown.
13A to 13E show amplitude envelopes P_3G_t_D_res2_B1.B1... Of the Residual waveform data for each band shown in FIG. env to P_3G_t_D_res2_B5. env. The amplitude envelopes are normalized so that the maximum value is 100.
Further, (a) to (e) of FIG. 14 show the P_3G_t_ND. Res2 is input to the bandpass filter bank shown in FIG. 11 and the residual waveform data P_3G_t_ND_res2_B1. res to P_3G_t_ND_res2_B5. FIG. 15A to FIG. 15E show Residual waveform data P_3G_t_ND_res2_B1. res to P_3G_t_ND_res2_B5. res calculated from P.res for each band P_3G_t_ND_res2_B1. env to P_3G_t_ND_res2_B5. env.
[0027]
The amplitude envelope (FIG. 13) of the Residual waveform for each band of the musical tone including the resonance thus obtained is set as a target, and the amplitude envelope (FIG. 15) of each band of the musical tone not including the resonance is used as a reference. The subtraction of the same band may be performed, but if the result of the subtraction is used as it is, when the result (target) − (reference) is added to the reference, the attack portion of the reference may be deteriorated. There is. In addition, from the viewpoint of subtracting the sound of the sound, here, the attack portion is not subtracted but is stored as it is. Therefore, the subtraction is performed after masking the rising edge of each envelope.
[0028]
Step S8 in FIG. 4 carries out this masking process. Each of the envelopes P_3G_t_D_res2_B1. env to P_3G_t_D_res2_B5. env, P_3G_t_ND_res2_B1. env to P_3G_t_ND_res2_B5. For each env, processing is performed to change the envelope in the section (attack section) from
FIG. 16 is a diagram showing amplitude envelopes (P_3G_t_D_res2_B1.env # to P_3G_t_D_res2_B5.env #) of each band of the Residual waveform (target) including the resonance sound subjected to the mask processing in step S8, and FIG. , The amplitude envelope P_3G_t_ND_res2_B1... Of each band of the Residual waveform (reference) that does not include the resonance sound that has also been subjected to the mask processing. env # to P_3G_t_ND_res2_B5. It is a figure which shows env #.
[0029]
Next, the process proceeds to step S9, and the envelopes (P_kc_t_RS_B1.env to P_kc_t_RS_B5.env) of the resonance sound for each band are calculated from the amplitude envelope for each band masked in step S8. This calculation is performed based on the following equation (1).
(Equation 1)
The envelopes P_kc_t_RS_B1. env to P_kc_t_RS_B5. env is considered to be an envelope due to a difference in resonance sound in each band.
[0030]
Next, the process proceeds to step S10, where the envelope of the resonance sound for each band calculated in step S9 is converted into the waveform data of the target for each band, that is, the waveform data P_kc_t_D_res2_Bx. res (x = 1, 2,..., n), and the difference waveform data P_kc_t_RS_Bx. wave (x = 1, 2,..., n) is obtained.
(Equation 2)
FIGS. 18A to 18E show Residual waveform data (P_kc_t_RS_B1.wave to P_kc_t_RS_B5.wave) of the resonance component of each band in the above-described example, which are calculated as described above.
[0031]
Then, after adding the thus-calculated Residual waveform data of the resonance component for each band, the resultant is multiplied by a coefficient Psr to calculate Residual waveform data (P_kc_t_DMP.res) of the resonance component.
That is,
[Equation 3]
Here, the coefficient Prs is the power of the difference between the Residual waveform (target) of the musical tone including the resonance and the Residual waveform (reference) of the musical tone not including the resonance, and the Residual waveform of the resonance calculated in the previous steps. This is a coefficient multiplied to match power.
FIG. 19 is a diagram illustrating the Residual waveform data (P_3G_t_DMP.res) of the resonance component of the G3 sound of the piano calculated in this manner.
[0032]
In this way, Residual waveform data of the resonance component could be obtained.
Next, the deterministic waveform data of the resonance component obtained in step S6 (FIG. 10) and the Residual waveform data of the resonance component (FIG. 19) are added, and the resonance component P_kc_t_DMP. Wave is calculated.
That is,
(Equation 4)
FIG. 20 is a diagram illustrating the resonance component (P_G3_t_DMP.wave) of the G3 sound of the piano calculated in this manner.
Thus, the resonance component was able to be extracted.
[0033]
FIG. 21 is a conceptual diagram showing an example of a case where the thus-extracted resonance component is used for musical tone generation.
In this figure,
[0034]
In the above, the resonance component, particularly the resonance component when the damper pedal is operated has been described as an example of the specific component sound, but the musical sound analysis method of the present invention is not limited to this. For example, a tone waveform of ff-mf is created by analyzing musical sounds having different touches, for example, ff (fortessimo) and mf (mesoforte), and component sounds due to differences in touch are extracted. It can be applied to various cases.
In addition, the present invention can be similarly applied to a case where a specific component sound which is not included in one and is included in the other is extracted for two or a plurality of audio signals as well as the musical sound.
Further, in the above description, the sound signal analyzing and synthesizing apparatus is described as being executed. However, the acoustic signal analyzing method of the present invention can be realized as software on a general-purpose computer, or as a dedicated hardware configuration. It is also possible to realize.
[0035]
【The invention's effect】
As described above, according to the acoustic signal analysis method of the present invention, an acoustic signal including a specific component sound and an acoustic signal not including a specific component sound are added to the acoustic signal not including the specific component sound. Even if it is, a specific component sound without unnaturalness can be extracted.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration example of an apparatus to which an acoustic signal analysis method according to the present invention is applied.
FIG. 2 is a first flowchart illustrating an acoustic signal analysis method according to the present invention.
FIG. 3 is a second flowchart illustrating the acoustic signal analysis method of the present invention.
FIG. 4 is a third flowchart illustrating the acoustic signal analysis method of the present invention.
FIG. 5 is a diagram for explaining processing of a component sound included in an attack unit.
6A and 6B are diagrams showing examples of musical sound waveforms to be processed, wherein FIG. 6A is a musical sound waveform including a resonance component, and FIG. 6B is a musical sound waveform not including a resonance component.
7A and 7B are diagrams showing the results of short-time Fourier analysis of a musical sound waveform to be processed, wherein FIG. 7A shows the analysis result of a musical sound waveform not including a resonance component, and FIG. It is an analysis result.
8A and 8B are diagrams showing a result obtained by extracting a common harmonic component from the result of FIG. 7, wherein FIG. 8A is a musical tone not including a resonance component, and FIG. 8B is a musical tone including a resonance component.
FIG. 9 is a diagram showing Residual waveform data that does not include a resonance sound.
FIG. 10 is a view showing Deterministic waveform data of a resonance component.
FIG. 11 is a diagram illustrating an example of characteristics of a bandpass filter bank.
FIG. 12 is a diagram showing output waveforms of each band when a Residual component of a musical tone including a resonance component is passed through a band filter bank.
FIG. 13 is a diagram showing an amplitude envelope of the output of FIG. 12;
FIG. 14 is a diagram showing output waveforms of each band when a Residual component of a musical tone not including a resonance component is passed through a band filter bank.
FIG. 15 is a diagram illustrating an amplitude envelope of the output waveform of FIG. 14;
FIG. 16 is a diagram illustrating a result of performing a mask process on the amplitude envelope of FIG. 13;
FIG. 17 is a diagram illustrating a result of performing a mask process on the amplitude envelope in FIG. 15;
FIG. 18 is a diagram showing a component of a Residual waveform of a resonance component for each band.
FIG. 19 is a diagram showing a calculated Residual waveform of a resonance component.
FIG. 20 is a diagram showing a waveform of an extracted resonance component.
FIG. 21 is a conceptual diagram when using a resonance component extracted by the acoustic signal analysis method of the present invention.
[Explanation of symbols]
1 CPU, 2 program memory, 3 data memory, 4 display device, 5 input device, 6 performance operator, 7 tone synthesizer, 8 DAC, 9 network interface, 10 system bus, 11 communication network
Claims (3)
前記第1の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得るステップと、
前記第2の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得るステップと、
前記第1の音響信号の振幅情報と前記第2の音響信号の位相情報とにより、第3の音響信号波形を生成するステップと、
該第3の音響信号波形と前記第2の音響信号波形とから前記特定の成分音波形の倍音成分を求めるステップと
を有することを特徴とする音響信号分析方法。Extracting the specific component sound from a first audio signal including the specific component sound and a second audio signal having the same pitch as the first audio signal and not including the specific component sound; An acoustic signal analysis method,
Wherein the first acoustic signal waveform spectral analysis, and obtaining the phase information for the amplitude information and the time axis for the time axis,
The second acoustic signal waveform spectral analysis, and obtaining the phase information for the amplitude information and the time axis for the time axis,
Generating a third acoustic signal waveform based on the amplitude information of the first acoustic signal and the phase information of the second acoustic signal;
Obtaining a harmonic component of the specific component sound waveform from the third acoustic signal waveform and the second acoustic signal waveform.
前記第1の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得るステップと、
前記第2の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得るステップと、
前記第1の音響信号の振幅情報と位相情報および前記第2の音響信号の振幅情報と位相情報から、それぞれ、前記第1の音響信号波形と前記第2の音響信号波形に共通して含まれている倍音成分を抜き出した結果に基づいて、第3の音響信号波形を生成するステップと、
前記第3の音響信号波形と前記第2の音響信号波形とから前記特定の成分音波形の倍音成分を求めるステップと
を有することを特徴とする音響信号分析方法。Extracting the specific component sound from a first audio signal including the specific component sound and a second audio signal having the same pitch as the first audio signal and not including the specific component sound; An acoustic signal analysis method,
Wherein the first acoustic signal waveform spectral analysis, and obtaining the phase information for the amplitude information and the time axis for the time axis,
The second acoustic signal waveform spectral analysis, and obtaining the phase information for the amplitude information and the time axis for the time axis,
From the amplitude information and the phase information of the first acoustic signal and the amplitude information and the phase information of the second acoustic signal, the amplitude information and the phase information are commonly included in the first acoustic signal waveform and the second acoustic signal waveform, respectively. Generating a third acoustic signal waveform based on the result of extracting the overtone component,
Obtaining a harmonic component of the specific component sound waveform from the third acoustic signal waveform and the second acoustic signal waveform.
前記第1の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得る第1のステップと、
前記第2の音響信号波形をスペクトル分析し、その時間軸に対する振幅情報と時間軸に対する位相情報とを得る第2のステップと、
前記第1の音響信号波形から、前記第1の音響信号波形と前記第2の音響信号波形に共通して含まれている倍音成分を抜き出した結果に基づいて、前記特定の成分音を含む第3の音響信号波形を生成する第3のステップと、
前記第2の音響信号波形から、前記第1の音響信号波形と前記第2の音響信号波形に共通して含まれている倍音成分を抜きだした結果に基づいて、前記特定の成分音を含まない第4の音響信号波形を生成する第4のステップと、
前記第3の音響信号波形のうちの非倍音成分波形の複数の帯域毎の成分を求める第5のステップと、
前記第4の音響信号波形のうちの非倍音成分波形の複数の帯域毎の成分を求める第6のステップと、
前記第5のステップと前記第6のステップにより求められた前記各帯域毎の成分から前記特定の成分音の非倍音成分波形を求めるステップと
を有することを特徴とする音響信号分析方法。Extracting the specific component sound from a first audio signal including the specific component sound and a second audio signal having the same pitch as the first audio signal and not including the specific component sound; An acoustic signal analysis method,
Wherein the first acoustic signal waveform spectral analysis of a first step of obtaining the phase information for the amplitude information and the time axis for the time axis,
The second acoustic signal waveform spectral analysis, a second step of obtaining the phase information for the amplitude information and the time axis for the time axis,
Based on a result of extracting a harmonic component commonly included in the first acoustic signal waveform and the second acoustic signal waveform from the first acoustic signal waveform, a second harmonic including the specific component sound is extracted. A third step of generating a third acoustic signal waveform;
The specific component sound is included based on a result of extracting a harmonic component commonly included in the first audio signal waveform and the second audio signal waveform from the second audio signal waveform. A fourth step of generating no fourth acoustic signal waveform;
A fifth step of obtaining a component for each of a plurality of bands of the non- overtone component waveform of the third acoustic signal waveform;
A sixth step of obtaining a component for each of a plurality of bands of the non- overtone component waveform of the fourth acoustic signal waveform;
An acoustic signal analysis method, comprising: obtaining a non- overtone component waveform of the specific component sound from the components for each band obtained in the fifth step and the sixth step.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP31509999A JP3546779B2 (en) | 1999-11-05 | 1999-11-05 | Acoustic signal analysis method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP31509999A JP3546779B2 (en) | 1999-11-05 | 1999-11-05 | Acoustic signal analysis method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2001134269A JP2001134269A (en) | 2001-05-18 |
| JP3546779B2 true JP3546779B2 (en) | 2004-07-28 |
Family
ID=18061414
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP31509999A Expired - Fee Related JP3546779B2 (en) | 1999-11-05 | 1999-11-05 | Acoustic signal analysis method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3546779B2 (en) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4625935B2 (en) * | 2007-02-26 | 2011-02-02 | 独立行政法人産業技術総合研究所 | Sound analyzer and program |
| JP2009175677A (en) * | 2007-12-27 | 2009-08-06 | Casio Comput Co Ltd | Resonance sound adding device and electronic musical instrument |
| JP5246208B2 (en) * | 2010-06-07 | 2013-07-24 | カシオ計算機株式会社 | Fundamental tone extraction apparatus and program |
-
1999
- 1999-11-05 JP JP31509999A patent/JP3546779B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2001134269A (en) | 2001-05-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5850051A (en) | Method and apparatus for creating an automatic accompaniment pattern on the basis of analytic parameters | |
| EP3633668B1 (en) | Stringed instrument attack sound synthesizing by mutiple partial waveforms for multiple play dynamics | |
| US7117154B2 (en) | Converting apparatus of voice signal by modulation of frequencies and amplitudes of sinusoidal wave components | |
| EP3882906B1 (en) | Electronic keyboard musical instrument and method of generating musical sound | |
| JP3546779B2 (en) | Acoustic signal analysis method | |
| JP3775319B2 (en) | Music waveform time stretching apparatus and method | |
| JP2576702B2 (en) | Electronic musical instrument | |
| EP3882905A1 (en) | Electronic musical instrument, electronic keyboard musical instrument, and method of generating musical sound | |
| JP2989423B2 (en) | Electronic musical instrument | |
| JP3801029B2 (en) | Performance information generation method, performance information generation device, and program | |
| JP3832266B2 (en) | Performance data creation method and performance data creation device | |
| JP3644296B2 (en) | Musical sound waveform analyzer, musical sound waveform analysis method, and computer-readable recording medium recording a musical sound waveform analysis program | |
| JP3521821B2 (en) | Musical sound waveform analysis method and musical sound waveform analyzer | |
| JP2003022100A (en) | Method of removing noise, noise removing system and program | |
| JP3404850B2 (en) | Sound source device | |
| US20230215407A1 (en) | Electronic musical instrument, method of generating musical sound, and computer-readable storage medium | |
| JP3509139B2 (en) | Waveform generator | |
| JP3062392B2 (en) | Waveform forming device and electronic musical instrument using the output waveform | |
| JP3443491B2 (en) | Method of forming tone signal waveform of electronic musical instrument | |
| JP2689709B2 (en) | Electronic musical instrument | |
| JP3979623B2 (en) | Music synthesis system | |
| JP3736371B2 (en) | Music signal synthesis method, music signal synthesis apparatus and program | |
| JPH09325777A (en) | Musical tone signal generating apparatus and musical tone signal generating method | |
| JP2010217476A (en) | Waveform data generating method | |
| JP2000352982A (en) | Waveform data creation device, waveform data creation method, recording medium, and tone signal generation device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040127 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040220 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040323 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040405 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090423 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100423 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110423 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120423 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140423 Year of fee payment: 10 |
|
| LAPS | Cancellation because of no payment of annual fees |