Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP6139430B2 - Signal processing apparatus, method and program - Google Patents
[go: Go Back, main page]

JP6139430B2 - Signal processing apparatus, method and program - Google Patents

Signal processing apparatus, method and program Download PDF

Info

Publication number
JP6139430B2
JP6139430B2 JP2014025197A JP2014025197A JP6139430B2 JP 6139430 B2 JP6139430 B2 JP 6139430B2 JP 2014025197 A JP2014025197 A JP 2014025197A JP 2014025197 A JP2014025197 A JP 2014025197A JP 6139430 B2 JP6139430 B2 JP 6139430B2
Authority
JP
Japan
Prior art keywords
signal
segment
input signal
frame
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014025197A
Other languages
Japanese (ja)
Other versions
JP2015152705A (en
Inventor
小川 厚徳
厚徳 小川
慶介 木下
慶介 木下
堀 貴明
貴明 堀
中谷 智広
智広 中谷
中村 篤
篤 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
NTT Inc USA
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc USA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc USA filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014025197A priority Critical patent/JP6139430B2/en
Publication of JP2015152705A publication Critical patent/JP2015152705A/en
Application granted granted Critical
Publication of JP6139430B2 publication Critical patent/JP6139430B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Image Analysis (AREA)

Description

この発明は、音声信号、音響信号等の信号を処理するための技術に関する。   The present invention relates to a technique for processing a signal such as an audio signal or an acoustic signal.

雑音や残響のある環境で音響信号を収音すると、本来の信号に音響歪み(雑音や残響)が重畳された信号が観測される。音響信号が音声の場合、重畳した音響歪みの影響により音声の明瞭度は大きく低下してしまう。その結果、本来の音声信号の性質を抽出することが困難となり、例えば、音声認識システムの認識率が低下する。この認識率の低下を防ぐためには、重畳した音響歪みを取り除く工夫が必要である。   When an acoustic signal is collected in an environment with noise or reverberation, a signal in which acoustic distortion (noise or reverberation) is superimposed on the original signal is observed. When the acoustic signal is speech, the clarity of speech is greatly reduced due to the effect of superimposed acoustic distortion. As a result, it becomes difficult to extract the nature of the original speech signal, and for example, the recognition rate of the speech recognition system decreases. In order to prevent this decrease in the recognition rate, it is necessary to devise a method for removing the superimposed acoustic distortion.

そこで、以下に述べる従来の信号処理装置が提案されている。なお、この信号処理装置は、音声認識の他にも、例えば、補聴器、TV会議システム、機械制御インターフェース、楽曲を検索したり採譜したりする音楽情報処理システムなどに利用することが出来る。   Therefore, a conventional signal processing apparatus described below has been proposed. In addition to voice recognition, this signal processing device can be used for, for example, a hearing aid, a TV conference system, a machine control interface, a music information processing system for searching for music, and recording music.

[信号処理装置]
図1に従来の信号処理装置の機能構成例を示して、その動作を簡単に説明する。信号処理装置は、フーリエ変換部101と、特徴量生成部102と、マッチング部103と、音声強調フィルタリング部104と、事例モデル記憶部105とを備えている。
[Signal processing equipment]
FIG. 1 shows a functional configuration example of a conventional signal processing apparatus, and its operation will be briefly described. The signal processing apparatus includes a Fourier transform unit 101, a feature value generation unit 102, a matching unit 103, a voice enhancement filtering unit 104, and a case model storage unit 105.

フーリエ変換部101には、雑音/残響を含む音声が入力信号として入力される。入力信号は例えば30ms程度の短時間ハミング窓で窓かけされ、窓かけされた入力信号は離散フーリエ変換を経て振幅スペクトルに変換される(ステップS1,図2)。振幅スペクトルとは、周波数スペクトルの振幅データのことである。振幅スペクトルは、特徴量生成部102及び音声強調フィルタリング部104に提供される。   Voice including noise / reverberation is input to the Fourier transform unit 101 as an input signal. The input signal is windowed by a short Hamming window of about 30 ms, for example, and the windowed input signal is converted into an amplitude spectrum through a discrete Fourier transform (step S1, FIG. 2). An amplitude spectrum is amplitude data of a frequency spectrum. The amplitude spectrum is provided to the feature quantity generation unit 102 and the speech enhancement filtering unit 104.

特徴量生成部102は、フーリエ変換部101が出力する振幅スペクトルの全てを、例えばメルケプストラム特徴量に変換する(ステップS2,図2)。一般的に広く使われているメルケプストラムは高々10〜20次程度であるが、事例データを正確に表すために、高い次数(例えば、30〜100次程度)のメルケプストラムを用いる。なお、メルケプストラム以外の特徴量を用いても良い。生成された特徴量は、マッチング部103に提供される。   The feature amount generation unit 102 converts all of the amplitude spectrum output from the Fourier transform unit 101 into, for example, a mel cepstrum feature amount (step S2, FIG. 2). In general, the mel cepstrum widely used is about 10 to 20th order, but in order to accurately represent the case data, a mel cepstrum having a high order (for example, about 30 to 100th order) is used. Note that feature quantities other than the mel cepstrum may be used. The generated feature amount is provided to the matching unit 103.

事例モデル記憶部105には、事例に対応したクリーン音声のデータと、フレームごとの特徴量に対して最大の尤度を与えるガウス混合分布のインデックスの系列(セグメント)である事例モデルMとが記憶されている。事例に対応したクリーン音声のデータとは、例えば事例に対応したクリーン音声の振幅スペクトルのことである。事例モデルMに含まれるセグメントの例を図3に示す。各セルはi番目の時間フレームに対応する。各セル内の数字は最大の尤度を与えるガウス混合分布g中のガウス分布のインデックスmiを表す。事例モデルは、音声コーパスなどから得られる大量のクリーン音声と、あらゆる環境で得られる雑音/残響データ(雑音信号の波形や、室内インパルス応答)とを用い、さまざま
な環境での観測信号を模擬生成し、その模擬観測信号を特徴量領域へ変換したものを用いて、事前に事例モデル生成装置によって生成され、予め事例モデル記憶部105に記憶される。この事例モデル生成装置の詳細については、後述する。
The case model storage unit 105 stores clean speech data corresponding to a case, and a case model M that is a series (segment) of indexes of a Gaussian mixture distribution that gives the maximum likelihood with respect to a feature amount for each frame. Has been. The clean sound data corresponding to the case is, for example, the amplitude spectrum of the clean sound corresponding to the case. An example of segments included in the case model M is shown in FIG. Each cell corresponds to the i-th time frame. The number in each cell represents the index mi of the Gaussian distribution in the Gaussian mixture distribution g giving the maximum likelihood. The example model uses a large amount of clean speech obtained from a speech corpus and noise / reverberation data (noise signal waveform and room impulse response) obtained in any environment to simulate generation of observation signals in various environments. Then, using the simulation observation signal converted into the feature amount region, it is generated in advance by the case model generation device and stored in the case model storage unit 105 in advance. Details of the case model generation apparatus will be described later.

マッチング部103は、入力信号の特徴量と事例モデル記憶部105内に含まれる特徴量の事例とのマッチングを行い、入力信号に一番近い事例モデル中のセグメントを探索する(ステップS3,図2)。探索により見つかった入力信号に一番近い事例モデル中のセグメントについての情報は、音声強調フィルタリング部104に提供される。マッチング部103の詳細については、後述する。   The matching unit 103 matches the feature quantity of the input signal with the case example of the feature quantity included in the case model storage unit 105, and searches for a segment in the case model closest to the input signal (step S3, FIG. 2). ). Information about the segment in the case model closest to the input signal found by the search is provided to the speech enhancement filtering unit 104. Details of the matching unit 103 will be described later.

音声強調フィルタリング部104は、マッチング部103で探索した入力信号に一番近い事例モデル中のセグメントに対応するクリーン音声の振幅スペクトルを用いて音声強調のためのフィルタを作成し、作成されたフィルタを用いて入力信号をフィルタリングする(ステップS4,図2)。入力信号に一番近い事例モデル中のセグメントに対応するクリーン音声の振幅スペクトルは、事例モデル記憶部105から読み込んだものを用いる。音声強調フィルタリング部104の詳細については、例えば非特許文献1及び特許文献1を参照のこと。   The speech enhancement filtering unit 104 creates a filter for speech enhancement using the amplitude spectrum of clean speech corresponding to the segment in the case model closest to the input signal searched by the matching unit 103, and the created filter is To filter the input signal (step S4, FIG. 2). As the amplitude spectrum of the clean speech corresponding to the segment in the case model closest to the input signal, the amplitude spectrum read from the case model storage unit 105 is used. For details of the voice enhancement filtering unit 104, see, for example, Non-Patent Document 1 and Patent Document 1.

この信号処理装置によれば、従来は困難であった、非常に時間変化の多い雑音の除去が可能となることが報告されている。非常に時間変化の多い雑音とは、背景雑音に対して、例えば目覚まし時計のアラーム音などの雑音のことである。   According to this signal processing apparatus, it has been reported that it is possible to remove noise that has been difficult in the past and has a very large time variation. The noise having a very large time change is a noise such as an alarm sound of an alarm clock with respect to the background noise.

[事例モデル生成装置]
ここで、事例モデル記憶部105に記憶される事例モデルを生成する事例モデル生成装置について説明する。図4に、事例モデル生成装置の機能構成例を示す。事例モデル生成装置は、フーリエ変換部201と、特徴量生成部202と、ガウス混合モデル学習部203と、最尤ガウス分布計算部204とを備えている。
[Case model generator]
Here, a case model generation apparatus that generates a case model stored in the case model storage unit 105 will be described. FIG. 4 shows a functional configuration example of the case model generation apparatus. The example model generation apparatus includes a Fourier transform unit 201, a feature value generation unit 202, a Gaussian mixture model learning unit 203, and a maximum likelihood Gaussian distribution calculation unit 204.

事例モデル生成装置の各部の機能は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。   The function of each part of the case model generation apparatus is realized by, for example, a predetermined program being read into a computer including a ROM, a RAM, a CPU, and the like, and the CPU executing the program.

事例モデル生成装置への入力は、様々な雑音/残響環境の音声データである。なお、この様々な雑音/残響環境の音声データの中には、クリーン環境の音声データが含まれているとする。この様々な雑音/残響環境の音声データのそれぞれについて以下の処理が行われる
フーリエ変換部201及び特徴量生成部202は、それぞれ図1のフーリエ変換部101及び特徴量生成部102と同様であるため、重複説明を省略する。
The input to the case model generator is speech data of various noise / reverberation environments. It is assumed that the sound data of various noise / reverberation environments includes the sound data of clean environments. The following processing is performed for each of the audio data of various noise / reverberation environments, because the Fourier transform unit 201 and the feature amount generation unit 202 are the same as the Fourier transform unit 101 and the feature amount generation unit 102 of FIG. 1, respectively. The duplicated explanation is omitted.

ガウス混合モデル学習部203は、特徴量生成部202で得られた各短時間フレームtでの特徴量xを学習データとして、通常の最尤推定法によりガウス混合モデルgを得る。ガウス混合モデルgは、以下の式により示される。 Gaussian mixture model learning unit 203, a feature amount x i the learning data in each short time frame t obtained by the feature amount generating unit 202 to obtain the Gaussian mixture model g by a conventional maximum likelihood estimation. The Gaussian mixture model g is expressed by the following equation.

Figure 0006139430
Figure 0006139430

g(x|m)は、平均μ、分散Σを持つm番目のガウス分布を表す。g(x|m)は、多くの場合多次元ガウス分布であり、その次元数は特徴量xの次元数と同じである。g(x|m)が多次元ガウス分布である場合、平均μ及び分散Σのそれぞれはベクトルとなる。ここでは、g(x|m)が多次元ガウス分布であったとしても、記載の簡略化のためg(x|m)のことを単にガウス分布と表現する。w(m)は、m番目のガウス分布に対する混合重みを表す。Qは混合数を表す。Qには、例えば、4096や8192など、かなり大きな値を設定する。 g (x i | m) represents the m-th Gaussian distribution having mean μ m and variance Σ m . In many cases, g (x i | m) is a multidimensional Gaussian distribution, and the number of dimensions is the same as the number of dimensions of the feature quantity x i . When g (x i | m) is a multidimensional Gaussian distribution, each of the mean μ m and the variance Σ m is a vector. Here, even if g (x i | m) is a multidimensional Gaussian distribution, g (x i | m) is simply expressed as a Gaussian distribution for simplification of the description. w (m) represents the mixing weight for the mth Gaussian distribution. Q represents the number of mixtures. For Q, for example, a fairly large value such as 4096 or 8192 is set.

最尤ガウス分布計算部204は、各時間フレームiに対して最大の尤度を与えるガウス混合分布gの中のガウス分布のインデックスmを求め、そのインデックスmの時間系列を事例モデルMとして求める。事例モデルMは、ガウス分布のインデックスmの集合とガウス混合モデルgを用いて以下の式に示すように表される。 Maximum likelihood Gaussian distribution calculation unit 204, the index m i of the Gaussian distribution in the Gaussian mixture distribution g which gives the maximum likelihood for each time frame i calculated, the time sequence of the index m i as a case model M Ask. Case model M, using the set and Gaussian mixture model g of the index m i of the Gaussian distribution is expressed as shown in the following equation.

Figure 0006139430
Figure 0006139430

ここで、mは、i番目のフレームの特徴量xに対して最大の尤度を与えるガウス分布のインデックスであり、ガウス混合分布mの中のガウス分布g(x|m)を表している。Iは学習データの総フレーム数を表す。例えば、1時間の学習データを仮定すると、I=3.5×10となる。生成された事例モデルMは、事例モデル記憶部105(図1)に記憶される。この事例モデルの生成は、様々な雑音/残響環境の学習データのそれぞれに対して行われる。 Here, m i is the index of the Gaussian distribution that gives the maximum likelihood for the feature amount x i of i-th frame, Gaussian g in Gaussian mixture m | represents the (x i m) ing. I represents the total number of frames of learning data. For example, assuming 1 hour of learning data, I = 3.5 × 10 5 . The generated case model M is stored in the case model storage unit 105 (FIG. 1). This case model is generated for each learning data of various noise / reverberation environments.

なお、環境がクリーンの場合は、フーリエ変換部201から出力された振幅スペクトルデータも事例モデル記憶部105(図1)に記憶される。   If the environment is clean, the amplitude spectrum data output from the Fourier transform unit 201 is also stored in the case model storage unit 105 (FIG. 1).

[マッチング部103の具体処理]
ここで、マッチング部103における処理を詳述する。簡単のためあるひとつの雑音/残響環境の事例モデルMのみを考える。また、簡単のため入力信号の特徴量系列と学習データセグメントのマッチングの際の時間伸縮は考えないものとする。マッチング部103は、入力信号の特徴量yと事例モデルMとを用いて、入力信号の特徴量系列に最も近い学習データのセグメントを探索し、入力信号に含まれるクリーン音声に一番近いクリーン音声系列を与えると思われる学習データセグメントM u:u+τmaxを出力する。
[Specific Processing of Matching Unit 103]
Here, the processing in the matching unit 103 will be described in detail. For simplicity, consider only one example model M of a noise / reverberation environment. For simplicity, it is assumed that time expansion and contraction is not considered when matching the feature amount series of the input signal and the learning data segment. Matching unit 103 uses the feature quantity y t and case model M of the input signal, searching the segment closest training data to the feature amount sequence of the input signal, nearest clean clean speech included in the input signal training data segment M t u is believed to give a speech sequence: output u + .tau.max.

入力信号は、T個の時間フレームから成るとし、その入力信号の特徴量系列をy={y:t=1,2,…,T}とする。また、yt:t+τを入力信号の特徴量の時間フレームtからt+τまでの系列とする。そして、Mu:u+τ={g,m:i=u,u+1,…,u+τ}を、学習データの中のu番目からu+τ番目までの連続する時間フレームに対応するガウス分布系列とする。 Assume that the input signal is composed of T time frames, and the feature quantity sequence of the input signal is y = {y t : t = 1, 2,..., T}. Also, let yt: t + τ be a sequence from the time frame t to t + τ of the feature quantity of the input signal. Then, M u: u + τ = {g, m i : i = u, u + 1,..., U + τ} is a Gaussian distribution sequence corresponding to continuous time frames from u-th to u + τ-th in the learning data.

入力信号の特徴量系列yt:t+τと学習データの中のあるセグメントとの距離の定義や、入力信号の特徴量系列yt:t+τと一番近い学習データの探索方法としては、ユークリッド距離など、他のいくつかの方法を考えることが出来る。ここでは、入力信号の特徴量系列に対する一番近い学習データセグメントは、入力信号の特徴量系列に良く一致する学習データセグメントの中でも長さの最も長いものとする。つまり、入力信号の特徴量系列に最も近い学習データセグメントM u:u+τは、次式に示す事後確率を最大化することで求めることが出来る。 Feature amount sequence y t of the input signal: definition and of the distance between a segment in the t + tau training data, feature amount sequence y t of the input signal: a method of searching for t + tau and closest training data, Euclidean distance, etc. You can think of several other ways. Here, it is assumed that the learning data segment closest to the feature quantity sequence of the input signal has the longest length among learning data segments that closely match the feature quantity series of the input signal. In other words, the closest training data segments M t u the feature amount sequence of the input signal: u + tau can be determined by maximizing a posterior probability shown in the following equation.

Figure 0006139430
Figure 0006139430

ここで、p(Mu:u+τ|yt:t+τ)は事後確率を表し、yt:t+τとMu:u+τが比較的よく一致している場合、τが長ければ長いほど高い事後確率を与えるという特徴を持っている。この特徴の証明は、非特許文献1に詳述されている。より長いセグメントを探索するという方策を取ることで、ある時間に局所的に存在する雑音などの影響を受け難くなり、雑音などに対して比較的ロバストなマッチングが行われることが期待できる。 Here, p (M u: u + τ | y t: t + τ ) represents the posterior probability, and when y t: t + τ and M u: u + τ are relatively well matched, τ is The longer it is, the higher the posterior probability is. The proof of this feature is described in detail in Non-Patent Document 1. By taking a measure of searching for a longer segment, it becomes difficult to be affected by noise that exists locally at a certain time, and it can be expected that relatively robust matching is performed with respect to noise.

式(2)の分子の項p(yt:t+τ|Mu:u+τ)は、Mu:u+τに対応する学習データセグメントに対するyt:t+τの尤度である。その尤度は次式で計算される。 The numerator term p (y t: t + τ | M u: u + τ ) in equation (2) is the likelihood of y t: t + τ for the training data segment corresponding to M u: u + τ. . The likelihood is calculated by the following equation.

Figure 0006139430
Figure 0006139430

簡単のため、隣り合うフレームは独立であることを仮定している。式(2)の分母の第1項は、学習データ中のあらゆる時間フレームu’を開始点として,p(yt:t+τ|Mu’:u’+τ)の和を取ったものである。式(2)の分母の第2項は、ガウス混合モデルgに対するyt:t+τの尤度であり、次式で計算される。 For simplicity, it is assumed that adjacent frames are independent. The first term of the denominator of Equation (2) is the sum of p (y t: t + τ | M u ′: u ′ + τ ) starting from any time frame u ′ in the learning data. It is. The second term of the denominator of Equation (2) is the likelihood of yt : t + τ for the Gaussian mixture model g, and is calculated by the following equation.

Figure 0006139430
Figure 0006139430

ここでマッチング部103におけるセグメント探索処理の手順を更に具体的に記述する。まず、セグメントの最大長を(τlim+1)フレームに制限する。例えば、セグメントの最大長を30フレームと制限するならば、τlim=29である。この制限の下で、まず、τ=0、すなわち、セグメント長=1として、式(2)に従い、最大事後確率を与えるセグメント長=1のセグメントを見つける。次にτ=1、すなわち、セグメント長=2として、式(2)に従い、最大事後確率を与えるセグメント長=2のセグメントを見つける。この処理をτ=τlimまで繰り返し、最後に、見つかった異なる長さのセグメント候補の中から,最大事後確率を与えるセグメントを見つける。その最大事後確率を与えるセグメントの長さがτmaxである。 Here, the procedure of the segment search process in the matching unit 103 will be described more specifically. First, the maximum segment length is limited to (τ lim +1) frames. For example, if the maximum length of the segment is limited to 30 frames, τ lim = 29. Under this restriction, first, τ = 0, that is, segment length = 1, and a segment with segment length = 1 that gives the maximum posterior probability is found according to the equation (2). Next, assuming τ = 1, that is, segment length = 2, a segment with segment length = 2 that gives the maximum posterior probability is found according to equation (2). This process is repeated until τ = τ lim , and finally, a segment that gives the maximum posterior probability is found from the segment candidates of different lengths that have been found. The length of the segment giving the maximum posterior probability is τ max .

このマッチング部103におけるセグメント探索処理は、図3に示すような、Iフレーム分のリニアなメモリで表現できる事例モデルM上で行うことができる。   The segment search process in the matching unit 103 can be performed on a case model M that can be expressed by a linear memory for I frames as shown in FIG.

J. Ming and R. Srinivasan, and D. Crooke, “A Corpus-Based Approach to Speech Enhancement From Nonstationary Noise,” IEEE Trans. On Acoustics, Speech and Signal Processing, 19(4), pp. 822-836, 2011.J. Ming and R. Srinivasan, and D. Crooke, “A Corpus-Based Approach to Speech Enhancement From Nonstationary Noise,” IEEE Trans. On Acoustics, Speech and Signal Processing, 19 (4), pp. 822-836, 2011 .

特開2013−37174号公報JP 2013-37174 A

従来の信号処理装置では、マッチング部103において、入力信号に一番近いセグメントを探索する際に、異なる長さのセグメントを比較している。しかし、本来は異なる長さのセグメントの比較はできない。このため、従来の信号処理装置においては、必ずしも精度の高いセグメント探索ができているとは限らなかった。   In the conventional signal processing apparatus, the matching unit 103 compares segments having different lengths when searching for the segment closest to the input signal. However, it is not possible to compare segments of different lengths. For this reason, in the conventional signal processing apparatus, the segment search with high accuracy is not always performed.

この発明は、従来よりも精度の高いセグメント探索を行うことができる信号処理装置、方法及びプログラムを提供することを目的とする。   An object of this invention is to provide the signal processing apparatus, method, and program which can perform a segment search with higher precision than before.

この発明の一態様による信号処理装置は、所定の信号の各フレームの特徴量に対して最大の尤度を与える、ガウス混合分布の中のガウス分布のインデックスの系列であるセグメントが記憶されている事例モデル記憶部と、事例モデル記憶部に記憶されているセグメントを候補として、入力信号の特徴量系列に対して最大の事後確率を与えるセグメントを探索するマッチング部と、を備えており、入力信号を2つに分割したときの前半部分を前半部分信号とし後半部分を後半部分信号として、マッチング部における事後確率は、前半部分信号についてその前半部分信号に対応する長さのセグメントに基づいて評価した尤度と、後半部分信号についてガウス混合分布によるモデルに基づいて評価した尤度とを用いて表現される。   A signal processing apparatus according to an aspect of the present invention stores a segment that is a series of Gaussian distribution indexes in a Gaussian mixture distribution that gives a maximum likelihood to a feature amount of each frame of a predetermined signal. A case model storage unit, and a matching unit that searches for a segment that gives the maximum posterior probability for the feature quantity sequence of the input signal using the segments stored in the case model storage unit as candidates, and includes an input signal The first half is divided into two, the first half is the first half signal and the second half is the second half signal. The posterior probability in the matching section is evaluated based on the length of the first half signal corresponding to the first half signal. The likelihood is expressed using the likelihood and the likelihood evaluated based on the model with the Gaussian mixture distribution for the second half signal.

精度の高いセグメント探索を行うことができる。   A segment search with high accuracy can be performed.

信号処理装置の例を説明するためのブロック図。The block diagram for demonstrating the example of a signal processing apparatus. 信号処理方法の例を説明するためのフローチャート。The flowchart for demonstrating the example of a signal processing method. セグメントの例を説明するための図。The figure for demonstrating the example of a segment. 事例モデル生成装置の例を説明するための図。The figure for demonstrating the example of an example model production | generation apparatus. 式(7)によるセグメント評価を説明するための図。The figure for demonstrating the segment evaluation by Formula (7).

以下、図面を参照して、信号処理装置及び方法の実施形態を説明する。   Hereinafter, embodiments of a signal processing apparatus and method will be described with reference to the drawings.

この実施形態による信号処理装置は、従来の信号処理装置と同様に、図1に例示するように、フーリエ変換部101と、特徴量生成部102と、マッチング部103と、音声強調フィルタリング部104と、事例モデル記憶部105とを備えている。   Similar to the conventional signal processing apparatus, the signal processing apparatus according to this embodiment includes a Fourier transform unit 101, a feature amount generation unit 102, a matching unit 103, a speech enhancement filtering unit 104, as illustrated in FIG. The case model storage unit 105 is provided.

以下、従来とは異なる部分である、マッチング部103を中心に説明する。第一実施形態による信号処理装置のフーリエ変換部101と、特徴量生成部102と、音声強調フィルタリング部104とは、それぞれ従来の信号処理装置のフーリエ変換部101と、特徴量生成部102と、音声強調フィルタリング部104と同様であるため、重複説明を省略する。   Hereinafter, the matching unit 103, which is a part different from the conventional one, will be mainly described. The Fourier transform unit 101, the feature amount generation unit 102, and the speech enhancement filtering unit 104 of the signal processing device according to the first embodiment are respectively the Fourier transform unit 101, the feature amount generation unit 102, and the conventional signal processing device. Since it is the same as that of the voice emphasis filtering unit 104, duplicate description is omitted.

この実施形態による信号処理装置は、マッチング部103において、異なるセグメント長のセグメントを、フレームという共通の長さの下で公平に評価することにより、入力信号に一番近いセグメントを探索する。   In the signal processing apparatus according to this embodiment, the matching unit 103 searches for a segment closest to the input signal by fairly evaluating segments having different segment lengths under a common length called a frame.

この実施形態のマッチング部103では、式(3)の代わりに、所定の長さのフレームの入力信号の特徴量系列yt:t+τの尤度を、事例モデルMとガウス混合モデルgの両方を用いて計算する。すなわち、yt:t+τをyt:t+νとyt+ν+1:t+τに分割して(0≦ν≦τ)、前者をMで、後者をgで、評価する形にする。具体的には入力信号の特徴量系列yt:t+τの尤度は、次式のように計算される。 In the matching unit 103 of this embodiment, instead of the equation (3), the likelihood of the feature quantity sequence yt : t + τ of the input signal of the frame having a predetermined length is calculated by using the case model M and the Gaussian mixture model g. Calculate using both. That is, y t: t + τ is divided into y t: t + ν and y t + ν + 1: t + τ (0 ≦ ν ≦ τ), and the former is evaluated by M and the latter is evaluated by g. Specifically, the likelihood of the feature quantity sequence yt : t + τ of the input signal is calculated as follows.

Figure 0006139430
Figure 0006139430

ここで、p(yt:t+ν|Mu:u+ν)は、事例モデルMu:u+νが与えられたときの入力信号の特徴量系列のyt:t+νの尤度を表す。p(yt+ν+1:t+τ|φu+ν+1:u+τ)は、混合モデルφu+ν+1:u+τが与えられたときの入力信号の特徴量系列yt:t+νの尤度を表す。φu+ν+1:u+τは、フレームu+ν+1からフレームu+τに対応するガウス混合分布である。p(yt:t+ν|Mu:u+ν, φu+ν+1:u+τ)は、事例モデルMu:u+ν及び混合モデルφu+ν+1:u+τが与えられたときの入力信号の特徴量系列yt:t+νの尤度を表す。 Here, p (y t: t + ν | M u: u + ν ) is the likelihood of y t: t + ν of the feature quantity sequence of the input signal when the case model M u: u + ν is given. Represents degrees. p (y t + ν + 1: t + τ | φ u + ν + 1: u + τ ) represents the likelihood of the feature quantity sequence y t: t + ν of the input signal when the mixed model φ u + ν + 1: u + τ is given. φ u + ν + 1: u + τ is a Gaussian mixture distribution corresponding to the frame u + ν + 1 to the frame u + τ. p (y t: t + ν | M u: u + ν , φ u + ν + 1: u + τ ) is a feature quantity sequence of the input signal when the case model M u: u + ν and the mixed model φ u + ν + 1: u + τ are given. y t: represents the likelihood of t + ν .

t:t+νは、入力信号の特徴量系列yt:t+τのうち事例モデルのセグメントMu:u+νに対応する長さの入力信号の特徴量系列である。言い換えれば、yt:t+νは、フレームtからフレームt+νに対応する入力信号の特徴量系列である。yt+ν+1:t+τは、入力信号の特徴量系列yt:t+τのうち事例モデルのセグメントMu:u+νの長さを超える部分の入力信号の特徴量系列である。言い換えれば、yt+ν+1:t+τは、フレームt+ν+1からフレームt+τに対応する入力信号の特徴量系列である。 y t: t + ν is a feature amount sequence of the input signal having a length corresponding to the segment M u: u + ν of the case model in the feature amount sequence y t: t + τ of the input signal. In other words, yt : t + ν is a feature quantity sequence of the input signal corresponding to the frame t to the frame t + ν. y t + ν + 1: t + τ is the feature amount sequence of the input signal in the portion of the feature amount sequence y t: t + τ of the input signal that exceeds the length of the segment M u: u + ν of the case model. In other words, yt + ν + 1: t + τ is a feature quantity sequence of the input signal corresponding to the frame t + ν + 1 to the frame t + τ.

すなわち、式(5)は、評価対象の入力信号を所定長(ここではτ+1)の入力信号として、評価対象の入力信号の特徴量系列のうち事例モデルに基づいて評価できる部分は事例モデルで尤度p(yt:t+ν|Mu:u+ν)を評価し、事例モデルのセグメントMu:u+νで評価できない(事例モデルのセグメントの長さを超える部分の)評価対象の入力信号の特徴量系列yt+ν+1:t+τについては混合モデルgに基づいて尤度p(yt+ν+1:t+τ|φu+ν+1:u+τ)を評価することを意味する。 In other words, Equation (5) is obtained by using the input signal to be evaluated as an input signal having a predetermined length (in this case, τ + 1), and the portion that can be evaluated based on the case model in the feature quantity series of the input signal to be evaluated is the case model. Degree p (y t: t + ν | M u: u + ν ) and cannot be evaluated by the segment M u: u + ν of the case model (the portion exceeding the segment length of the case model) For the feature quantity sequence y t + ν + 1: t + τ of the input signal, this means that the likelihood p (y t + ν + 1: t + τ | φ u + ν + 1: u + τ ) is evaluated based on the mixed model g.

言い換えれば、入力信号を2つに分割したときの前半部分を前半部分信号とし後半部分を後半部分信号として、マッチング部103が式(4)に基づいて計算する尤度は、前半部分信号についてその前半部分信号に対応する長さのセグメントに基づいて評価した尤度p(yt:t+ν|Mu:u+ν)と、後半部分信号について上記ガウス混合分布によるモデルに基づいて評価した尤度p(yt+ν+1:t+τ|φu+ν+1:u+τ)とが統合された尤度であると言える。 In other words, the likelihood that the matching unit 103 calculates based on Equation (4) using the first half when the input signal is divided into two as the first half signal and the second half as the second half signal is that for the first half signal. The likelihood p (y t: t + ν | M u: u + ν ) evaluated based on the segment of the length corresponding to the first half signal and the second half signal based on the above-described model based on the Gaussian mixture distribution It can be said that the likelihood p (y t + ν + 1: t + τ | φ u + ν + 1: u + τ ) is an integrated likelihood.

混合モデルgに基づく尤度は、モデル全体で平滑化した尤度のようなものに相当する。事例モデルで評価できない部分については平均的な尤度で代用することで、等しいフレーム長で入力信号を公平に評価しようとするものである。   The likelihood based on the mixed model g corresponds to a likelihood smoothed over the entire model. For the part that cannot be evaluated by the case model, the average likelihood is substituted to try to evaluate the input signal fairly with the same frame length.

このyt:t+τの尤度を用いて,マッチング部103ではyt:t+τに最も適合するセグメントM u:u+νmaxを次式(6)(7)に従い求める。t,τ,u,ν,u’,ν’は整数である。 The y t: using the likelihood of the t + tau, the matching unit 103 y t: t + best fits segment τ M t u: finding according the following equation (6) (7) u + .nu.max. t, τ, u, ν, u ′, ν ′ are integers.

Figure 0006139430
Figure 0006139430

ここで、式(7)の分母は、学習データのあらゆる開始点u’と、yt:t+τのあらゆる分割点ν’について、p(yt:t+τ|Mu′:u′+ν′,φu′+ν′+1:u′+τ)の和を取ったものである。 Here, the denominator of equation (7), 'and, y t: any division point of t + τ ν' u any starting point of the learning data for, p (y t: t + τ | M u ': u' + ν ′ , φu ′ + ν ′ + 1: u ′ + τ ).

式(7)により定義される事後確率p(Mu:u+ν,φu+ν+1:u+τ|yt:t+τ)は、上記式(4)及び上記式(5)に示したように、入力信号を2つに分割したときの前半部分を前半部分信号とし後半部分を後半部分信号として、部分信号についてその前半部分信号に対応する長さのセグメントに基づいて評価した尤度p(yt:t+ν|Mu:u+ν)と、後半部分信号について上記ガウス混合分布によるモデルに基づいて評価した尤度p(yt+ν+1:t+τ|φu+ν+1:u+τ)とを用いて表現される。 The posterior probability p (M u: u + ν , φ u + ν + 1: u + τ | y t: t + τ ) defined by the equation (7) is as shown in the above equation (4) and the above equation (5): Likelihood p (y t) evaluated based on a segment having a length corresponding to the first half signal, with the first half of the input signal divided into two as the first half signal and the second half as the second half signal. : t + ν | M u: u + ν ) and likelihood p (y t + ν + 1: t + τ | φ u + ν + 1: u + τ ) evaluated based on the model of the Gaussian mixture distribution for the latter half signal. Is done.

セグメントの最大長を、従来の方法と同様に、(τlim+1)フレームに制限する。例
えば、セグメントの最大長を30フレームと制限するならば、τlim=29となる。この
制限の下での式(7)によるセグメント評価を図示すると、図のようになる。この図から明らかなように、この実施形態によれば、あらゆるセグメント長のセグメントが、(τlim+1)フレームという共通の長さの下で、公平に評価されていることがわかる。別の見方をすれば、この実施形態によれば、最適なセグメント長(νmax)と,セグメント開
始点(u)の探索を同時に行っていることになる。
The maximum length of the segment is limited to (τ lim +1) frames as in the conventional method. For example, if the maximum length of the segment is limited to 30 frames, τ lim = 29. FIG. 5 shows the segment evaluation according to the equation (7) under this restriction. As is apparent from this figure, according to this embodiment, it can be seen that the segments of any segment length are evaluated fairly under a common length of (τ lim +1) frames. From another viewpoint, according to this embodiment, the optimum segment length (ν max ) and the segment start point (u) are searched simultaneously.

以下、本発明による式(7)の事後確率が、従来手法による式(2)の事後確率と同様に、yt:t+τとMu:u+τが比較的よく一致している場合、τが長ければ長いほど高い事後確率を与えるという特徴を持っていることを証明する。このため,yt:t+τをyt:t+νとyt+ν+1:t+τに分割して前者をMで後者をgで評価する場合(式(4))と、yt:t+τをyt:t+ν-1とyt+ν:t+τに分割して前者をMで後者をgで評価する場合とで、事後確率の大小を比較する。 Hereinafter, in the case where the posterior probability of Equation (7) according to the present invention is relatively good in agreement with yt : t + τ and Mu: u + τ , similarly to the posterior probability of Equation (2) by the conventional method It proves that the longer τ is, the higher posterior probability is given. Therefore, when y t: t + τ is divided into y t: t + ν and y t + ν + 1: t + τ and the former is evaluated by M and the latter is evaluated by g (equation (4)), y t: t + a τ y t: t + ν- 1 and y t + [nu: the former is divided into t + tau in the case of evaluating the latter in g in M, compares the magnitude of the posterior probability.

式(7)から明らかなように、両場合において分母は等しくなるので、両場合の比は、式(4)から、以下の尤度比に等しくなる。   As is clear from equation (7), the denominator is equal in both cases, so the ratio in both cases is equal to the following likelihood ratio from equation (4).

Figure 0006139430
Figure 0006139430

ここで、yt+νがmu+νによく一致していると仮定する。この場合、式(8)の分母は、w(mu+ν)g(yt+ν|mu+ν)と近似できる。よって、式(8)は、1/w(mu+ν)に等しい。w(mu+ν)は1以下であるので、式(8)は1以上になる。これにより、yt:t+τとMu:u+τが比較的よく一致している場合、τが長ければ長いほど式(7)で計算される事後確率が高くなるという特徴を持っていることが分かる。 Here, it is assumed that y t + [nu is good agreement in m u + ν. In this case, the denominator of Equation (8) can be approximated as w (m u + ν ) g (y t + ν | mu + ν ). Thus, equation (8) is equal to 1 / w (m u + ν ). Since w (m u + ν ) is 1 or less, Expression (8) becomes 1 or more. Thus, it can be seen that when yt : t + τ and Mu: u + τ match relatively well, the longer τ is, the higher the posterior probability calculated by equation (7) is. .

[変形例等]
なお、この発明は、複数の雑音/残響環境の事例モデルを考慮する場合、及び、マッチング時に時間伸縮を考える場合についても、非特許文献1に記載されているように、拡張可能である。
[Modifications, etc.]
Note that the present invention can be extended as described in Non-Patent Document 1 when considering a plurality of case models of noise / reverberation environments and considering time expansion and contraction at the time of matching.

上記信号処理装置及び方法において説明した処理は、記載の順にしたがって時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。   The processes described in the above signal processing apparatus and method are not only executed in chronological order according to the order of description, but may be executed in parallel or individually as required by the processing capability of the apparatus that executes the process. .

また、信号処理装置における各部をコンピュータによって実現する場合、信号処理装置の各部が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各部がコンピュータ上で実現される。   Further, when each unit in the signal processing device is realized by a computer, the processing contents of the functions that each unit of the signal processing device should have are described by a program. And each part is implement | achieved on a computer by running this program with a computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。   The program describing the processing contents can be recorded on a computer-readable recording medium. As the computer-readable recording medium, for example, any recording medium such as a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory may be used.

また、各処理手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   Each processing means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.

その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。   Needless to say, other modifications are possible without departing from the spirit of the present invention.

101 フーリエ変換部
102 特徴量生成部
103 マッチング部
104 音声強調フィルタリング部
105 事例モデル記憶部
101 Fourier Transform Unit 102 Feature Quantity Generation Unit 103 Matching Unit 104 Speech Enhancement Filtering Unit 105 Case Model Storage Unit

Claims (4)

所定の信号の各フレームの特徴量に対して最大の尤度を与える、ガウス混合分布の中のガウス分布のインデックスの系列であるセグメントが記憶されている事例モデル記憶部と、
上記事例モデル記憶部に記憶されているセグメントを候補として、入力信号の特徴量系列に対して最大の事後確率を与えるセグメントを探索するマッチング部と、を含み、
上記入力信号を2つに分割したときの前半部分を前半部分信号とし後半部分を後半部分信号として、
上記マッチング部における事後確率は、上記前半部分信号についてその前半部分信号に対応する長さのセグメントに基づいて評価した尤度と、上記後半部分信号について上記ガウス混合分布によるモデルに基づいて評価した尤度とを用いて表現される、
信号処理装置。
A case model storage unit storing a segment that is a series of indices of a Gaussian distribution in a Gaussian mixture distribution that gives a maximum likelihood to a feature amount of each frame of a predetermined signal;
A matching unit that searches the segment stored in the case model storage unit as a candidate and searches for a segment that gives the maximum posterior probability to the feature amount series of the input signal,
When the input signal is divided into two, the first half is the first half signal and the second half is the second half signal.
The posterior probabilities in the matching unit are the likelihood evaluated based on the segment of the length corresponding to the first half signal for the first half signal and the likelihood evaluated based on the model based on the Gaussian mixture distribution for the second half signal. Expressed in degrees,
Signal processing device.
請求項1の信号処理装置であって、
t,τ,u,ν,u’,ν’を整数とし、フレームtからフレームt+τに対応する上記入力信号の特徴量をyt:t+τとし、上記事例モデル記憶部に記憶されているフレームuからフレームu+νに対応するセグメントをMu:u+νとし、フレームu+ν+1からフレームu+τに対応する上記ガウス混合分布をφu+ν+1:u+τとし、Mu:u+ν及びφu+ν+1:u+τが与えられたときのyt:t+τの事後確率をp(yt:t+τ|Mu:u+ν,φu+ν+1:u+τ)として、
上記事後確率は、以下に定義されるp(Mu:u+ν,φu+ν+1:u+τ|yt:t+τ)である、
Figure 0006139430

信号処理装置。
The signal processing apparatus according to claim 1,
t, τ, u, ν, u ′, ν ′ are integers, the feature quantity of the input signal corresponding to frame t + τ from frame t is yt : t + τ, and the frame u stored in the case model storage unit , The segment corresponding to frame u + ν is M u: u + ν , the Gaussian mixture distribution corresponding to frame u + ν + 1 to frame u + τ is φ u + ν + 1: u + τ, and y t when M u: u + ν and φ u + ν + 1: u + τ are given. : The posterior probability of t + τ is p (y t: t + τ | M u: u + ν , φ u + ν + 1: u + τ ),
The posterior probability is p ( Mu: u + ν , φu + ν + 1: u + τ | y t: t + τ ) defined below.
Figure 0006139430

Signal processing device.
事例モデル記憶部には、所定の信号の各フレームの特徴量に対して最大の尤度を与える、ガウス混合分布の中のガウス分布のインデックスの系列であるセグメントが記憶されているとして、  In the case model storage unit, a segment that is a series of Gaussian distribution indexes in the Gaussian mixture distribution that gives the maximum likelihood to the feature amount of each frame of a predetermined signal is stored.
マッチング部が、上記事例モデル記憶部に記憶されているセグメントを候補として、入力信号の特徴量系列に対して最大の事後確率を与えるセグメントを探索するマッチングステップと、を含み、  A matching step for searching for a segment that gives the maximum posterior probability for the feature amount series of the input signal, with the segment stored in the case model storage unit as a candidate,
上記入力信号を2つに分割したときの前半部分を前半部分信号とし後半部分を後半部分信号として、  When the input signal is divided into two, the first half is the first half signal and the second half is the second half signal.
上記マッチングステップにおける事後確率は、上記前半部分信号についてその前半部分信号に対応する長さのセグメントに基づいて評価した尤度と、上記後半部分信号について上記ガウス混合分布によるモデルに基づいて評価した尤度とを用いて表現される、  The posterior probability in the matching step is the likelihood evaluated based on the segment of the length corresponding to the first half signal for the first half signal and the likelihood evaluated based on the model based on the Gaussian mixture distribution for the second half signal. Expressed in degrees,
信号処理方法。  Signal processing method.
請求項1又は2の信号処理装置の各部としてコンピュータを機能させるためのプログラム。   The program for functioning a computer as each part of the signal processing apparatus of Claim 1 or 2.
JP2014025197A 2014-02-13 2014-02-13 Signal processing apparatus, method and program Active JP6139430B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014025197A JP6139430B2 (en) 2014-02-13 2014-02-13 Signal processing apparatus, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014025197A JP6139430B2 (en) 2014-02-13 2014-02-13 Signal processing apparatus, method and program

Publications (2)

Publication Number Publication Date
JP2015152705A JP2015152705A (en) 2015-08-24
JP6139430B2 true JP6139430B2 (en) 2017-05-31

Family

ID=53895041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014025197A Active JP6139430B2 (en) 2014-02-13 2014-02-13 Signal processing apparatus, method and program

Country Status (1)

Country Link
JP (1) JP6139430B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6499095B2 (en) * 2016-01-29 2019-04-10 日本電信電話株式会社 Signal processing method, signal processing apparatus, and signal processing program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0968996A (en) * 1995-09-01 1997-03-11 Oki Electric Ind Co Ltd Voice recognition method
JP4298672B2 (en) * 2005-04-11 2009-07-22 キヤノン株式会社 Method and apparatus for calculating output probability of state of mixed distribution HMM
JP5309343B2 (en) * 2011-08-01 2013-10-09 Kddi株式会社 Pattern recognition method and apparatus, pattern recognition program and recording medium therefor
JP5634959B2 (en) * 2011-08-08 2014-12-03 日本電信電話株式会社 Noise / dereverberation apparatus, method and program thereof
JP5819147B2 (en) * 2011-09-15 2015-11-18 株式会社日立製作所 Speech synthesis apparatus, speech synthesis method and program

Also Published As

Publication number Publication date
JP2015152705A (en) 2015-08-24

Similar Documents

Publication Publication Date Title
JP5634959B2 (en) Noise / dereverberation apparatus, method and program thereof
CN112786057B (en) Voiceprint recognition method and device, electronic equipment and storage medium
JP6437581B2 (en) Speaker-adaptive speech recognition
CN105788592A (en) Audio classification method and apparatus thereof
Qais et al. Deepfake audio detection with neural networks using audio features
CN106910494B (en) Audio identification method and device
JP6499095B2 (en) Signal processing method, signal processing apparatus, and signal processing program
JP6244297B2 (en) Acoustic score calculation apparatus, method and program thereof
JP7304301B2 (en) Acoustic diagnostic method, acoustic diagnostic system, and acoustic diagnostic program
US12412580B2 (en) Sound extraction system and sound extraction method
JP5974901B2 (en) Sound segment classification device, sound segment classification method, and sound segment classification program
Lim et al. Acoustic event classification with enhanced efficientnet
CN111785302A (en) Speaker separation method, device and electronic device
Poorjam et al. A parametric approach for classification of distortions in pathological voices
Tanweer et al. Analysis of combined use of nn and mfcc for speech recognition
JP6139430B2 (en) Signal processing apparatus, method and program
JP6139429B2 (en) Signal processing apparatus, method and program
JP7333878B2 (en) SIGNAL PROCESSING DEVICE, SIGNAL PROCESSING METHOD, AND SIGNAL PROCESSING PROGRAM
JPWO2016152132A1 (en) Audio processing apparatus, audio processing system, audio processing method, and program
JP6167063B2 (en) Utterance rhythm transformation matrix generation device, utterance rhythm transformation device, utterance rhythm transformation matrix generation method, and program thereof
Harvianto et al. Analysis and voice recognition In Indonesian language using MFCC and SVM method
JP6734233B2 (en) Signal processing device, case model generation device, collation device, signal processing method, and signal processing program
JP6167062B2 (en) Classification device, classification method, and program
CN118800235B (en) Voice lip reading recognition method, model training method and device and electronic equipment
Gomez et al. F0 ESTIMATION IN IRREGULAR VOCAL EMISSIONS USING RIDGE DETECTION METHODS.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170427

R150 Certificate of patent or registration of utility model

Ref document number: 6139430

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350