JP5229738B2 - Speech recognition device and speech conversion device - Google Patents
Speech recognition device and speech conversion device Download PDFInfo
- Publication number
- JP5229738B2 JP5229738B2 JP2009068545A JP2009068545A JP5229738B2 JP 5229738 B2 JP5229738 B2 JP 5229738B2 JP 2009068545 A JP2009068545 A JP 2009068545A JP 2009068545 A JP2009068545 A JP 2009068545A JP 5229738 B2 JP5229738 B2 JP 5229738B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- voice
- likelihood
- recognition
- analysis unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、音声認識装置及び音声変換装置に関する。 The present invention relates to a speech recognition device and a speech conversion device.
マイクロフォンに収音された音声信号に対し、音声認識を行う音声認識装置や、音声認識装置による認識結果に対応した音声合成信号をスピーカから放音する音声変換装置が知られている。 A voice recognition device that performs voice recognition on a voice signal collected by a microphone and a voice conversion device that emits a voice synthesis signal corresponding to a recognition result by the voice recognition device from a speaker are known.
音声認識において、認識結果候補を構成する音節、単語などの単位の認識カテゴリ毎に隠れマルコフモデル(Hidden Markov Model、以下ではHMMと記す)などの確率モデルを用いてモデル化する手法は、認識性能が高く、現在の音声認識技術の主流となっている。従来のHMMを用いた音声認識装置について図4を参照して簡単に説明する。入力端子101から入力された音声信号は、A/D変換部102においてデジタル信号に変換される。そのデジタル信号から特徴ベクトル抽出部103において音声特徴ベクトルを抽出する。その後、予め、認識カテゴリごとに、音声単位について作成したHMMを、モデルメモリ104から読み出し、尤度計算部105において、抽出された音声特徴ベクトルに対する各モデルの照合尤度を計算する。そして、最も大きな照合尤度を示すモデルが表現する音声単位(認識カテゴリ)を認識結果とし出力部106より出力する。
In speech recognition, a method of modeling using a probabilistic model such as a Hidden Markov Model (hereinafter referred to as HMM) for each recognition category of units such as syllables and words constituting recognition result candidates is a recognition performance. Is the mainstream of current speech recognition technology. A conventional speech recognition apparatus using an HMM will be briefly described with reference to FIG. The audio signal input from the
しかしながら、従来の音声認識においては、発話終了後に音声認識を行うため、発話タイミングと音声認識タイミングとの間にタイムラグが生じるという問題があった。 However, in the conventional speech recognition, since speech recognition is performed after the utterance is finished, there is a problem that a time lag occurs between the speech timing and the speech recognition timing.
また、従来の音声認識手法により得た認識結果に対応した音声合成信号をスピーカから放音する場合、合成音声は、発話者が発話したタイミングよりもかなり遅いタイミングで放音されることになるため、発話者が、遅れて生成される合成音声の影響を受けて、うまく会話を進めることが困難になるという問題が生じる。 In addition, when a synthesized speech signal corresponding to the recognition result obtained by the conventional speech recognition method is emitted from the speaker, the synthesized speech is emitted at a timing considerably later than the timing when the speaker uttered. The problem arises that it becomes difficult for the speaker to proceed with the conversation well under the influence of the synthesized speech generated late.
本発明は、このような問題を解決するためになされたものであって、高速で音声認識を行うことができる音声認識装置及び音声変換装置の提供を目的とする。 The present invention has been made to solve such a problem, and an object thereof is to provide a speech recognition device and a speech conversion device that can perform speech recognition at high speed.
本発明の前記目的は、音声を入力する音声入力手段と、前記音声入力手段に入力された音声信号をデジタル音声波形信号に変換する変換手段と、前記変換手段で変換されたデジタル音声波形信号から、前記音声入力手段に入力された音声を解析する解析手段とを備える音声認識装置であって、前記解析手段は、前記デジタル音声波形信号をフレーム単位で解析して音声の特徴量を表す特徴ベクトルを抽出する特徴ベクトル抽出部と、前記フレーム単位で抽出した前記特徴ベクトルを時系列的に複数フレーム分記憶する特徴ベクトル記憶部と、音声認識候補となる複数の音声を記憶する認識候補音声記憶部と、前記特徴ベクトル記憶部に記憶された複数フレーム分における前記特徴ベクトルに基づいて、音声認識候補となる各音声の尤度を算出する第1解析部と、前記複数フレーム分における前記特徴ベクトルからフレーム単位あたりの平均特徴ベクトルを算出し、当該平均特徴ベクトルから、音声認識候補となる音声の尤度を算出する第2解析部と、前記第1解析部において算出した音声認識候補となる各音声の尤度、及び、前記第2解析部において算出した音声認識候補となる各音声の尤度に基づいて一つの音声を決定する音声決定部と、を備える音声認識装置により達成される。 The object of the present invention is from voice input means for inputting voice, conversion means for converting a voice signal input to the voice input means to a digital voice waveform signal, and a digital voice waveform signal converted by the conversion means. A speech recognition apparatus comprising: analysis means for analyzing speech input to the speech input means, wherein the analysis means analyzes the digital speech waveform signal in units of frames and represents a feature amount of speech A feature vector extracting unit for extracting a frame, a feature vector storage unit for storing the feature vectors extracted in units of frames in a time series for a plurality of frames, and a recognition candidate speech storage unit for storing a plurality of voices as speech recognition candidates And the likelihood of each speech that is a speech recognition candidate based on the feature vectors for a plurality of frames stored in the feature vector storage unit A first analysis unit that calculates an average feature vector per frame from the feature vectors for the plurality of frames, and calculates a likelihood of speech that is a speech recognition candidate from the average feature vector; The speech for determining one speech based on the likelihood of each speech to be a speech recognition candidate calculated in the first analysis unit and the likelihood of each speech to be a speech recognition candidate calculated in the second analysis unit And a determination unit.
この音声認識装置において、前記第1解析部及び前記第2解析部の少なくともいずれか一方は、ビタビアルゴリズム(Viterbi algorithm)、あるいは、ニューラルネットワークにより、音声認識候補となる音声の尤度を算出することが好ましい。 In this speech recognition apparatus, at least one of the first analysis unit and the second analysis unit calculates the likelihood of speech that is a speech recognition candidate using a Viterbi algorithm or a neural network. Is preferred.
また、前記音声決定部は、前記第1解析部において算出した音声認識候補となる各音声の尤度、及び、前記第2解析部において算出した音声認識候補となる各音声の尤度を音声毎に加算し、当該音声毎の加算値の最大値に対応する音声を認識結果とすることが好ましい。 In addition, the speech determination unit calculates the likelihood of each speech that is a speech recognition candidate calculated in the first analysis unit and the likelihood of each speech that is a speech recognition candidate calculated in the second analysis unit for each speech. It is preferable that the voice corresponding to the maximum value of the added value for each voice is used as the recognition result.
また、本発明の前記目的は、上記音声認識装置と、前記音声決定部が認識結果とした音声に対応する合成音声を生成する音声生成装置とを備える音声変換装置により達成される。 In addition, the object of the present invention is achieved by a speech conversion device that includes the speech recognition device and a speech generation device that generates a synthesized speech corresponding to the speech that is determined as a recognition result by the speech determination unit.
本発明によれば、高速で音声認識を行うことができる音声認識装置及び音声変換装置を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the speech recognition apparatus and speech conversion apparatus which can perform speech recognition at high speed can be provided.
以下、本発明の実態形態について添付図面を参照して説明する。図1は、本発明の一実施形態に係る音声変換装置1を示すブロック図である。本実施形態に係る音声変換装置1は、図1に示すように、音声認識装置2および音声生成装置3を備えている。音声生成装置3は、音声認識装置2が認識とした音声に対応する合成音声を生成する装置である。
Hereinafter, actual forms of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a block diagram showing an audio conversion device 1 according to an embodiment of the present invention. As shown in FIG. 1, the speech conversion device 1 according to the present embodiment includes a
音声認識装置2は、音声入力手段21、変換手段22及び解析手段23を備えている。音声入力手段21は、発話者が発声した音声を収音する入力装置であり、例えば、骨伝導音をはじめとする体内伝導音などの固体伝搬信号を抽出する加速度ピックアップやマイクロフォンなどを挙げることができる。
The
変換手段22は、音声入力手段21に入力された音声信号をデジタル音声波形信号に変換する装置である。具体的には、例えば、音声信号をAD変換してPCM(パルス符号変調)形式の波形信号を得る装置である。
The
解析手段23は、音声入力手段21に入力された音声を解析するものであり、特徴ベクトル抽出部231と、特徴ベクトル記憶部232と、認識候補音声記憶部233と、第1解析部234と、第2解析部235と、音声決定部236とを備えている。
The
特徴ベクトル抽出部231は、デジタル音声波形信号をフレーム単位で解析して音声の特徴量を表す特徴ベクトルを抽出するものである。音声認識で用いられる特徴ベクトルとして、ケプストラム領域の特徴量(MFCC:Mel Frequency Cepstrum Coefficient)およびパワーが挙げられる。MFCCとは、フレーム毎に音声データのFFT分析で得られるパワースペクトルに対してメルスケールのフィルタバンクを施し、周波数軸変換されたパワースペクトルに対して離散コサイン変換(DCT)を実行することにより抽出される、スペクトル包絡を表すパラメータであり、その詳細は「音声認識システム」(野清宏、伊藤克亘、河原達也、武田一哉、山本幹雄 編著,オーム社出版局; ISBN4-274-13228-5)などで説明されている。
The feature
音声認識では、入力音声のスペクトル特徴量を離散コサイン変換し、ケプストラム領域において3つの処理(直流成分の除去,リフタリング処理およびケプストラム平均除去) を実行することで得られる12次元のMFCC(MFCC1,MFCC2,…MFCC12)およびその1次時間微分(ΔMFCC1,ΔMFCC2,…ΔMFCC12)、ならびにパワーPOWの1次時間微分(ΔPOW)およびその2次時間微分(ΔΔPOW)を併せた26次元の特徴ベクトルが利用される。 In speech recognition, 12-dimensional MFCC (MFCC1, MFCC2) obtained by performing discrete cosine transform on spectral features of input speech and executing three processes in the cepstrum domain (DC component removal, liftering processing, and cepstrum average removal) ,... MFCC12) and its first-order time derivative (ΔMFCC1, ΔMFCC2,. The
特徴ベクトル記憶部232は、フレーム単位で抽出した特徴ベクトルを時系列的に複数フレーム分記憶するものである。本実施形態においては、3フレーム分の特徴ベクトルを時系列的に順次記憶できるように構成されている。
The feature
認識候補音声記憶部233は、音声認識候補となる複数の音声を予め記憶する記憶部であり、各音声、例えば、「a」、「i」、「u」、「e」、「o」といった音声と、それらの各音声に対応する特徴ベクトルの情報が格納されている。
The recognition candidate
第1解析部234は、特徴ベクトル記憶部232に記憶された複数フレーム分における特徴ベクトルに基づいて、音声認識候補となる各音声の尤度を算出する解析部である。具体的に説明すると、特徴ベクトル記憶部232に記憶された3フレーム分の特徴ベクトル(26次元×3フレーム=78次元)と、認識候補音声記憶部233に記憶された各音声に対応する特徴ベクトル情報とに基づいて、入力された音声がどの音声に相当するのかを計算する尤度計算を行う。尤度計算手法としては、例えば、ビタビアルゴリズム(Viterbi algorithm)、あるいは、ニューラルネットワーク等を用いた最尤パス探索を例示することができる。
The
第2解析部235は、複数フレーム分における特徴ベクトルからフレーム単位あたりの平均特徴ベクトルを算出し、当該平均特徴ベクトルから、音声認識候補となる音声の尤度を算出する解析部である。平均特徴ベクトルは、以下に示す数式1〜数式4に基づいて算出される。なお、数式1は平均ケプストラムを、数式2は平均Δケプストラムを算出する式であり、数式3は平均ΔPOWを、数式4は平均ΔΔPOWを算出する式である。ここで、数式1〜4におけるMは、フレーム数を表す。また、WMFCC(j)、WΔMFCC(j)、WΔPOW(j)及びWΔΔPOW(j)は、フレーム毎に付される重み係数であり、例えば、0.0〜1.0までの任意の定数を設定することができる。
The
上記数式から算出された平均特徴ベクトルから、音声認識候補となる音声の尤度を算出するには、第1解析部234と同様に、平均特徴ベクトル(26次元)と、認識候補音声記憶部233に記憶された各音声に対応する特徴ベクトル情報とに基づいて、入力された音声がどの音声に相当するのかを計算する尤度計算を行う。尤度計算手法としては、例えば、ビタビアルゴリズム(Viterbi algorithm)、あるいは、ニューラルネットワーク等を用いた最尤パス探索を例示することができる。この第2解析部235は、第1解析部234において認識した認識結果の上位N個に対して尤度計算を行うように構成することが好ましい。例えば、N個の数を「2」とし、第1解析部234が認識した音声の中で上位2個の音声に基づいて尤度計算を行う。
In order to calculate the likelihood of speech as a speech recognition candidate from the average feature vector calculated from the above mathematical formula, the average feature vector (26 dimensions) and the recognition candidate
音声決定部236は、第1解析部234において算出した音声認識候補となる各音声の尤度、及び、第2解析部235において算出した音声認識候補となる各音声の尤度に基づいて一つの音声を決定する。具体的には、以下に示す数式5により音声を決定するように構成されており、第1解析部234において算出した音声認識候補となる各音声の尤度、及び、第2解析部235において算出した音声認識候補となる各音声の尤度を音声毎に加算し、当該音声毎の加算値の最大値に対応する音声を認識結果として決定する。
The
この数式5は、{L1s・λ+L2s}で算出される値が最も大きい音声を解として算出する数式であり、L1は、第1解析部234で認識した認識結果を表す音声の尤度であり、L2は、第1解析部234で認識した音声と同一の音声に対して第2解析部235で得られた尤度である。また、λは、重み係数である。
Formula 5 is a formula for calculating a speech having the largest value calculated by {L1 s · λ + L2 s } as a solution, and L1 is a speech likelihood representing a recognition result recognized by the
このように構成された音声変換装置1の作動について以下に説明する。まず、発話者が発生した音声を音声入力手段21により収音した後、変換手段22が、収音された音声信号をAD変換してPCM(パルス符号変調)形式のデジタル音声波形信号に変換する。例えば、発話者が、「あさひ」という音声を発した場合に取得されるデジタル音声波形信号の波形を図2に示す。 The operation of the speech conversion apparatus 1 configured as described above will be described below. First, after the voice generated by the speaker is picked up by the voice input means 21, the conversion means 22 performs AD conversion on the picked-up voice signal and converts it into a PCM (pulse code modulation) format digital voice waveform signal. . For example, FIG. 2 shows a waveform of a digital speech waveform signal acquired when a speaker utters a voice “Asahi”.
次いで、解析手段23の特徴ベクトル抽出部231が、デジタル音声波形信号をフレーム単位で解析して音声の特徴量を表す合計26次元の特徴ベクトルを抽出する。抽出された特徴ベクトルは、フレーム毎に時系列的に複数分、例えば3フレーム分の特徴ベクトルが特徴ベクトル記憶部232に記憶される。
Next, the feature
そして、第1解析部234が、特徴ベクトル記憶部232に記憶された3フレーム分の特徴ベクトル(26次元×3フレーム=78次元)と、認識候補音声記憶部233に記憶された各音声に対応する特徴ベクトル情報とに基づいて、入力された音声がどの音声に相当するのかを、例えばビタビアルゴリズムにより尤度計算する。尤度計算の結果、「a」という音声の尤度が0.80、「i」という音声の尤度が0.20、「u」という音声の尤度が0.30、「e」という音声の尤度が0.65、「o」という音声の尤度が0.40、無音の尤度が0.10であったとする。
Then, the
次に、第2解析部235が、上記数式1〜数式4に基づいて3フレーム分における特徴ベクトルから平均特徴ベクトルを算出する。その後、平均特徴ベクトル(26次元)と、認識候補音声記憶部233に記憶された各音声に対応する特徴ベクトル情報とに基づいて、入力された音声がどの音声に相当するのかを、例えばビタビアルゴリズムにより尤度計算する。尤度計算に際して、第2解析部235は、例えば、第1解析部234において認識した認識結果の上位2個に対して尤度計算を行う。第1解析部234において認識された結果の上位2個は、「a」及び「e」になるので、これらについての尤度計算を行う。尤度計算の結果、「a」という音声の尤度が0.90、「e」という音声の尤度が0.60であったとする。
Next, the
その後、音声決定部236が、第1解析部234において算出した音声認識候補となる各音声の尤度、及び、第2解析部235において算出した音声認識候補となる各音声の尤度に基づいて、上記数式5から一つの音声を決定する。数式5における重み係数λを「1」とした場合、数式5における{L1s・λ+L2s}は、「a」が、{0.80×1+0.90}=1.70となる。一方、「e」は、{0.65×1+0.6}=1.25となる。数式5は、1.70と1.25の内、数値の大きい音声を算出するので、「a」を最終的な認識結果であるとして算出する。
After that, the
このような音声認識を1フレームずつシフトしながら計算を繰り返し、デジタル音声波形信号の全てのフレームについての音声認識を行う。1フレーム毎の認識結果を模式的に表した図を図3に示す。なお、図3における□は、1つのフレームを表しており、「無」という表記は無音を示している。 The calculation is repeated while shifting such speech recognition frame by frame, and speech recognition is performed for all the frames of the digital speech waveform signal. FIG. 3 schematically shows the recognition result for each frame. In FIG. 3, □ represents one frame, and the notation “none” represents silence.
その後、音声生成装置3は、音声決定部236が認識結果として算出した「a」に相当する合成音声を生成し、スピーカから放音する。
Thereafter, the voice generation device 3 generates a synthesized voice corresponding to “a” calculated by the
本実施形態に係る音声認識装置2は、上述のようにフレーム単位で音声認識を行うことができるので、「あさひ」という言葉の「あ」という音が発せられている時間の初期の段階で、発話された音声が「あ」であると認識できるので、発話タイミングと音声認識タイミングとの間のタイムラグを短縮して高速で恩背の認識を行うことが可能になる。
Since the
また、本実施形態に係る音声認識装置2により得た認識結果に対応した音声合成信号をスピーカから放音する場合、発話タイミングと音声認識タイミングとの間にタイムラグを短縮できる結果、従来のように、発話者が発話したタイミングよりもかなり遅いタイミングで放音されることがなくなるため、発話者が、遅れて生成される合成音声の影響を受けて、うまく会話を進めることが困難になることを効果的に抑制することができる。
Further, when a speech synthesis signal corresponding to the recognition result obtained by the
1 音声変換装置
2 音声認識装置
21 音声入力手段
22 変換手段
23 解析手段
231 特徴ベクトル抽出部
232 特徴ベクトル記憶部
233 認識候補音声記憶部
234 第1解析部
235 第2解析部
236 音声決定部
3 音声生成装置
DESCRIPTION OF SYMBOLS 1
Claims (4)
前記解析手段は、
前記デジタル音声波形信号をフレーム単位で解析して音声の特徴量を表す特徴ベクトルを抽出する特徴ベクトル抽出部と、
前記フレーム単位で抽出した前記特徴ベクトルを時系列的に複数フレーム分記憶する特徴ベクトル記憶部と、
音声認識候補となる複数の音声を記憶する認識候補音声記憶部と、
前記特徴ベクトル記憶部に記憶された複数フレーム分における前記特徴ベクトルに基づいて、音声認識候補となる各音声の尤度を算出する第1解析部と、
前記複数フレーム分における前記特徴ベクトルからフレーム単位あたりの平均特徴ベクトルを算出し、当該平均特徴ベクトルから、音声認識候補となる音声の尤度を算出する第2解析部と、
前記第1解析部において算出した音声認識候補となる各音声の尤度、及び、前記第2解析部において算出した音声認識候補となる各音声の尤度に基づいて一つの音声を決定する音声決定部と、を備える音声認識装置。 Voice input means for inputting voice, conversion means for converting a voice signal input to the voice input means into a digital voice waveform signal, and input to the voice input means from the digital voice waveform signal converted by the conversion means A speech recognition device comprising an analysis means for analyzing the generated speech,
The analysis means includes
A feature vector extraction unit that analyzes the digital speech waveform signal in units of frames and extracts a feature vector representing a feature amount of speech;
A feature vector storage unit for storing the feature vectors extracted in units of frames for a plurality of frames in a time series;
A recognition candidate voice storage unit that stores a plurality of voices as voice recognition candidates;
A first analysis unit that calculates the likelihood of each speech that is a speech recognition candidate based on the feature vectors for a plurality of frames stored in the feature vector storage unit;
A second analysis unit that calculates an average feature vector per frame from the feature vectors for the plurality of frames, and calculates a likelihood of speech that is a speech recognition candidate from the average feature vector;
Speech determination for determining one speech based on the likelihood of each speech to be a speech recognition candidate calculated in the first analysis unit and the likelihood of each speech to be a speech recognition candidate calculated in the second analysis unit A voice recognition device.
前記音声決定部が認識結果とした音声に対応する合成音声を生成する音声生成装置とを備える音声変換装置。 The speech recognition device according to any one of claims 1 to 3,
A voice conversion device comprising: a voice generation device that generates a synthesized voice corresponding to the voice determined by the voice determination unit as a recognition result.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009068545A JP5229738B2 (en) | 2009-03-19 | 2009-03-19 | Speech recognition device and speech conversion device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009068545A JP5229738B2 (en) | 2009-03-19 | 2009-03-19 | Speech recognition device and speech conversion device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010224020A JP2010224020A (en) | 2010-10-07 |
| JP5229738B2 true JP5229738B2 (en) | 2013-07-03 |
Family
ID=43041312
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009068545A Active JP5229738B2 (en) | 2009-03-19 | 2009-03-19 | Speech recognition device and speech conversion device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5229738B2 (en) |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0756597B2 (en) * | 1986-07-08 | 1995-06-14 | 株式会社東芝 | Voice recognizer |
| JP2003295887A (en) * | 2002-03-29 | 2003-10-15 | Japan Science & Technology Corp | Voice recognition method and apparatus |
-
2009
- 2009-03-19 JP JP2009068545A patent/JP5229738B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2010224020A (en) | 2010-10-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6614639B2 (en) | Speech recognition apparatus and computer program | |
| JP2986792B2 (en) | Speaker normalization processing device and speech recognition device | |
| JP5961950B2 (en) | Audio processing device | |
| JP5634959B2 (en) | Noise / dereverberation apparatus, method and program thereof | |
| JP5725028B2 (en) | Speech segment determination device, speech segment determination method, and speech segment determination program | |
| JP2020060757A (en) | Speaker recognition device, speaker recognition method, and program | |
| JP2009003008A (en) | Noise suppression device, speech recognition device, noise suppression method, and program | |
| US20050010406A1 (en) | Speech recognition apparatus, method and computer program product | |
| JP2002268698A (en) | Voice recognition device, device and method for standard pattern generation, and program | |
| KR101361034B1 (en) | Robust speech recognition method based on independent vector analysis using harmonic frequency dependency and system using the method | |
| JP4705414B2 (en) | Speech recognition apparatus, speech recognition method, speech recognition program, and recording medium | |
| JP4858663B2 (en) | Speech recognition method and speech recognition apparatus | |
| JPWO2020136948A1 (en) | Speech rhythm converters, model learning devices, their methods, and programs | |
| JP4964194B2 (en) | Speech recognition model creation device and method thereof, speech recognition device and method thereof, program and recording medium thereof | |
| JP4313728B2 (en) | Voice recognition method, apparatus and program thereof, and recording medium thereof | |
| JP5229738B2 (en) | Speech recognition device and speech conversion device | |
| JP4464797B2 (en) | Speech recognition method, apparatus for implementing the method, program, and recording medium therefor | |
| JPH06289891A (en) | Speech recognition device | |
| JP3916834B2 (en) | Extraction method of fundamental period or fundamental frequency of periodic waveform with added noise | |
| JPH10133688A (en) | Speech recognition device | |
| JP3250604B2 (en) | Voice recognition method and apparatus | |
| JP4242320B2 (en) | Voice recognition method, apparatus and program thereof, and recording medium thereof | |
| JP6078402B2 (en) | Speech recognition performance estimation apparatus, method and program thereof | |
| JP2005321539A (en) | Voice recognition method, apparatus and program thereof, and recording medium thereof | |
| JP4362072B2 (en) | Speech signal analysis method and apparatus for performing the analysis method, speech recognition apparatus using the speech signal analysis apparatus, program for executing the analysis method, and storage medium thereof |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20101027 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110112 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120315 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120315 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20120315 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130214 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130312 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160329 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5229738 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |