Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0752354B2 - Voice recognizer - Google Patents
[go: Go Back, main page]

JPH0752354B2 - Voice recognizer - Google Patents

Voice recognizer

Info

Publication number
JPH0752354B2
JPH0752354B2 JP60199562A JP19956285A JPH0752354B2 JP H0752354 B2 JPH0752354 B2 JP H0752354B2 JP 60199562 A JP60199562 A JP 60199562A JP 19956285 A JP19956285 A JP 19956285A JP H0752354 B2 JPH0752354 B2 JP H0752354B2
Authority
JP
Japan
Prior art keywords
recognition
pattern
standard pattern
contribution
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60199562A
Other languages
Japanese (ja)
Other versions
JPS6259997A (en
Inventor
陽一 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP60199562A priority Critical patent/JPH0752354B2/en
Publication of JPS6259997A publication Critical patent/JPS6259997A/en
Publication of JPH0752354B2 publication Critical patent/JPH0752354B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は不特定な話者の音声を認識する音声認識装置に
関し、特に正しい認識への貢献度が低い標準パターンを
削除して認識性能を向上させた音声認識装置に関するも
のである。
Description: TECHNICAL FIELD The present invention relates to a voice recognition device for recognizing a voice of an unspecified speaker, and in particular, a standard pattern having a low contribution to correct recognition is deleted to improve recognition performance. The present invention relates to an improved voice recognition device.

(従来の技術) 従来、不特定話者を対象とする音声認識装置はアナログ
の音声信号を入力とし、これをA/D変換し、周波数分析
等を行なって何らかの特徴量に変換し、この特徴量に変
換された入力パターンと予め同様にして認識対象となる
各カテゴリ毎に作成された標準パターンとの類似度計算
(パターンマッチング)を行なって、類似度が最大とな
る標準パターンのカテゴリを認識カテゴリとするように
構成されている。
(Prior Art) Conventionally, a voice recognition device for an unspecified speaker receives an analog voice signal as an input, performs A / D conversion, performs frequency analysis, etc., and converts it into some feature amount. Recognize the category of the standard pattern with the maximum similarity by performing similarity calculation (pattern matching) between the input pattern converted into the amount and the standard pattern created in advance for each category to be recognized. It is organized into categories.

標準パターンの作成方法としては、認識対象カテゴリ毎
に、あらかじめ用意された複数話者(一般的に1000人程
度)の前記特徴量である音声パターンについてクラスタ
リング、平均化等の処理を行ない1カテゴリ当りの標準
パターンを複数個(実際には20個程度)作成する方法が
一般的である。標準パターン作成に際し使用された音声
パターンを以後学習パターンと称す。
As a method of creating a standard pattern, for each category to be recognized, processing such as clustering and averaging is performed on a voice pattern, which is the feature amount of a plurality of speakers (generally about 1000 people) prepared in advance, per category. The standard method is to create multiple standard patterns (about 20 in practice). The voice pattern used in creating the standard pattern is hereinafter referred to as a learning pattern.

(発明が解決しようとする問題点) しかしながら前記構成の音声認識装置では次のような問
題点がある。
(Problems to be Solved by the Invention) However, the voice recognition device having the above configuration has the following problems.

標準パターン作成に使用される学習パターンはあくまで
も限定された範囲の話者から構成されるものであり前記
限定された話者の特徴分布を効率的に網羅するものであ
る。従って、学習パターンを標準パターンを用いて認識
した場合には誤認識となる可能性は極めて小であり、か
つ各カテゴリ内で効率的にクラスタリングが行なわれて
いることにより複数の標準パターンが特徴空間内におい
て均等に配置されているので学習パターンの正認識時に
全標準パターンの中で類似度が最大となる頻度は各標準
パターン間で均等となる。しかしながら不特定話者を対
象として認識を行なう場合認識対象となる話者数は前記
学習パターンを構成する話者数をはるかに上回りそれに
伴ない特徴分布のばらつきの大きさも学習パターン内に
おけるばらつきの大きさに比較して大となる。
The learning pattern used for creating the standard pattern is made up of only a limited range of speakers, and efficiently covers the characteristic distribution of the limited speakers. Therefore, when the learning pattern is recognized by using the standard pattern, the possibility of misrecognition is extremely small, and the clustering is efficiently performed in each category, so that a plurality of standard patterns can be recognized in the feature space. Since all the standard patterns have the highest similarity among all the standard patterns when the learning pattern is correctly recognized, the standard patterns are evenly distributed among the standard patterns. However, in the case of recognizing an unspecified speaker, the number of speakers to be recognized is far greater than the number of speakers constituting the learning pattern, and the variation in the feature distribution is also large in the learning pattern. It will be large compared to that.

即ち、学習パターンが持つ特徴分布と不特定話者を対象
として認識を行なう時の学習されていない入力パターン
が持つ特徴分布は異なったものとなる。従って、学習さ
れていない入力パターンに対し認識処理を行なった場合
には、前述した如き特徴分布の相違に起因して正認識時
に全標準パターンの中で類似度が最大となる頻度が各標
準パターン間で均等とならずに特定の標準パターンに集
中し、標準パターンの中には正認識時に全標準パターン
の中で類似度が最大となる回数が少なく認識への寄与度
が小さい、あるいは他カテゴリに誤認識を起しやすい傾
向を持つ標準パターンが出現する。
That is, the feature distribution of the learning pattern and the feature distribution of the unlearned input pattern when recognizing an unspecified speaker are different. Therefore, when a recognition process is performed on an unlearned input pattern, the frequency at which the similarity becomes the maximum among all standard patterns during normal recognition due to the difference in feature distribution as described above Concentrate on a specific standard pattern rather than evenly between them, and among the standard patterns, the number of times that the maximum similarity among all standard patterns at the time of correct recognition is small and the contribution to recognition is small, or other category A standard pattern that tends to cause misrecognition appears.

上記理由により正認識への寄与度が小である標準パター
ンを持つことにより認識に関して有効でない類似度計算
時間が発生し認識処理時間の増大を招く、あるいは誤認
識を引き起こし易い標準パターンの存在により認識率低
下を招く現象が発生し、いずれにしても音声認識装置と
しての性能低下を招くという問題点がある。
For the above reasons, having a standard pattern that has a small contribution to correct recognition causes an ineffective similarity calculation time for recognition, resulting in an increase in recognition processing time, or recognition due to the existence of a standard pattern that easily causes erroneous recognition. There is a problem that a phenomenon that causes a decrease in the rate occurs, and in any case, the performance of the voice recognition device deteriorates.

この問題点を解決するために、例えば特開昭59-15990号
公報に開示されているように、誤認識を引き起し易い標
準パターンを削除すると、削除した標準パターンの正認
識への寄与も大であった場合に誤認識数、正認識数双方
とも減少する現象が表われるので認識性能の全体的向上
は困難であった。
In order to solve this problem, for example, as disclosed in Japanese Patent Laid-Open No. 59-15990, deleting a standard pattern that easily causes misrecognition also contributes to correct recognition of the deleted standard pattern. When it is large, the number of false recognitions and the number of correct recognitions both decrease, which makes it difficult to improve the overall recognition performance.

本発明は以上述べた欠点を除去し、認識に対する貢献度
が小である標準パターンを削除し認識性能を向上させる
ことができる音声認識装置を提供するものである。
The present invention provides a speech recognition apparatus capable of eliminating the above-mentioned drawbacks and deleting a standard pattern having a small contribution to recognition to improve the recognition performance.

(問題点を解決するための手段) 本発明によれば、複数の音声パターンを処理して作成さ
れた各カテゴリ毎の標準パターンをあらかじめ記憶して
いる第1の記憶手段と、該第1の記憶手段に記憶されて
いる前記標準パターンと音声認識すべき入力音声パター
ンとの類似度計算を行う手段と、該類似度が最大となる
標準パターンのカテゴリ名を認識結果として判定し出力
する手段と、入力音声パターンに対して前記標準パター
ンを用いて認識処理を行った場合の、正認識結果の回数
及び誤認識結果の回数を各標準パターン毎にそれぞれ計
数する計数手段と、標準パターンの作成時に使用された
前記複数の音声パターンに対して該標準パターンを用い
て認識処理を行った場合の、正認識結果の回数を各標準
パターン毎に計数した結果をあらかじめ記憶している第
2の記憶手段と、前記計数手段の計数結果と前記第2の
記憶手段の記憶内容とに基づいて各標準パターンの正認
識に対する非貢献度を計算する計算手段とを備えてお
り、該計算手段の計算結果に基づいて非貢献度の高い標
準パターンを前記第1の記憶手段から削除するようにし
た音声認識装置が提供される。
(Means for Solving Problems) According to the present invention, first storage means for storing in advance a standard pattern for each category created by processing a plurality of voice patterns, and the first storage means. Means for calculating a similarity between the standard pattern stored in the storage means and an input voice pattern to be recognized, and means for determining and outputting the category name of the standard pattern having the maximum similarity as a recognition result. When a recognition process is performed on the input voice pattern using the standard pattern, a counting unit that counts the number of correct recognition results and the number of false recognition results for each standard pattern, and at the time of creating the standard pattern When the recognition processing is performed on the plurality of used voice patterns using the standard pattern, the result of counting the number of correct recognition results for each standard pattern is calculated in advance. A second storage means for storing the same; and a calculation means for calculating the non-contribution degree to the correct recognition of each standard pattern based on the counting result of the counting means and the storage content of the second storage means. Accordingly, there is provided a voice recognition device in which a standard pattern having a high non-contribution degree is deleted from the first storage means based on the calculation result of the calculation means.

(作用) 第1の記憶手段には、複数の音声パターン(学習パター
ン)を処理して作成された各カテゴリ毎の標準パターン
があらかじめ記憶されている。一方、第2の記憶手段に
は、これら学習パターンに対して標準パターンを用いて
認識処理を行った場合の、正認識回数(正認識への寄与
度)を各標準パターン毎に計数した結果があらかじめ記
憶されている。計数手段は、音声認識すべき入力音声パ
ターンに対して標準パターンを用いて認識処理を行った
場合の、正認識回数(正認識への寄与度)及び誤認識回
数(誤認識への寄与度)を各標準パターン毎にそれぞれ
計数する。各標準パターンへの非貢献度は、計数手段の
計数した正認識回数及び誤認識回数のみならず第2の記
憶手段に記憶されている正認識回数をも考慮して(例え
ば、誤認識回数から両正認識回数を差し引くことによっ
て)計算される。このように計算された非貢献度に応じ
て標準パターンの削除が行われるので、標準パターン作
成時に用いた標準的発生者の発声パターン(学習パター
ン)からかけ離れた発声を行う者が集中して本音声認識
装置を使用した場合(例えば、特有の方言がある地域で
装置が使用された場合)、本来の標準的な発声に対して
は認識貢献度が高いがその地域に限って認識貢献度が低
いと判断されて標準パターンが誤って削除されてしまう
ような不都合を未然に防止できる。その結果、認識性能
の向上を図ることができる。
(Operation) The first storage means stores in advance a standard pattern for each category created by processing a plurality of voice patterns (learning patterns). On the other hand, the second storage means stores the result of counting the number of correct recognitions (contribution to correct recognition) for each standard pattern when the recognition process is performed on these learning patterns using the standard pattern. It is stored in advance. The counting means corrects recognition frequency (contribution to correct recognition) and misrecognition frequency (contribution to misrecognition) when recognition processing is performed on the input voice pattern to be recognized by using a standard pattern. Is counted for each standard pattern. The degree of non-contribution to each standard pattern considers not only the number of correct recognitions and the number of false recognitions counted by the counting means but also the number of correct recognitions stored in the second storage means (for example, from the number of false recognitions It is calculated (by subtracting both positive recognition times). Since the standard pattern is deleted according to the non-contribution calculated in this way, people who perform utterances far from the utterance pattern (learning pattern) of the standard generator used when creating the standard pattern are concentrated in the book. When a voice recognition device is used (for example, when the device is used in an area with a specific dialect), the recognition contribution is high for the original standard utterance, but the recognition contribution is limited only in that area. It is possible to prevent the inconvenience that the standard pattern is determined to be low and is deleted by mistake. As a result, the recognition performance can be improved.

(実施例) 第1図は本発明の一実施例を示すブロック図である。同
図において、1は入力パターンAと標準パターンBとの
類似度計算を行なう類似度計算部、2は標準パターンB
を記憶する標準パターン記憶部、3は装置全体を制御す
る制御部、4は標準パターン毎の学習パターンの正認識
への寄与度を記憶する学習パターン正認識寄与度記憶
部、5は標準パターン毎の正認識への寄与度を計数する
正認識計数部、6は標準パターン毎の誤認識への寄与度
を計数する誤認識計数部、7は学習パターン正認識寄与
度記憶部4、正認識計数部5及び誤認識計数部6の出力
信号から標準パターン毎の認識処理における非貢献度を
計算して削除すべき標準パターンの番号を標準パターン
記憶部2へ出力する非貢献度計算部である。
(Embodiment) FIG. 1 is a block diagram showing an embodiment of the present invention. In the figure, 1 is a similarity calculator that calculates the similarity between the input pattern A and the standard pattern B, and 2 is the standard pattern B.
A standard pattern storage unit for storing the standard device, 3 a control unit for controlling the entire apparatus, 4 a learning pattern positive recognition contribution ratio storage unit for storing the contribution of learning patterns for each standard pattern to correct recognition, and 5 a standard pattern for each standard pattern. A positive recognition counting unit that counts the contribution to correct recognition, 6 is a false recognition counting unit that counts the contribution to false recognition for each standard pattern, and 7 is a learning pattern correct recognition contribution storage unit 4 and a correct recognition count. It is a non-contribution degree calculation unit that calculates the non-contribution degree in the recognition processing for each standard pattern from the output signals of the unit 5 and the misrecognition counting unit 6 and outputs the number of the standard pattern to be deleted to the standard pattern storage unit 2.

次に第2図の動作フローチャートを参照して動作を説明
する。まず、制御部3は類似度計算部1、正認識計数部
5及び誤認識計数部6へ認識開始指令信号3aを出力す
る。類似度計算部1は制御部3が認識開始指令信号3aを
入力した時刻より入力パターンAを逐次入力する(ステ
ップ)。このとき、正解カテゴリ名も同時に入力す
る。この入力パターンAと標準パターン記憶部2に格納
されている全ての標準パターンBとの類似度計算を行な
い(ステップ)、正解カテゴリ名と比較して正認識で
あるか誤認識であるかの判定を行なう(ステップ)。
この判定の結果、正認識である場合は正認識計数部5へ
類似度が最大である標準パターン番号である正認識標準
パターン番号1aを出力し、誤認識である場合は、誤認識
計数部6へ類似度が最大である標準パターン番号である
誤認識標準パターン番号1bを出力する動作を認識対象と
なる入力パターンAの入力が終了するまで繰り返し行な
う。本発明の効果を確認するためには入力パターンの入
力回数は1万回以上であることが望ましい。入力パター
ン1の入力が終了した後、類似度計算部1は認識終了信
号1cを制御部3へ出力する。制御部3は類似度計算部1
より認識終了信号1cを入力した後、計数結果出力指令信
号3bを正認識計数部5と誤認識計数部6へ出力する。
Next, the operation will be described with reference to the operation flowchart of FIG. First, the control unit 3 outputs a recognition start command signal 3a to the similarity calculation unit 1, the correct recognition counting unit 5, and the false recognition counting unit 6. The similarity calculation unit 1 sequentially inputs the input pattern A from the time when the control unit 3 inputs the recognition start command signal 3a (step). At this time, the correct category name is also entered. The similarity between the input pattern A and all the standard patterns B stored in the standard pattern storage unit 2 is calculated (step) and compared with the correct answer category name to determine whether the recognition is correct or erroneous. (Step).
As a result of this determination, if the recognition is correct, the correct recognition standard pattern number 1a, which is the standard pattern number having the highest degree of similarity, is output to the correct recognition counting unit 5, and if the recognition is incorrect, the recognition error counting unit 6 is performed. The operation of outputting the erroneously recognized standard pattern number 1b, which is the standard pattern number with the highest similarity, is repeated until the input of the input pattern A to be recognized is completed. In order to confirm the effect of the present invention, it is desirable that the number of times the input pattern is input is 10,000 or more. After the input of the input pattern 1 is completed, the similarity calculation unit 1 outputs the recognition end signal 1c to the control unit 3. The control unit 3 is the similarity calculation unit 1
After inputting the recognition end signal 1c, the counting result output command signal 3b is output to the correct recognition counting unit 5 and the false recognition counting unit 6.

正認識計数部5は各標準パターン毎の正認識寄与度を以
下の手段により算出する機能を有する。ある1つの学習
されていない入力パターンと各標準パターン間の類似度
計算(類似度計算部1)を行ない、正認識の場合に全標
準パターンの中で最大類似度を与える標準パターンに対
して得点1を加算する(ステップ)。この動作を制御
部3より認識開始指令信号3aを入力した時刻より開始
し、制御部3より計数結果出力指令信号3bを入力する時
刻まで音声入力毎に行なう。以上の動作において各標準
パターンに対して得られた得点を正認識寄与度と定義
し、学習されていない入力パターンに対する正認識への
寄与の大きさを表わすパラメータとする。
The positive recognition counting unit 5 has a function of calculating the positive recognition contribution for each standard pattern by the following means. The similarity calculation between one unlearned input pattern and each standard pattern (similarity calculation unit 1) is performed, and a score is given to the standard pattern that gives the maximum similarity among all the standard patterns in the case of correct recognition. Add 1 (step). This operation starts from the time when the recognition start command signal 3a is input from the control unit 3 and is performed for each voice input until the time when the count result output command signal 3b is input from the control unit 3. The score obtained for each standard pattern in the above operation is defined as the correct recognition contribution rate, and is used as a parameter indicating the magnitude of the contribution to the correct recognition for an unlearned input pattern.

誤認識計数部6は各標準パターン毎の誤認識寄与度を以
下の手段により算出する機能を有する。ある1つの学習
されていない入力パターンと各標準パターン間の類似度
計算(類似度計算部1)を行ない、誤認識した場合に全
標準パターンの中で最大類似度を与える標準パターンに
対して得点1を加算する(ステップ)。この動作を制
御部3より認識開始指令信号3aを入力した時刻より開始
し、制御部3より計数結果出力指令信号3bを入力する時
刻まで音声入力毎に行なう。以上の動作において各標準
パターンに対して得られた得点を誤認識寄与度と定義
し、学習されていない入力パターンに対する誤認識への
寄与の大きさを表わすパラメータとする。
The misrecognition counting unit 6 has a function of calculating the misrecognition contribution rate for each standard pattern by the following means. A similarity calculation (similarity calculation unit 1) between a certain unlearned input pattern and each standard pattern is performed, and a score is given to the standard pattern that gives the maximum similarity among all the standard patterns when misrecognized. Add 1 (step). This operation starts from the time when the recognition start command signal 3a is input from the control unit 3 and is performed for each voice input until the time when the count result output command signal 3b is input from the control unit 3. The score obtained for each standard pattern in the above operation is defined as the misrecognition contribution rate, and is used as a parameter representing the magnitude of the contribution to the misrecognition for an unlearned input pattern.

次に制御部3は入力パターンの入力が終了したかどうか
の判定を行なう(ステップ)。ここで、終了していな
い場合は上記処理を再び繰り返し、終了している場合は
次の処理へ移る。
Next, control unit 3 determines whether or not the input of the input pattern is completed (step). If the processing has not been completed, the above processing is repeated, and if the processing has been completed, the next processing is performed.

学習パターン正認識寄与度記憶部4は以下の説明により
定義される各標準パターン毎の学習パターン正認識寄与
度を記憶する機能を有する。ある1つの学習パターンと
各標準パターン間の類似度計算を行ない、正認識した場
合に全標準パターンの中で最大類似度を与える標準パタ
ーンに対して得点1を加算する。上記動作を予め全ての
学習パターンに対して行なって各標準パターンに対して
得られた得点を学習パターン正認識寄与度4aと定義し、
学習パターンに対する正認識への寄与の大きさを表わす
パラメータとして記憶する。
The learning pattern normal recognition contribution storage unit 4 has a function of storing the learning pattern normal recognition contribution for each standard pattern defined by the following description. The similarity between a certain learning pattern and each standard pattern is calculated, and a score of 1 is added to the standard pattern that gives the maximum similarity among all the standard patterns when the correct recognition is performed. The above operation is performed for all learning patterns in advance and the score obtained for each standard pattern is defined as the learning pattern positive recognition contribution 4a,
It is stored as a parameter indicating the magnitude of contribution to correct recognition for the learning pattern.

正認識計数部5及び誤認識計数部6は制御部3より計数
結果出力指令信号3bを入力した後、前者は正認識寄与度
5a、後者は誤認識寄与度6aを非貢献度計算部7へ出力す
る。非貢献度計算部7は正認識寄与度5a、誤認識寄与度
6a及び前記学習パターン正認識寄与度4aを入力として以
下に述べる如く各標準パターン毎の認識処理における非
貢献度を算出する(ステップ)。標準パターン数をSN
O,正認識寄与度をREC(i),i=1〜SNO、誤認識寄与度をE
RR(i),i=1〜SNO、学習パターン正認識寄与度をIR
E(i),i=1〜SNO、非貢献度をNDEL(i),i=1〜SNO、と
する時、 NDEL(i)=CE・ERR(i)-CR・REC(i)-CI・IRE(i) で定義する。即ち、誤認識寄与度6aが大、正認識寄与度
5a及び学習パターン正認識寄与度4aが小であるほど非貢
献度は大となる。
The correct recognition counting unit 5 and the false recognition counting unit 6 input the count result output command signal 3b from the control unit 3, and then the former recognizes the positive recognition contribution rate.
5a, the latter outputs the misrecognition contribution 6a to the non-contribution calculation unit 7. The non-contribution calculation unit 7 calculates the contribution 5a of correct recognition and the contribution 5 of false recognition.
6a and the learning pattern correct recognition contribution 4a are input to calculate the non-contribution in the recognition process for each standard pattern as described below (step). The standard pattern number is SN
O, positive recognition contribution REC (i) , i = 1 to SNO, false recognition contribution E
RR (i) , i = 1 to SNO, learning pattern positive recognition contribution is IR
When E (i) , i = 1 to SNO and non-contribution degree is NDEL (i) , i = 1 to SNO, NDEL (i) = CE ・ ERR (i) -CR ・ REC (i) -CI・ IRE (i) Define in. That is, the misrecognition contribution rate 6a is large, and the correct recognition contribution rate is 6a.
The smaller the 5a and the contribution 4a of the learning pattern positive recognition, the larger the non-contribution.

非貢献度計算部7は前記非貢献度算出後、非貢献度が大
である標準パターンから順番にあらかじめ与えられた削
除パターン数の標準パターンを削除すべく削除標準パタ
ーン番号7aを標準パターン記憶部6へ出力する。標準パ
ターン記憶部2は入力された削除標準パターン番号7aに
該当する標準パターンを削除する(ステップ)。
After calculating the non-contribution degree, the non-contribution degree calculating unit 7 deletes the standard pattern number 7a from the standard pattern having the largest non-contribution degree in order to delete the standard patterns of the predetermined number of deletion patterns. Output to 6. The standard pattern storage unit 2 deletes the standard pattern corresponding to the input deleted standard pattern number 7a (step).

以上のように本実施例では、正認識寄与度、学習パター
ン正認識寄与度及び誤認識寄与度から成る3種類のパラ
メータにより認識処理時における非貢献度を算出するこ
とにより、例えば誤認識寄与度が大かつ正認識寄与度が
大であるような削除した場合に誤認識数は低下するが認
識数の低下も招くような標準パターンの削除を避け、真
に認識への貢献度が低い標準パターンを削除したので、
パターンマッチング回数の減少による認識処理速度の高
速化及び誤認識数低下による認識精度向上ができる。
As described above, in the present embodiment, by calculating the non-contribution degree during the recognition process by using the three types of parameters including the correct recognition contribution rate, the learning pattern correct recognition contribution rate, and the incorrect recognition contribution rate, for example, the incorrect recognition contribution rate Is large and the contribution to correct recognition is large, the standard pattern with a low contribution to recognition is avoided by avoiding the deletion of standard patterns that reduce the number of false recognitions but also reduce the number of recognitions. Since I deleted
The recognition processing speed can be increased by reducing the number of times of pattern matching, and the recognition accuracy can be improved by decreasing the number of false recognitions.

(発明の効果) 以上説明したように本発明によれば、標準的な発声から
大きく外れた声質の話者による認識結果に対して、本来
は認識結果に高い貢献度を示すべき標準パターンを誤っ
て削除する危険を未然に回避し、真に正認識への貢献度
が低い標準パターンのみを削除できるので、パターンマ
ッチング回数の減少による認識処理速度の高速化及び認
識精度の向上が可能となる。
(Effects of the Invention) As described above, according to the present invention, a standard pattern that originally should have a high contribution to a recognition result is erroneous with respect to a recognition result by a speaker having a voice quality greatly deviating from a standard utterance. Since it is possible to avoid the risk of being deleted in advance and to delete only the standard pattern that has a low contribution to the true recognition, it is possible to speed up the recognition processing speed and improve the recognition accuracy by reducing the number of times of pattern matching.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の一実施例を示すブロック図、第2図は
第1図の実施例の動作を示すフローチャートである。 1……類似度計算部、2……標準パターン記憶部、3…
…制御部、4……学習パターン正認識寄与度記憶部、5
……正認識計数部、6……誤認識計数部、7……非貢献
度計算部。
FIG. 1 is a block diagram showing an embodiment of the present invention, and FIG. 2 is a flow chart showing the operation of the embodiment of FIG. 1 ... Similarity calculation unit, 2 ... Standard pattern storage unit, 3 ...
Control unit, 4 Learning pattern correct recognition contribution storage unit, 5
…… Correct recognition counting unit, 6 …… False recognition counting unit, 7 …… Non-contribution degree calculation unit.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】複数の音声パターンを処理して作成された
各カテゴリ毎の標準パターンをあらかじめ記憶している
第1の記憶手段と、該第1の記憶手段に記憶されている
前記標準パターンと音声認識すべき入力音声パターンと
の類似度計算を行う手段と、該類似度が最大となる標準
パターンのカテゴリ名を認識結果として判定し出力する
手段と、入力音声パターンに対して前記標準パターンを
用いて認識処理を行った場合の、正認識結果の回数及び
誤認識結果の回数を各標準パターン毎にそれぞれ計数す
る計数手段と、標準パターンの作成時に使用された前記
複数の音声パターンに対して該標準パターンを用いて認
識処理を行った場合の、正認識結果の回数を各標準パタ
ーン毎に計数した結果をあらかじめ記憶している第2の
記憶手段と、前記計数手段の計数結果と前記第2の記憶
手段の記憶内容とに基づいて各標準パターンの正認識に
対する非貢献度を計算する計算手段とを備えており、該
計算手段の計算結果に基づいて非貢献度の高い標準パタ
ーンを前記第1の記憶手段から削除することを特徴とす
る音声認識装置。
1. A first storage means for storing in advance a standard pattern for each category created by processing a plurality of voice patterns, and the standard pattern stored in the first storage means. A means for calculating a similarity with an input voice pattern to be recognized, a means for determining and outputting a category name of a standard pattern having the maximum similarity as a recognition result, and a standard pattern for the input voice pattern. When performing recognition processing using, the counting means for respectively counting the number of correct recognition results and the number of erroneous recognition results for each standard pattern, and for the plurality of voice patterns used when creating the standard pattern A second storage unit that stores in advance the result of counting the number of correct recognition results for each standard pattern when the recognition process is performed using the standard pattern; The non-contribution means calculates the non-contribution degree of each standard pattern to the correct recognition based on the counting result of the number means and the stored content of the second storage means. A voice recognition device, characterized in that a standard pattern having a high degree of contribution is deleted from the first storage means.
JP60199562A 1985-09-11 1985-09-11 Voice recognizer Expired - Lifetime JPH0752354B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60199562A JPH0752354B2 (en) 1985-09-11 1985-09-11 Voice recognizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60199562A JPH0752354B2 (en) 1985-09-11 1985-09-11 Voice recognizer

Publications (2)

Publication Number Publication Date
JPS6259997A JPS6259997A (en) 1987-03-16
JPH0752354B2 true JPH0752354B2 (en) 1995-06-05

Family

ID=16409889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60199562A Expired - Lifetime JPH0752354B2 (en) 1985-09-11 1985-09-11 Voice recognizer

Country Status (1)

Country Link
JP (1) JPH0752354B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007286356A (en) * 2006-04-17 2007-11-01 Funai Electric Co Ltd Electronic equipment

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59106085A (en) * 1982-12-10 1984-06-19 Fujitsu Ltd Dictionary updating method of recognizing device
JPS59214900A (en) * 1983-05-23 1984-12-04 株式会社日立製作所 voice recognition device
JPS6214700A (en) * 1985-07-12 1987-01-23 三洋電機株式会社 Voice recognition equipment

Also Published As

Publication number Publication date
JPS6259997A (en) 1987-03-16

Similar Documents

Publication Publication Date Title
EP0518638B1 (en) Apparatus and method for identifying a speech pattern
JP3263392B2 (en) Text processing unit
US5684924A (en) User adaptable speech recognition system
JP3124277B2 (en) Speech recognition system
JP3876703B2 (en) Speaker learning apparatus and method for speech recognition
JP2829014B2 (en) Speech recognition device and method
JPH0752354B2 (en) Voice recognizer
JPS6123560B2 (en)
JPH021317B2 (en)
JPH0754434B2 (en) Voice recognizer
JP2644494B2 (en) Unspecified speaker speech recognition device
JPS6259999A (en) Unspecified speaker voice recognition equipment
JP2748383B2 (en) Voice recognition method
JP3100208B2 (en) Voice recognition device
Spohrer et al. Automatic labeling of speech
JPH0654503B2 (en) Pattern recognition device
JPH075890A (en) Voice interaction device
JPS58130394A (en) Voice recognition equipment
JP2712586B2 (en) Pattern matching method for word speech recognition device
JPS58159598A (en) Monosyllabic voice recognition system
JP2520391B2 (en) Word speech recognizer
JP2520392B2 (en) Word speech recognizer
CN117995190A (en) Method for realizing voice control on Linux system recorder product
JPS6073592A (en) Voice recognition equipment for specific speaker
JPH06301395A (en) Speech recognition system