JPS6329757B2 - - Google Patents
Info
- Publication number
- JPS6329757B2 JPS6329757B2 JP56169177A JP16917781A JPS6329757B2 JP S6329757 B2 JPS6329757 B2 JP S6329757B2 JP 56169177 A JP56169177 A JP 56169177A JP 16917781 A JP16917781 A JP 16917781A JP S6329757 B2 JPS6329757 B2 JP S6329757B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- command
- similarity
- recognition
- voice command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Description
本発明は、予め登録した操作者の登録音声デー
タに基づいた音声命令の認識により音声命令に対
応した負荷の作動を指令する装置において、順次
入力する2つの同じ音声命令の認識処理に基づい
て負荷の作動を指令することにより音声命令の認
識を確実に行なえるようにした車両用音声認識装
置に関する。
従来、この種の音声認識装置としては、例えば
第1図に示すようなものがある。
第1図において、1は運転席の近傍に設けられ
たマイクロホンであり、音声認識装置の使用に際
しては、まず登録スイツチ2の操作により操作者
の音声による所定の音声命令の登録を行なつてお
く。すなわち、登録スイツチ2をオン操作する
と、スイツチ入力検出回路4がスイツチ操作を検
出して信号線4aに出力を生じ、制御部5により
各回路部に対し登録モードの処理指令が与えられ
る。このような登録モードにおいて、所定の音声
命令、例えばカーラジオの電源オンについて定め
られている音声命令「ラジオ」をマイクロホン1
に向けて発すると、音声命令はマイクロホン1で
電気信号に変換されて音声入力回路6で増幅さ
れ、この増幅出力信号は音声検出回路7に入力し
て時系列信号となる音声信号の開始時点が信号レ
ベルの立上り変化に基づいて検出され、制御部5
に対し登録処理の開始を指令する。
そのため、マイクロホン1よりの音声信号は帯
域フイルタ群8で所定の周波数に分割され、パラ
メータ抽出部9において各周波数帯域での音声パ
ワースペクトラムを得るために、2乗又は整流さ
れ、音声パワー情報となる時系列の音声データに
デジタル変換され、メモリ10に記憶される。こ
のとき登録スイツチ2の操作により登録モードと
なつているので、メモリ10の音声データは登録
データ記憶部11に転送され、音声認識処理を行
なうための基準データとして登録される。
次に、音声命令の登録が終了した後に、車載負
荷、例えばラジオを聞きたい場合には、指令開始
スイツチ3をオン操作してマイクロホン1に向つ
て所定の音声命令「ラジオ」を与えるようにす
る。
この指令開始スイツチ3のオン操作に対して
は、スイツチ入力検出回路4が信号線4bに出力
を生じ、制御部5によつて各回路部に対し認識モ
ードの制御指令が与えられ、このときマイクロホ
ン1より入力する音声命令を、登録時と同様に音
声データに変換してメモリ10に書込むようにな
る。このメモリ10に記憶された音声データは、
登録データ記憶部11より順次読出される複数の
登録データとの間で、類似度比較処理部12にお
いて類似度の演算を行なう。この類似度の演算と
しては、音声データと登録データとについて時間
軸の正規化やレベルの正規化を行なつた後に、チ
エビシエフ距離やその他の距離についての演算を
実行して類似度を求めるようになる。
類似度比較処理部12で演算された類似度の値
は、認識語処理判断部13で類似度の値が予め定
められた閾値の範囲内にあるか否かが判別され、
範囲内にあるときには、この類似度をもつ音声デ
ータに対応した指令を駆動部14に出力し、カー
ラジオの電源を投入するようになる。
ところで、車両用の音声認識装置の使用環境
は、一般の音声認識装置に比べ周囲の騒音レベル
が高く、特にエンジンを始動した車両の使用状態
では車室の騒音レベルが上昇し、しかも雑音の混
入はランダムに生ずるため、負荷の作動を音声命
令により指令したときの音声信号に含まれる雑音
成分の割合が高く、比較的大きな雑音が混入した
場合には、音声命令を認識できなかつたり、更に
は誤認識により誤つた負荷の作動を指令する恐れ
があつた。
本発明は、このような従来の問題点に着目して
なされたもので、指令開始スイツチのオン操作に
続いて入力する音声命令を登録音声データに基づ
いて認識し、該認識出力に基づいて上記音声命令
に対応した負荷の作動を指令する装置において、
音声命令の認識を確実に行なうため、順次入力す
る2つの音声命令が同一であることを判別したと
きにのみ、該音声命令に対応した負荷の作動を指
令するようにして上記の問題点を解決することを
目的としている。
以下、本発明を図面に基づいて説明する。
第2図は本発明の一実施例を示したブロツク図
である。まず、構成を説明すると、登録スイツチ
2、指令開始スイツチ3、スイツチ入力検出回路
4、制御部5、マイクロホンよりの音声信号を周
波数帯域毎に分割する帯域フイルタ群8(図示せ
ず)よりの音声信号について各周波数帯域毎のパ
ワースペクトラムにおける特徴抽出を行つて所定
の時系列データに変換するパラメータ抽出回路9
でなる回路部は第1図に示した従来装置と同じに
なる。これに加えて本発明では、パラメータ抽出
回路9の出力に、制御部5により制御されるマル
チプレクサ20を設け、マルチプレクサ20の出
力に第1回目の音声命令による音声データF1
(X)を記憶するメモリ10aと、第2回目の音
声命令の音声データF2(X)を記憶するメモリ1
0bを設けている。
又、登録データ記憶部11には登録スイツチ2
のオン操作による登録モードにおいて操作者が発
した所定の音声命令を時系列データに変換した登
録データF0(X)が予め記憶されている。この登
録データ記憶部11に記憶されている登録データ
としては、例えば次表−1のようになる。
The present invention provides a device that commands the operation of a load corresponding to a voice command by recognizing voice commands based on registered voice data of an operator registered in advance. The present invention relates to a voice recognition device for a vehicle that can reliably recognize voice commands by instructing the operation of a voice command. Conventionally, as this type of speech recognition device, there is one shown in FIG. 1, for example. In FIG. 1, 1 is a microphone installed near the driver's seat. When using the voice recognition device, first register a predetermined voice command by the operator's voice by operating a registration switch 2. . That is, when the registration switch 2 is turned on, the switch input detection circuit 4 detects the switch operation and produces an output on the signal line 4a, and the control section 5 gives a registration mode processing command to each circuit section. In such a registration mode, a predetermined voice command, for example, a voice command "radio" specified for turning on a car radio, is transmitted to the microphone 1.
When the voice command is issued to the user, the microphone 1 converts the voice command into an electric signal, which is amplified by the voice input circuit 6. This amplified output signal is input to the voice detection circuit 7, and the start point of the voice signal becomes a time-series signal. It is detected based on the rise change in the signal level, and the control unit 5
command to start the registration process. Therefore, the audio signal from the microphone 1 is divided into predetermined frequencies by the band filter group 8, and squared or rectified to obtain the audio power spectrum in each frequency band in the parameter extractor 9, which becomes audio power information. The data is digitally converted into time-series audio data and stored in the memory 10. At this time, since the registration mode is set by operating the registration switch 2, the voice data in the memory 10 is transferred to the registration data storage section 11 and registered as reference data for performing voice recognition processing. Next, after registering the voice command, if you want to listen to the on-vehicle load, for example, the radio, turn on the command start switch 3 to give the predetermined voice command "radio" to the microphone 1. . In response to this ON operation of the command start switch 3, the switch input detection circuit 4 generates an output on the signal line 4b, and the control section 5 gives a recognition mode control command to each circuit section. The voice commands input from 1 are converted into voice data and written into the memory 10 in the same way as at the time of registration. The audio data stored in this memory 10 is
A similarity comparison processing section 12 calculates the degree of similarity between a plurality of registered data sequentially read out from the registered data storage section 11. To calculate this degree of similarity, after normalizing the time axis and normalizing the level of the audio data and the registered data, the degree of similarity is determined by performing calculations on Tievishiev distance and other distances. Become. The similarity value calculated by the similarity comparison processing section 12 is judged by the recognition word processing judgment section 13 as to whether or not the similarity value is within a predetermined threshold range.
When it is within the range, a command corresponding to the audio data having this degree of similarity is output to the drive unit 14, and the car radio is turned on. By the way, the environment in which a voice recognition device for a vehicle is used has a higher ambient noise level than that of a general voice recognition device.In particular, when the vehicle is in use with the engine started, the noise level in the passenger compartment rises, and noise is mixed in. Since these occur randomly, when a voice command is given to operate a load, there is a high proportion of noise components in the voice signal, and if a relatively large amount of noise is mixed in, the voice command may not be recognized or even worse. There was a risk that the incorrect recognition would command the operation of the wrong load. The present invention has been made by focusing on such conventional problems, and recognizes the voice command inputted following the ON operation of the command start switch based on registered voice data, and based on the recognition output, the above-mentioned voice command is recognized. In a device that commands the operation of a load in response to a voice command,
In order to ensure recognition of voice commands, the above problem is solved by instructing the operation of the load corresponding to the voice command only when it is determined that two voice commands input sequentially are the same. It is intended to. Hereinafter, the present invention will be explained based on the drawings. FIG. 2 is a block diagram showing one embodiment of the present invention. First, to explain the configuration, a registration switch 2, a command start switch 3, a switch input detection circuit 4, a control unit 5, and audio from a band filter group 8 (not shown) that divides an audio signal from a microphone into frequency bands. A parameter extraction circuit 9 that extracts features in the power spectrum of each frequency band of the signal and converts it into predetermined time series data.
The circuit section consisting of is the same as the conventional device shown in FIG. In addition, in the present invention, a multiplexer 20 controlled by the control unit 5 is provided at the output of the parameter extraction circuit 9, and the output of the multiplexer 20 receives audio data F 1 based on the first audio command.
A memory 10a that stores (X) and a memory 1 that stores voice data F 2 (X) of the second voice command.
0b is provided. In addition, the registration data storage section 11 includes a registration switch 2.
Registration data F 0 (X) is stored in advance, which is obtained by converting a predetermined voice command issued by the operator into time-series data in the registration mode by the ON operation. The registration data stored in the registration data storage section 11 is as shown in Table 1 below, for example.
【表】【table】
【表】
この表−1に示す登録データの意味するところ
は、例えばラジオを例にとると、
但し、i=1〜4のフイルタ段数
j=1〜32の時系列データ数
となる時系列データを構成するものである。な
お、上記の時系列データは帯域フイルタ群8にお
けるフイルタ段数を4段とした場合を例にとつて
いる。
類似度比較処理部12は、音声認識の為の類似
度を演算するもので、この類似度の演算としては
チエビシエフ距離の演算等が用いられる。この類
似度演算のために類似度演算器120a,120
bが設けられ、類似度演算器120aはメモリ1
0aの記憶データF1(X)と登録データ記憶部1
1の登録データF0(X)との間の類似度を、
l1(X)=|F0(X)−F1(X)|=|4
〓i=1 32
〓j=1
fO X(i、j)−4
〓i=1 32
〓j=1
f1 X(i、j)| …(1)
となるチエビシエフ距離の演算をもつて行ない、
又、類似度演算器120bはメモリ10a,10
bの音声データF1(X)、F2(X)との間の類似度
を、
l2(X)=|F1(X)−F2(X)|=4
〓i=1 32
〓j=1
f1 X(i、j)−4
〓i=1 32
〓j=1
f2 X(i、j)| …(2)
のチエビシエフ距離の演算をもつて行う。類似度
演算器120aの出力には最小値判別器122が
設けられ、類似度演算器120aで演算された複
数の類似度の値の中から最小値となる類似度を判
別して出力するようにしている。
認識語判断処理部13は、類似度比較処理部1
2で演算された類似度が所定の閾値の範囲内にあ
るかどうかを判別し、閾値の範囲内にある時に音
声命令に対応した負荷を作動するための指令を出
力する機能を有し、比較器130aによつて閾値
メモリ132aに記憶されている閾値h1と最小値
判別器122で取出された最小類似度の値を比較
し、その比較結果を判別器134に与えている。
又比較器130bには閾値メモリ132bに記憶
している閾値h2が基準値として設定され、この閾
値h2により類似度演算器120bで演算された類
似度を比較判別して判別器134に与えている。
また、判別器134は比較器130aで閾値h1以
下となる類似度が得られた時に、表示器18に対
して2回目の音声命令の入力を要求する表示を指
令し、且つ制御部5に対してマルチプレクサ20
をメモリ10b側に切換える指令を与える。又、
2回目の音声命令が入力された後に比較器130
bで閾値h2以下となる類似度が判別された時に
は、音声命令に対応した負荷の作動を指令するた
めの信号を制御部5に対して行う。
更に第2図の実施例では制御部5に対し、車両
状態検出回路15の出力が与えられており、この
車両状態検出回路15にはイグニツシヨンスイツ
チのオン操作により閉じる接点を有するイグニツ
シヨンリレー16の出力と、オルタネータ出力と
が与えられており、イグニツシヨンリレー16の
オンによる出力とオルタネータ出力とが得られた
時に車両が使用状態にあることを検出して出力
し、それ以外の時には車両が停止状態にあること
を検出して出力する。この車両状態検出回路15
の機能は車両の使用状態、すなわちエンジンが始
動されている状態での車室騒音レベルの上昇を検
知して制御部5にその旨を与えるもので、車両状
態検出回路15が車両の使用状態を検出している
時に同じ音声命令を2回入力させて認識処理する
認識モードの制御を指令するようになる。
次に、第2図の実施例の作用を第3図に示した
動作フローを参照して説明する。
今、仮に車両状態検出回路15が車両の使用状
態を検出して出力している状態で指令開始スイツ
チ3をオン操作して所定の音声命令を操作者が発
したとする。この指令開始スイツチ3のオン操作
によるスイツチ入力検出回路4の出力により、制
御部5は同じ音声命令を2回入力させて認識を行
なう認識モードとなり、マルチプレクサ20をま
ずメモリ10a側に切換えてブロツクBに示すよ
うに音声命令の入力を待つ。次いで所定の音声命
令がマイクロホンを介して入力されたとすると、
この音声命令による音声信号は、帯域フイルタ群
8で周波数分割されるとともにパラメータ抽出回
路9において、各周波数帯域毎のパワースペクト
ラムに対応した時系列データに変換され、この時
系列データの変換に際しては、時間軸での正規
化、レベルの正規化等がほどこされ、マルチプレ
クサ20を介して、メモリ10aに音声データ
F1(X)として記憶される。このようにメモリ1
0aに第1回目の音声データが記憶されると、ブ
ロツクDに示すように類似度比較処理部12の類
似度演算器120aにより第1回目の音声データ
F1(X)と登録データ記憶部11の登録データF0
(X)との間の類似度が前記第(1)式によつて演算
され、ブロツクEに示すように演算された複数の
類似度l1(X)の中から最小のものが判別されて
認識語判断処理部13の比較器130aに与えら
れる。比較器130aは、判別ブロツクFに示す
ように、閾値メモリ132aの閾値h1との比較を
行ない最小類似度l1(X)が閾値h1以下の時に判
別器134によりブロツクGに示すように表示器
18に対して2回目の音声命令の入力を要求する
表示を行なう。同時に判別器134は制御部5に
制御指令を与えて、マルチプレクサ20をメモリ
10b側に切換える。そこで操作者は表示器18
における2回目の音声命令要求表示を受けて同じ
音声命令を発したとすると、パラメータ抽出回路
9で同様に時系列データに変換された音声データ
は、マルチプレクサ20を介してメモリ10bに
音声データF2(X)として記憶される。
次いでブロツクIに示すように類似度比較処理
部12の類似度演算部120bにおいて、メモリ
10a,10bに記憶している音声データF1
(X)とF2(X)との類似度l2(X)の演算が前記
第(2)式に基づいて行なわれ、比較器130bに与
えられる。比較器130bでは、判別ブロツクJ
に示すように閾値メモリ132bの閾値h2と類似
度l2(X)との比較判別が行なわれ、閾値h2以下
の時には、判別器134はブロツクC〜判別ブロ
ツクFにおいて認識処理された負荷の作動指令、
すなわちブロツクKに示すようにXに対応した作
動指令を制御部5に与え、制御部5により図示し
ない駆動部を作動して音声命令に対応した負荷の
作動を行ない。これにより認識を終了する。
一方、判別ブロツクF、Jにおいて類似度l1
(X)又はl2(X)が閾値h1又はh2を上回つている
ことが判別された時には、ブロツクLに進んで表
示器18に対し再入力の要求表示を行ない、ブロ
ツクBの第1回目の音声命令を待つ状態に戻る。
尚、認識語判断処理部13における閾値h1、h2と
の間にはh1>h2となる関係が定められており、1
回目に対して2回目の音声命令の類似度を判別す
る閾値をきびしくし、1回目の音声命令と2回目
の音声命令とに含まれる雑音成分の割合が大きく
変わつていたような場合には、雑音成分の混入に
よる誤認識の恐れがあるので、この場合には閾値
h2を上回ることを条件に、音声命令の認識による
負荷の作動を行なわずに再度音声命令をやり直さ
せるようにし、音声命令の誤認識による誤まつた
負荷の作動を確実に防止するようにしている。
このように上記の実施例では同じ音声命令を2
回入力させて音声命令の誤認識をおこさないよう
にしているため、例えば走行中に誤作動しては、
こまるようなイグニツシヨンスイツチのオン、オ
フあるいはライトオン、オフ等についても音声命
令による作動を可能にするものである。
尚、第2図の実施例では、第1回目の音声命令
について登録データとの間で音声認識を行ない、
2回目の音声命令については、第1回目の音声命
令との類似度を判別して、同じ音声命令であるこ
とを条件に、最初に認識した音声命令に対応した
負荷の作動を指令するようにしているが、他の実
施例として、第1回目と第2回目の音声命令のそ
れぞれについて登録データに基づいた音声認識を
行ない、両方の認識出力が一致した時にのみ、こ
の音声命令に対応した負荷の作動を指令するよう
にしても良い。
又、上記の実施例では、車両の走行状態を検出
している時に、音声命令を2回入力させて認識処
理を行なうようにしているが、車両の走行又は停
止状態のいかんにかかわらず全ての車両状態につ
いて音声命令を2回入力させた認識処理を行なう
ようにしてもよい。
以上説明してきたように、本発明によれば、指
令開始スイツチのオン操作に続いて入力する音声
命令を予め記憶した登録音声データに基づいて認
識し、この認識出力に基づいて上記音声命令に対
応した負荷の作動を指令する装置において、順次
入力する2つの同じ音声命令の少くともいずれか
一方を上記音声登録データに基づいて認識し、且
つ、上記2つの音声命令が同一であることを判別
した時にのみこの音声命令に対応した負荷の作動
を指令するようにしたため、走行中のように車室
の騒音レベルが高い状態で所定の音声命令を行な
つたとしても順次行なう2つの音声命令に基づい
た認識処理が行なわれることから音声命令ととも
に雑音が混入したとしてもこの雑音成分により誤
まつた音声命令の認識が行なわれることが確実に
防止でき、そのため運転操作に不可欠な操作、例
えばイグニツシヨンスイツチのオン、オフ、ライ
トのオン、オフ等の重要な操作事項についても音
声命令による作動を可能とし、音声認識装置の信
頼性を大幅に向上することができるという効果が
得られる。[Table] The meaning of the registration data shown in Table 1 is as follows, taking radio as an example. However, the time series data is configured such that the number of filter stages is i=1 to 4 and the number of time series data is j=1 to 32. Note that the above time series data is based on an example in which the number of filter stages in the band filter group 8 is four. The similarity comparison processing unit 12 calculates the degree of similarity for speech recognition, and the calculation of the Tievishiev distance or the like is used to calculate the degree of similarity. For this similarity calculation, similarity calculation units 120a, 120
b is provided, and the similarity calculator 120a is connected to the memory 1.
0a storage data F 1 (X) and registered data storage unit 1
The similarity between registered data F 0 (X) of 1 is expressed as l 1 (X) = | F 0 (X) − F 1 (X) | = | 4 〓 i=1 32 〓 j=1 f O X (i, j) − 4 〓 i=1 32 〓 j=1 f 1
Further, the similarity calculator 120b is connected to the memories 10a and 10.
The similarity between the audio data F 1 (X) and F 2 (X) of b is expressed as l 2 (X)=|F 1 (X)−F 2 (X)|= 4 〓 i=1 32 〓 j=1 f 1 X (i, j ) − 4 〓 i=1 32 〓 j=1 f 2 A minimum value discriminator 122 is provided at the output of the similarity calculator 120a to determine and output the minimum similarity among the plurality of similarity values calculated by the similarity calculator 120a. ing. The recognition word judgment processing section 13 includes the similarity comparison processing section 1
It has a function of determining whether the similarity calculated in step 2 is within a predetermined threshold range and outputting a command to operate the load corresponding to the voice command when it is within the threshold range. The threshold value h 1 stored in the threshold value memory 132 a is compared with the minimum similarity value extracted by the minimum value discriminator 122 by the device 130 a, and the comparison result is provided to the discriminator 134 .
Further, the comparator 130b is set with a threshold value h2 stored in the threshold value memory 132b as a reference value, and the similarity calculated by the similarity calculator 120b is compared and determined using this threshold value h2 , and the result is provided to the discriminator 134. ing.
Furthermore, when the comparator 130a obtains a degree of similarity that is less than or equal to the threshold value h1 , the discriminator 134 instructs the display 18 to display a request for inputting a second voice command, and also instructs the control unit 5 to display a request for inputting a second voice command. For multiplexer 20
A command is given to switch the memory 10b to the memory 10b side. or,
After the second voice command is input, the comparator 130
When it is determined that the degree of similarity is equal to or less than the threshold value h2 in b, a signal is sent to the control unit 5 to instruct the operation of the load corresponding to the voice command. Furthermore, in the embodiment shown in FIG. 2, the output of a vehicle state detection circuit 15 is supplied to the control unit 5, and this vehicle state detection circuit 15 has an ignition switch which has a contact that closes when the ignition switch is turned on. The output of the relay 16 and the alternator output are provided, and when the output of the ignition relay 16 is turned on and the alternator output are obtained, it is detected that the vehicle is in use and is output. Sometimes it detects that the vehicle is stopped and outputs an output. This vehicle state detection circuit 15
The function is to detect an increase in the cabin noise level when the vehicle is being used, that is, when the engine is started, and to notify the controller 5 of this fact. During detection, the same voice command is input twice to command recognition mode control for recognition processing. Next, the operation of the embodiment shown in FIG. 2 will be explained with reference to the operational flow shown in FIG. Now, suppose that the operator issues a predetermined voice command by turning on the command start switch 3 while the vehicle state detection circuit 15 is detecting and outputting the usage state of the vehicle. The output of the switch input detection circuit 4 caused by the ON operation of the command start switch 3 causes the control unit 5 to enter a recognition mode in which the same voice command is input twice and recognized, and first switches the multiplexer 20 to the memory 10a side and blocks B. Wait for voice command input as shown in . Next, if a predetermined voice command is input via the microphone,
The voice signal based on this voice command is frequency-divided by a group of band filters 8 and is converted into time-series data corresponding to the power spectrum of each frequency band in a parameter extraction circuit 9. When converting this time-series data, The audio data is subjected to time axis normalization, level normalization, etc., and is stored in the memory 10a via the multiplexer 20.
It is stored as F 1 (X). Memory 1 like this
When the first audio data is stored in 0a, the similarity calculation unit 120a of the similarity comparison processing unit 12 stores the first audio data as shown in block D.
F 1 (X) and registration data F 0 in the registration data storage section 11
(X) is calculated by the above equation (1), and the minimum one is determined from among the plurality of calculated similarities l 1 (X) as shown in block E. It is applied to the comparator 130a of the recognition word judgment processing section 13. The comparator 130a performs a comparison with the threshold value h1 of the threshold value memory 132a, as shown in the discrimination block F, and when the minimum similarity l1 ( X ) is less than the threshold value h1 , the discriminator 134 makes a comparison as shown in the block G. A message is displayed on the display 18 requesting input of a second voice command. At the same time, the discriminator 134 gives a control command to the control unit 5 to switch the multiplexer 20 to the memory 10b side. Therefore, the operator
If the same voice command is issued in response to the second voice command request display, the voice data similarly converted to time series data by the parameter extraction circuit 9 is stored in the memory 10b via the multiplexer 20 as voice data F2. (X). Next, as shown in block I, the similarity calculation unit 120b of the similarity comparison processing unit 12 calculates the audio data F 1 stored in the memories 10a and 10b.
A calculation of the degree of similarity l 2 (X) between (X) and F 2 (X) is performed based on the above-mentioned equation (2), and is provided to the comparator 130b. In the comparator 130b, the discrimination block J
As shown in FIG. 3, a comparison is made between the threshold h 2 of the threshold memory 132b and the similarity l 2 (X), and when the similarity is less than the threshold h 2 , the discriminator 134 selects the load that has been recognized in blocks C to F. operating command,
That is, as shown in block K, an operation command corresponding to X is given to the control section 5, and the control section 5 operates a drive section (not shown) to operate the load in accordance with the voice command. This ends the recognition. On the other hand, in discrimination blocks F and J, the similarity l 1
(X) or l 2 (X) exceeds the threshold h 1 or h 2 , the process proceeds to block L, where a request for re-input is displayed on the display 18, and the Return to the state of waiting for the first voice command.
Note that a relationship such as h 1 > h 2 is defined between the threshold values h 1 and h 2 in the recognition word judgment processing unit 13, and 1
The threshold for determining the similarity between the second voice command and the second voice command is made stricter, and if the proportion of noise components included in the first voice command and the second voice command is significantly different, , since there is a risk of misrecognition due to the mixing of noise components, in this case the threshold
On the condition that h2 is exceeded, the voice command is restarted without activating the load due to recognition of the voice command, and the erroneous activation of the load due to erroneous recognition of the voice command is reliably prevented. There is. In this way, in the above embodiment, the same voice command can be
This system prevents erroneous recognition of voice commands by inputting multiple times, so if a malfunction occurs while driving, for example,
This makes it possible to turn on and off an ignition switch or turn on and off a light, which can be difficult to do, by voice commands. In the embodiment shown in FIG. 2, voice recognition is performed between the first voice command and the registered data,
Regarding the second voice command, the degree of similarity with the first voice command is determined, and on the condition that the voice commands are the same, the system issues a command to operate the load corresponding to the first recognized voice command. However, as another example, voice recognition is performed based on registered data for each of the first and second voice commands, and only when both recognition outputs match, the load corresponding to this voice command is It may also be possible to instruct the operation of. Furthermore, in the above embodiment, when the running state of the vehicle is detected, the voice command is input twice to perform the recognition process, but regardless of whether the vehicle is running or stopped, all A recognition process may be performed in which a voice command is input twice regarding the vehicle state. As explained above, according to the present invention, the voice command inputted following the ON operation of the command start switch is recognized based on registered voice data stored in advance, and the voice command is responded to based on the recognition output. the device for instructing the operation of a load, which recognizes at least one of two identical voice commands input sequentially based on the voice registration data, and determines that the two voice commands are the same; Since the load operation corresponding to this voice command is commanded only at certain times, even if a predetermined voice command is given in a state where the noise level in the vehicle interior is high, such as when the car is running, it will not be possible to operate the load based on the two voice commands that are executed sequentially. Even if noise is mixed in with the voice command, it is possible to reliably prevent the voice command from being misrecognized due to this noise component. Important operational items such as turning on and off switches and turning on and off lights can also be operated by voice commands, resulting in the effect that the reliability of the voice recognition device can be greatly improved.
第1図は従来装置の一例を示したブロツク図、
第2図は本発明の一実施例を示したブロツク図、
第3図は第2図の実施例の動作フロー図である。
1……マイクロホン、2……登録スイツチ、3
……指令開始スイツチ、4……スイツチ入力検出
回路、5……制御部、6……音声入力回路、7…
…音声検出回路、8……帯域フイルタ群、9……
パラメータ抽出回路、10,10a,10b……
メモリ、12……類似度比較処理部、13……認
識語判断処理部、14……駆動部、15……車両
状態検出回路、16……イグニツシヨンリレー、
18……表示器、20……マルチプレクサ、11
……登録データ記憶部、120a,120b……
類似度演算器、122……最小値判別器、130
a,130b……比較器、132a,132b…
…閾値メモリ、134……判別器。
Figure 1 is a block diagram showing an example of a conventional device.
FIG. 2 is a block diagram showing an embodiment of the present invention.
FIG. 3 is an operational flow diagram of the embodiment of FIG. 2. 1...Microphone, 2...Registration switch, 3
...Command start switch, 4...Switch input detection circuit, 5...Control unit, 6...Audio input circuit, 7...
...Audio detection circuit, 8...Band filter group, 9...
Parameter extraction circuit, 10, 10a, 10b...
Memory, 12... Similarity comparison processing section, 13... Recognized word judgment processing section, 14... Drive section, 15... Vehicle state detection circuit, 16... Ignition relay,
18...Display device, 20...Multiplexer, 11
...Registered data storage section, 120a, 120b...
Similarity calculator, 122... Minimum value discriminator, 130
a, 130b... comparator, 132a, 132b...
...Threshold value memory, 134...Discriminator.
Claims (1)
る音声命令を登録音声データに基づいて認識し、
該認識出力に基づいて音声命令に対応した負荷の
作動を指令する装置に於いて、順次入力する少な
くとも2つの音声命令のうち、少なくとも1つの
音声命令を上記登録音声データに基づいて認識
し、且つ、順次入力された各音声命令の類似度が
所定範囲内にあることを判別したときにのみ、該
音声命令に対応する負荷の作動を指令する認識手
段を設けたことを特徴とする車両用音声認識装
置。 2 前記認識手段は、1回目の音声命令による音
声データと2回目の音声命令による音声データと
の各々を記憶する記憶部と、該記憶部に記憶して
いる1回目の音声データと複数の登録音声データ
との類似度を演算し、所定の閾値以下となる類似
度に基づいて1回目の音声データを認識する認識
演算部と、上記記憶部に記憶している1回目と2
回目の音声データの類似度を演算し、該類似度が
所定の閾値以下のときに、同一音声命令と判断し
て上記認識演算部の認識出力に基づく負荷の作動
を指令する出力指令部とでなる特許請求の範囲第
1項記載の車両用音声認識装置。[Scope of Claims] 1. Recognizes a voice command input following the ON operation of a command start switch based on registered voice data,
In a device that commands the operation of a load corresponding to a voice command based on the recognition output, at least one voice command among at least two voice commands input sequentially is recognized based on the registered voice data, and , a voice for a vehicle, characterized in that a recognition means is provided that instructs the operation of a load corresponding to the voice command only when it is determined that the similarity of each voice command input sequentially is within a predetermined range. recognition device. 2. The recognition means includes a storage unit that stores each of voice data based on the first voice command and voice data based on the second voice command, and a plurality of registered voice data and the first voice data stored in the storage unit. a recognition calculation unit that calculates the degree of similarity with the voice data and recognizes the first voice data based on the degree of similarity that is equal to or less than a predetermined threshold; and the first and second voice data stored in the storage unit.
an output command unit that calculates the degree of similarity of the second voice data, and when the degree of similarity is less than a predetermined threshold value, determines that the voice commands are the same and instructs the operation of the load based on the recognition output of the recognition calculation unit; A voice recognition device for a vehicle according to claim 1.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56169177A JPS5870293A (en) | 1981-10-22 | 1981-10-22 | Voice recognition equipment for vehicle |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56169177A JPS5870293A (en) | 1981-10-22 | 1981-10-22 | Voice recognition equipment for vehicle |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5870293A JPS5870293A (en) | 1983-04-26 |
| JPS6329757B2 true JPS6329757B2 (en) | 1988-06-15 |
Family
ID=15881668
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56169177A Granted JPS5870293A (en) | 1981-10-22 | 1981-10-22 | Voice recognition equipment for vehicle |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5870293A (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58152299A (en) * | 1982-03-04 | 1983-09-09 | 三菱電機株式会社 | Voice input controller |
| JP2647063B2 (en) * | 1995-09-25 | 1997-08-27 | 井関農機株式会社 | Voice recognition device |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5651799A (en) * | 1979-10-04 | 1981-05-09 | Sanyo Electric Co | Sound signal handling system in acoustic device |
-
1981
- 1981-10-22 JP JP56169177A patent/JPS5870293A/en active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5870293A (en) | 1983-04-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS6367198B2 (en) | ||
| US11120650B2 (en) | Method and system for sending vehicle health report | |
| EP1703471B1 (en) | Automatic recognition of vehicle operation noises | |
| JP3920097B2 (en) | Voice recognition device for in-vehicle equipment | |
| US4501012A (en) | Speech recognition system for an automotive vehicle | |
| US6748301B1 (en) | Apparatus and method for prevention of driving of motor vehicle under the influence of alcohol and prevention of vehicle theft | |
| DE102017116559A1 (en) | EXTENSIBLE VEHICLE SYSTEM | |
| CN210489237U (en) | A vehicle-mounted intelligent terminal voice control system | |
| EP0094449B1 (en) | Speech recognition system for an automotive vehicle | |
| KR101176174B1 (en) | Black box for vehicle and method for recording traffic accident of the same | |
| CN112153610B (en) | Bluetooth device selection system and method | |
| CN116923423A (en) | Method and device for relieving driving fatigue | |
| JPS6329757B2 (en) | ||
| CN110211579B (en) | Voice instruction recognition method, device and system | |
| JPS59180600A (en) | Voice recognition controller to be carried on vehicle | |
| CN111192580A (en) | Method and device for actively starting ACC function of automobile through voice | |
| US10468017B2 (en) | System and method for understanding standard language and dialects | |
| JPS59180599A (en) | Voice recognition controller to be carried on vehicle | |
| CN117885522A (en) | Safety control method and device for vehicle | |
| JPH022158B2 (en) | ||
| CN106828372A (en) | Vehicle-mounted voice control system and method | |
| CN110689904A (en) | Voice recognition dangerous driving method, computer device and computer readable storage medium | |
| JPH09127979A (en) | Vehicle voice recognition device | |
| JP2000356160A (en) | Method and apparatus for automatically identifying the equipment state of a vehicle | |
| CN111376857A (en) | Vehicle control method, device, electronic equipment and computer storage medium |