JPS6232798B2

JPS6232798B2 -

Info

Publication number: JPS6232798B2
Application number: JP55012203A
Authority: JP
Inventors: Kazunaga Yoshida; Hiroaki Sekoe
Original assignee: Nippon Electric Co Ltd
Current assignee: NEC Corp
Priority date: 1980-02-04
Filing date: 1980-02-04
Publication date: 1987-07-16
Also published as: JPS56109399A

Description

【発明の詳細な説明】本発明はパタンマツチング法を用いた音声入力
装置の改良に関する。

従来、あらかじめ発声した音声を標準パタンと
して登録しておき、あらたに発声された音声と前
記標準パタンとの間でパタンマツチングを行ない
音声を認識する技術は実用化されている（参照、
情報処理学会研究会資料MMS23−２、1976年１
月20日「DPを用いた連続音声認識システム」以
下引用文献(1)と称す）。

このような装置においては、あらかじめ発声さ
れた音声を標準パタンとして登録しておく必要が
ある。この際、従来はあらかじめ定められた単語
辞書にしたがつて定められた順序により標準パタ
ンを登録した。登録する単語として数字やアルフ
アベツトなどを用いる場合これらは１、２、３、
……や、Ａ、Ｂ、Ｃ、……のような順序で発声す
るのが普通であり容易である。しかしこの場合区
切つて発声したとしてもある一定のイントネーシ
ヨンが付くことや、となり合つた２単語の前後の
声韻が連続して変化するおそれがある。このため
一語一語独立して発声した場合と異なる標準パタ
ンが登録されるおそれがある。

また一般に音声入力装置への標準パタンの登録
はたとえば１日１回というように繰り返し行なわ
れる。このとき単語辞書の順序で発声が慣れてし
まうと一般の単語に関しても数字やアルフアベツ
トと同様に一語一語独立して発声した場合と異な
るある一定の癖のついたパタンが標準パタンとし
て登録されるおそれがある。また発声者が標準パ
タン登録の順序に慣れて次に発声する語を覚える
と単語の発声が不正確になるおそれがある。

本発明の目的は、このようなパタンマツチング
法を用いた音声入力装置の標準パタン登録時に起
こる発生順序による癖のついた発声や不正確な発
声の発生を防ぎ、信頼できる標準パタンを得るこ
とにある。

その目的を達成するため本発明の音声入力装置
は、発声された音声より特徴を抽出してパタン化
する特徴抽出部と、該パタンを標準パタンとして
登録する標準パタン登録部と、新たに入力された
音声より前記特徴抽出部においてパタン化された
入力パタンと前記標準パタンの間の類似度を求め
る類似度計算部と、該類似度をもとに認識結果を
求める結果出力部と、前記標準パタンを標準パタ
ン登録部へ登録する際にランダムな順序を与える
乱数発生部を備えて成ることを特徴とするもので
ある。

以下実施例について詳細に説明する。

第１図はパタンマツチング法を用いた音声入力
装置の構成図である。図において、１はマイクロ
ホン、２は特徴抽出部、３は標準パタン登録部、
４は類似度計算部、５は結果出力部、６はモード
切り替えスイツチである。マイクロホン１より入
力された音声信号WVは特徴抽出部２によりパタ
ン化され音声パタンＰとなる。パタンマツチング
法を用いた音声入力装置においてはその動作は標
準パタン登録モードと認識モードの２つに分けら
れる。まず標準パタン登録モードにおいてはモー
ド切り替えスイツチ６は登録モードTRにセツト
される。このとき入力された音声パタンＰは標準
パタンとして標準パタン登録部３に登録される。
また認識モードにおいてはモード切替えスイツチ
６は認識モードOPにセツトされ入力された音声
パタンＰは類似度計算部４において標準パタン登
録部３から出力された標準パタンRPとの間の類
似度Ｓが計算され出力される。この類似度Ｓをも
とに結果出力部５において認識結果Ｒが出力され
る。以上はパタンマツチング法を用いた音声入力
装置の動作であり、たとえば文献(1)に示したよう
な装置も同様の動作をする。本発明の特徴となる
部分は上記の標準パタン登録モードにおける動作
であつて認識モードにおける動作すなわちパタン
マツチングの方法には限定されない。そこで標準
パタン登録モードの動作に関してさらに詳しく述
べる。

第２図は標準パタン登録時に必要である部分構
成であり、第１図における点線で囲まれた部分を
ぬき出したものである。図において、１１は乱数
発生部、１２は単語辞書、１３はデイスプレイ、
１４は標準パタンメモリである。なお、マイクロ
ホン１、特徴抽出部２、第２図において点線で囲
まれた部分の標準パタン登録部３は第１図と同じ
ものであり、モード切り替えスイツチ６は省略し
てある。まずＮ個の単語の標準パタンを登録する
場合、単語辞書１２にＮ個の単語名をあらかじめ
セツトしておく。この単語名は乱数発生部１１か
らのアドレス信号ADにしたがつてデイスプレイ
１３に表示される。発声者はこのデイスプレイ１
３に表示された単語名を読んでマイクロホン１に
発声する。発声された音声は特徴抽出部２でパタ
ン化された後標準パタンメモリ１４に記憶され
る。この際単語辞書１２に与えられたものと同一
のアドレス信号ADにより示された標準パタンメ
モリ１４内の領域に記憶される。これにより単語
名に対応する標準パタンが登録される。音声が入
力し終わると音声検出信号SDが出され、これに
よつて乱数発生部１１より次のアドレス信号AD
が出力される。乱数発生部１１は１からＮまでの
数をアドレス信号ADとして出力し、音声検出信
号SDによりアドレス信号ADは次の数に替わる。
すなわち１からＮまでの数をランダムな並べ替え
を行なつた数を出力する。このランダムな並べ替
えを行なう方法の一例を示す。第３図は乱数発生
部１１の構成例を示し、３１はアドレスカウン
タ、３２はＮビツトで１ビツトづつアクセス可能
のアドレスフラグメモリ、３３は乱数カウンタ、
３４は乱数発生器、３５は乱数最大値レジスタで
ある。まず最初にアドレスフラグメモリ３２の内
容にすべて１がセツトされ、乱数最大値レジスタ
３５にはＮがセツトされる。乱数発生器３４では
乱数最大値レジスタ３５にセツトされた値以下の
乱数を発生する。乱数発生方法としてはＭ系列を
用いる方法など多数あるが、発声する時間間隔を
カウントしたものを乱数として用いる方法もあ
る。

アドレス出力信号SDによつてアドレスカウン
タ３１はリセツトされ乱数発生器３４から発生さ
れた乱数は乱数カウンタ３３にセツトされる。つ
づいてアドレスカウンタ３１がクロツク信号
CLKによつてカウントアツプされる。アドレス
カウタ３１からのアドレス信号によつてアドレス
フラグメモリ３２からデータＲが読み出されこの
値が１の場合は乱数カウンタ３３がカウントダウ
ンされる。これが繰り返されて乱数カウンタ３３
が０になるとゼロ信号ZFが出され、これによつ
てアドレスカウンタ３１からのアドレス信号が単
語辞書部１２と標準パタンメモリ１４に出力され
る。同時にアドレスカウンタ３１へのクロツク信
号CLKがマスクされアドレスフラグメモリ３２
の現在のアドレス指定されている部分に０が書き
こまれる。また同時に乱数最大値レジスタ３５が
１だけ引かれてＮ−１となる。そして再び乱数発
生器３４より最大値がＮ−１の乱数が発生され
る。つづいてアドレス出力信号SDが入力される
と以上の動作を繰り返す。これによつてアドレス
出力信号SDが入力されるたびにアドレス信号AD
として１からＮまでの数をランダムに並べ替えた
ものが出力される。以上が乱数発生部１１の動作
例である。この他にもさまざまな方法が考えられ
るが、本発明はこのランダムな並べ替えを行なう
方法に限定されるものではない。

本発明の要点は標準パタン登録時に毎回異なる
ランダムな順序で登録することにあり実施例に限
定されるものではない。たとえばデイスプレイ１
３に表示される単語名は音声により出力されるも
のであつてもよいし、乱数発生部１１に入力され
るアドレス出力信号は別のキーによつて入力され
るものであつてもよい。

本発明の音声入力装置によれば、標準パタン登
録時に毎回異なつた順序で登録することになるの
で一定の順序による癖がつきにくく、独立して発
声したときの条件に近くなる。また発声時に若干
の注意が必要なため発声も正確になる。

【図面の簡単な説明】

第１図はパタンマツチング法を用いた音声入力
装置の構成図、第２図は本発明の実施例における
標準パタン登録部の構成図、第３図は乱数発生部
の構成図である。図中、１はマイクロホン、２は特徴抽出部、３
は標準パタン登録部、４は類似度計算部、５は結
果出力部、６はモード切り替えスイツチ、１１は
乱数発生部、１２は単語辞書、１３はデイスプレ
イ、１４は標準パタンメモリ、３１はアドレスカ
ウンタ、３２はアドレスフラグメモリ、３３は乱
数カウンタ、３４は乱数発生器、３５は乱数最大
値レジスタをそれぞれ示す。

Claims

【特許請求の範囲】

１発声された音声より特徴を抽出してパタン化
する特徴抽出部と、該パタンを標準パタンとして
登録する標準パタン登録部と、新たに入力された
音声より前記特徴抽出部においてパタン化された
入力パタンと前記標準パタンの間の類似度を求め
る類似度計算部と、該類似度をもとに認識結果を
求める結果出力部と、前記標準パタンを標準パタ
ン登録部へ登録する際にランダムな順序を与える
乱数発生部を備えて成ることを特徴とする音声入
力装置。