JPS6232798B2 - - Google Patents
Info
- Publication number
- JPS6232798B2 JPS6232798B2 JP55012203A JP1220380A JPS6232798B2 JP S6232798 B2 JPS6232798 B2 JP S6232798B2 JP 55012203 A JP55012203 A JP 55012203A JP 1220380 A JP1220380 A JP 1220380A JP S6232798 B2 JPS6232798 B2 JP S6232798B2
- Authority
- JP
- Japan
- Prior art keywords
- standard pattern
- random number
- pattern
- standard
- address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000000605 extraction Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 2
- 238000000034 method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Description
【発明の詳細な説明】
本発明はパタンマツチング法を用いた音声入力
装置の改良に関する。
装置の改良に関する。
従来、あらかじめ発声した音声を標準パタンと
して登録しておき、あらたに発声された音声と前
記標準パタンとの間でパタンマツチングを行ない
音声を認識する技術は実用化されている(参照、
情報処理学会研究会資料MMS23−2、1976年1
月20日「DPを用いた連続音声認識システム」以
下引用文献(1)と称す)。
して登録しておき、あらたに発声された音声と前
記標準パタンとの間でパタンマツチングを行ない
音声を認識する技術は実用化されている(参照、
情報処理学会研究会資料MMS23−2、1976年1
月20日「DPを用いた連続音声認識システム」以
下引用文献(1)と称す)。
このような装置においては、あらかじめ発声さ
れた音声を標準パタンとして登録しておく必要が
ある。この際、従来はあらかじめ定められた単語
辞書にしたがつて定められた順序により標準パタ
ンを登録した。登録する単語として数字やアルフ
アベツトなどを用いる場合これらは1、2、3、
……や、A、B、C、……のような順序で発声す
るのが普通であり容易である。しかしこの場合区
切つて発声したとしてもある一定のイントネーシ
ヨンが付くことや、となり合つた2単語の前後の
声韻が連続して変化するおそれがある。このため
一語一語独立して発声した場合と異なる標準パタ
ンが登録されるおそれがある。
れた音声を標準パタンとして登録しておく必要が
ある。この際、従来はあらかじめ定められた単語
辞書にしたがつて定められた順序により標準パタ
ンを登録した。登録する単語として数字やアルフ
アベツトなどを用いる場合これらは1、2、3、
……や、A、B、C、……のような順序で発声す
るのが普通であり容易である。しかしこの場合区
切つて発声したとしてもある一定のイントネーシ
ヨンが付くことや、となり合つた2単語の前後の
声韻が連続して変化するおそれがある。このため
一語一語独立して発声した場合と異なる標準パタ
ンが登録されるおそれがある。
また一般に音声入力装置への標準パタンの登録
はたとえば1日1回というように繰り返し行なわ
れる。このとき単語辞書の順序で発声が慣れてし
まうと一般の単語に関しても数字やアルフアベツ
トと同様に一語一語独立して発声した場合と異な
るある一定の癖のついたパタンが標準パタンとし
て登録されるおそれがある。また発声者が標準パ
タン登録の順序に慣れて次に発声する語を覚える
と単語の発声が不正確になるおそれがある。
はたとえば1日1回というように繰り返し行なわ
れる。このとき単語辞書の順序で発声が慣れてし
まうと一般の単語に関しても数字やアルフアベツ
トと同様に一語一語独立して発声した場合と異な
るある一定の癖のついたパタンが標準パタンとし
て登録されるおそれがある。また発声者が標準パ
タン登録の順序に慣れて次に発声する語を覚える
と単語の発声が不正確になるおそれがある。
本発明の目的は、このようなパタンマツチング
法を用いた音声入力装置の標準パタン登録時に起
こる発生順序による癖のついた発声や不正確な発
声の発生を防ぎ、信頼できる標準パタンを得るこ
とにある。
法を用いた音声入力装置の標準パタン登録時に起
こる発生順序による癖のついた発声や不正確な発
声の発生を防ぎ、信頼できる標準パタンを得るこ
とにある。
その目的を達成するため本発明の音声入力装置
は、発声された音声より特徴を抽出してパタン化
する特徴抽出部と、該パタンを標準パタンとして
登録する標準パタン登録部と、新たに入力された
音声より前記特徴抽出部においてパタン化された
入力パタンと前記標準パタンの間の類似度を求め
る類似度計算部と、該類似度をもとに認識結果を
求める結果出力部と、前記標準パタンを標準パタ
ン登録部へ登録する際にランダムな順序を与える
乱数発生部を備えて成ることを特徴とするもので
ある。
は、発声された音声より特徴を抽出してパタン化
する特徴抽出部と、該パタンを標準パタンとして
登録する標準パタン登録部と、新たに入力された
音声より前記特徴抽出部においてパタン化された
入力パタンと前記標準パタンの間の類似度を求め
る類似度計算部と、該類似度をもとに認識結果を
求める結果出力部と、前記標準パタンを標準パタ
ン登録部へ登録する際にランダムな順序を与える
乱数発生部を備えて成ることを特徴とするもので
ある。
以下実施例について詳細に説明する。
第1図はパタンマツチング法を用いた音声入力
装置の構成図である。図において、1はマイクロ
ホン、2は特徴抽出部、3は標準パタン登録部、
4は類似度計算部、5は結果出力部、6はモード
切り替えスイツチである。マイクロホン1より入
力された音声信号WVは特徴抽出部2によりパタ
ン化され音声パタンPとなる。パタンマツチング
法を用いた音声入力装置においてはその動作は標
準パタン登録モードと認識モードの2つに分けら
れる。まず標準パタン登録モードにおいてはモー
ド切り替えスイツチ6は登録モードTRにセツト
される。このとき入力された音声パタンPは標準
パタンとして標準パタン登録部3に登録される。
また認識モードにおいてはモード切替えスイツチ
6は認識モードOPにセツトされ入力された音声
パタンPは類似度計算部4において標準パタン登
録部3から出力された標準パタンRPとの間の類
似度Sが計算され出力される。この類似度Sをも
とに結果出力部5において認識結果Rが出力され
る。以上はパタンマツチング法を用いた音声入力
装置の動作であり、たとえば文献(1)に示したよう
な装置も同様の動作をする。本発明の特徴となる
部分は上記の標準パタン登録モードにおける動作
であつて認識モードにおける動作すなわちパタン
マツチングの方法には限定されない。そこで標準
パタン登録モードの動作に関してさらに詳しく述
べる。
装置の構成図である。図において、1はマイクロ
ホン、2は特徴抽出部、3は標準パタン登録部、
4は類似度計算部、5は結果出力部、6はモード
切り替えスイツチである。マイクロホン1より入
力された音声信号WVは特徴抽出部2によりパタ
ン化され音声パタンPとなる。パタンマツチング
法を用いた音声入力装置においてはその動作は標
準パタン登録モードと認識モードの2つに分けら
れる。まず標準パタン登録モードにおいてはモー
ド切り替えスイツチ6は登録モードTRにセツト
される。このとき入力された音声パタンPは標準
パタンとして標準パタン登録部3に登録される。
また認識モードにおいてはモード切替えスイツチ
6は認識モードOPにセツトされ入力された音声
パタンPは類似度計算部4において標準パタン登
録部3から出力された標準パタンRPとの間の類
似度Sが計算され出力される。この類似度Sをも
とに結果出力部5において認識結果Rが出力され
る。以上はパタンマツチング法を用いた音声入力
装置の動作であり、たとえば文献(1)に示したよう
な装置も同様の動作をする。本発明の特徴となる
部分は上記の標準パタン登録モードにおける動作
であつて認識モードにおける動作すなわちパタン
マツチングの方法には限定されない。そこで標準
パタン登録モードの動作に関してさらに詳しく述
べる。
第2図は標準パタン登録時に必要である部分構
成であり、第1図における点線で囲まれた部分を
ぬき出したものである。図において、11は乱数
発生部、12は単語辞書、13はデイスプレイ、
14は標準パタンメモリである。なお、マイクロ
ホン1、特徴抽出部2、第2図において点線で囲
まれた部分の標準パタン登録部3は第1図と同じ
ものであり、モード切り替えスイツチ6は省略し
てある。まずN個の単語の標準パタンを登録する
場合、単語辞書12にN個の単語名をあらかじめ
セツトしておく。この単語名は乱数発生部11か
らのアドレス信号ADにしたがつてデイスプレイ
13に表示される。発声者はこのデイスプレイ1
3に表示された単語名を読んでマイクロホン1に
発声する。発声された音声は特徴抽出部2でパタ
ン化された後標準パタンメモリ14に記憶され
る。この際単語辞書12に与えられたものと同一
のアドレス信号ADにより示された標準パタンメ
モリ14内の領域に記憶される。これにより単語
名に対応する標準パタンが登録される。音声が入
力し終わると音声検出信号SDが出され、これに
よつて乱数発生部11より次のアドレス信号AD
が出力される。乱数発生部11は1からNまでの
数をアドレス信号ADとして出力し、音声検出信
号SDによりアドレス信号ADは次の数に替わる。
すなわち1からNまでの数をランダムな並べ替え
を行なつた数を出力する。このランダムな並べ替
えを行なう方法の一例を示す。第3図は乱数発生
部11の構成例を示し、31はアドレスカウン
タ、32はNビツトで1ビツトづつアクセス可能
のアドレスフラグメモリ、33は乱数カウンタ、
34は乱数発生器、35は乱数最大値レジスタで
ある。まず最初にアドレスフラグメモリ32の内
容にすべて1がセツトされ、乱数最大値レジスタ
35にはNがセツトされる。乱数発生器34では
乱数最大値レジスタ35にセツトされた値以下の
乱数を発生する。乱数発生方法としてはM系列を
用いる方法など多数あるが、発声する時間間隔を
カウントしたものを乱数として用いる方法もあ
る。
成であり、第1図における点線で囲まれた部分を
ぬき出したものである。図において、11は乱数
発生部、12は単語辞書、13はデイスプレイ、
14は標準パタンメモリである。なお、マイクロ
ホン1、特徴抽出部2、第2図において点線で囲
まれた部分の標準パタン登録部3は第1図と同じ
ものであり、モード切り替えスイツチ6は省略し
てある。まずN個の単語の標準パタンを登録する
場合、単語辞書12にN個の単語名をあらかじめ
セツトしておく。この単語名は乱数発生部11か
らのアドレス信号ADにしたがつてデイスプレイ
13に表示される。発声者はこのデイスプレイ1
3に表示された単語名を読んでマイクロホン1に
発声する。発声された音声は特徴抽出部2でパタ
ン化された後標準パタンメモリ14に記憶され
る。この際単語辞書12に与えられたものと同一
のアドレス信号ADにより示された標準パタンメ
モリ14内の領域に記憶される。これにより単語
名に対応する標準パタンが登録される。音声が入
力し終わると音声検出信号SDが出され、これに
よつて乱数発生部11より次のアドレス信号AD
が出力される。乱数発生部11は1からNまでの
数をアドレス信号ADとして出力し、音声検出信
号SDによりアドレス信号ADは次の数に替わる。
すなわち1からNまでの数をランダムな並べ替え
を行なつた数を出力する。このランダムな並べ替
えを行なう方法の一例を示す。第3図は乱数発生
部11の構成例を示し、31はアドレスカウン
タ、32はNビツトで1ビツトづつアクセス可能
のアドレスフラグメモリ、33は乱数カウンタ、
34は乱数発生器、35は乱数最大値レジスタで
ある。まず最初にアドレスフラグメモリ32の内
容にすべて1がセツトされ、乱数最大値レジスタ
35にはNがセツトされる。乱数発生器34では
乱数最大値レジスタ35にセツトされた値以下の
乱数を発生する。乱数発生方法としてはM系列を
用いる方法など多数あるが、発声する時間間隔を
カウントしたものを乱数として用いる方法もあ
る。
アドレス出力信号SDによつてアドレスカウン
タ31はリセツトされ乱数発生器34から発生さ
れた乱数は乱数カウンタ33にセツトされる。つ
づいてアドレスカウンタ31がクロツク信号
CLKによつてカウントアツプされる。アドレス
カウタ31からのアドレス信号によつてアドレス
フラグメモリ32からデータRが読み出されこの
値が1の場合は乱数カウンタ33がカウントダウ
ンされる。これが繰り返されて乱数カウンタ33
が0になるとゼロ信号ZFが出され、これによつ
てアドレスカウンタ31からのアドレス信号が単
語辞書部12と標準パタンメモリ14に出力され
る。同時にアドレスカウンタ31へのクロツク信
号CLKがマスクされアドレスフラグメモリ32
の現在のアドレス指定されている部分に0が書き
こまれる。また同時に乱数最大値レジスタ35が
1だけ引かれてN−1となる。そして再び乱数発
生器34より最大値がN−1の乱数が発生され
る。つづいてアドレス出力信号SDが入力される
と以上の動作を繰り返す。これによつてアドレス
出力信号SDが入力されるたびにアドレス信号AD
として1からNまでの数をランダムに並べ替えた
ものが出力される。以上が乱数発生部11の動作
例である。この他にもさまざまな方法が考えられ
るが、本発明はこのランダムな並べ替えを行なう
方法に限定されるものではない。
タ31はリセツトされ乱数発生器34から発生さ
れた乱数は乱数カウンタ33にセツトされる。つ
づいてアドレスカウンタ31がクロツク信号
CLKによつてカウントアツプされる。アドレス
カウタ31からのアドレス信号によつてアドレス
フラグメモリ32からデータRが読み出されこの
値が1の場合は乱数カウンタ33がカウントダウ
ンされる。これが繰り返されて乱数カウンタ33
が0になるとゼロ信号ZFが出され、これによつ
てアドレスカウンタ31からのアドレス信号が単
語辞書部12と標準パタンメモリ14に出力され
る。同時にアドレスカウンタ31へのクロツク信
号CLKがマスクされアドレスフラグメモリ32
の現在のアドレス指定されている部分に0が書き
こまれる。また同時に乱数最大値レジスタ35が
1だけ引かれてN−1となる。そして再び乱数発
生器34より最大値がN−1の乱数が発生され
る。つづいてアドレス出力信号SDが入力される
と以上の動作を繰り返す。これによつてアドレス
出力信号SDが入力されるたびにアドレス信号AD
として1からNまでの数をランダムに並べ替えた
ものが出力される。以上が乱数発生部11の動作
例である。この他にもさまざまな方法が考えられ
るが、本発明はこのランダムな並べ替えを行なう
方法に限定されるものではない。
本発明の要点は標準パタン登録時に毎回異なる
ランダムな順序で登録することにあり実施例に限
定されるものではない。たとえばデイスプレイ1
3に表示される単語名は音声により出力されるも
のであつてもよいし、乱数発生部11に入力され
るアドレス出力信号は別のキーによつて入力され
るものであつてもよい。
ランダムな順序で登録することにあり実施例に限
定されるものではない。たとえばデイスプレイ1
3に表示される単語名は音声により出力されるも
のであつてもよいし、乱数発生部11に入力され
るアドレス出力信号は別のキーによつて入力され
るものであつてもよい。
本発明の音声入力装置によれば、標準パタン登
録時に毎回異なつた順序で登録することになるの
で一定の順序による癖がつきにくく、独立して発
声したときの条件に近くなる。また発声時に若干
の注意が必要なため発声も正確になる。
録時に毎回異なつた順序で登録することになるの
で一定の順序による癖がつきにくく、独立して発
声したときの条件に近くなる。また発声時に若干
の注意が必要なため発声も正確になる。
第1図はパタンマツチング法を用いた音声入力
装置の構成図、第2図は本発明の実施例における
標準パタン登録部の構成図、第3図は乱数発生部
の構成図である。 図中、1はマイクロホン、2は特徴抽出部、3
は標準パタン登録部、4は類似度計算部、5は結
果出力部、6はモード切り替えスイツチ、11は
乱数発生部、12は単語辞書、13はデイスプレ
イ、14は標準パタンメモリ、31はアドレスカ
ウンタ、32はアドレスフラグメモリ、33は乱
数カウンタ、34は乱数発生器、35は乱数最大
値レジスタをそれぞれ示す。
装置の構成図、第2図は本発明の実施例における
標準パタン登録部の構成図、第3図は乱数発生部
の構成図である。 図中、1はマイクロホン、2は特徴抽出部、3
は標準パタン登録部、4は類似度計算部、5は結
果出力部、6はモード切り替えスイツチ、11は
乱数発生部、12は単語辞書、13はデイスプレ
イ、14は標準パタンメモリ、31はアドレスカ
ウンタ、32はアドレスフラグメモリ、33は乱
数カウンタ、34は乱数発生器、35は乱数最大
値レジスタをそれぞれ示す。
Claims (1)
- 1 発声された音声より特徴を抽出してパタン化
する特徴抽出部と、該パタンを標準パタンとして
登録する標準パタン登録部と、新たに入力された
音声より前記特徴抽出部においてパタン化された
入力パタンと前記標準パタンの間の類似度を求め
る類似度計算部と、該類似度をもとに認識結果を
求める結果出力部と、前記標準パタンを標準パタ
ン登録部へ登録する際にランダムな順序を与える
乱数発生部を備えて成ることを特徴とする音声入
力装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1220380A JPS56109399A (en) | 1980-02-04 | 1980-02-04 | Voice input device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1220380A JPS56109399A (en) | 1980-02-04 | 1980-02-04 | Voice input device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS56109399A JPS56109399A (en) | 1981-08-29 |
| JPS6232798B2 true JPS6232798B2 (ja) | 1987-07-16 |
Family
ID=11798835
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1220380A Granted JPS56109399A (en) | 1980-02-04 | 1980-02-04 | Voice input device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS56109399A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5888796A (ja) * | 1981-11-20 | 1983-05-26 | 三洋電機株式会社 | 音声認識装置 |
-
1980
- 1980-02-04 JP JP1220380A patent/JPS56109399A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS56109399A (en) | 1981-08-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111951779B (zh) | 语音合成的前端处理方法及相关设备 | |
| US5524169A (en) | Method and system for location-specific speech recognition | |
| US3632887A (en) | Printed data to speech synthesizer using phoneme-pair comparison | |
| GB2296349A (en) | Maintaining order of input data events | |
| JPS64720B2 (ja) | ||
| De Mori | A descriptive technique for automatic speech recognition | |
| JPS6232798B2 (ja) | ||
| JPH0795240B2 (ja) | 個人音声パタ−ン入りカ−ドシステム | |
| JPH0634188B2 (ja) | 情報処理方法 | |
| KR930014265A (ko) | 음성인식 기기의 음성등록 및 인식방법 | |
| JPH0437995B2 (ja) | ||
| JPS5950076B2 (ja) | 音声出力機器 | |
| JP2000305595A (ja) | 音声認識装置 | |
| JPS62262099A (ja) | 発音辞書更新装置 | |
| JPS60115993A (ja) | 単音節音声認識装置 | |
| JPS60164800A (ja) | 音声認識装置 | |
| JPS58186836A (ja) | 音声入力デ−タ処理装置 | |
| JPH0731508B2 (ja) | 音声認識応答装置 | |
| JPH04291399A (ja) | 音声認識方法 | |
| UA140317U (uk) | Cпосіб розпізнавання голосової інформації у реальному часі | |
| KR100317215B1 (ko) | Plu를 이용한 화자독립/어휘독립 음성모델 등록장치 및그 방법 | |
| JPS60173667A (ja) | 電子機器 | |
| JPH036698A (ja) | 入力金額音声発生金銭登録機 | |
| JPS6242200A (ja) | 音声認識装置 | |
| JPS5949594B2 (ja) | 音声出力機器 |