Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JPH0574838B2 - - Google Patents
[go: Go Back, main page]

JPH0574838B2 - - Google Patents

Info

Publication number
JPH0574838B2
JPH0574838B2 JP59147189A JP14718984A JPH0574838B2 JP H0574838 B2 JPH0574838 B2 JP H0574838B2 JP 59147189 A JP59147189 A JP 59147189A JP 14718984 A JP14718984 A JP 14718984A JP H0574838 B2 JPH0574838 B2 JP H0574838B2
Authority
JP
Japan
Prior art keywords
word
words
distance
syllables
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59147189A
Other languages
English (en)
Other versions
JPS6126095A (ja
Inventor
Yuriko Ishigaki
Yasuo Sato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP14718984A priority Critical patent/JPS6126095A/ja
Publication of JPS6126095A publication Critical patent/JPS6126095A/ja
Publication of JPH0574838B2 publication Critical patent/JPH0574838B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】
〔産業上の利用分野〕 本発明は、単語間距離の自動算出方法に関し、
音声認識装置の認識対対象語セツトの適否を事前
評価するのに用いて有効なものである。 〔従来の技術〕 音声認識装置には音声入力してよい単語群(認
識対象単語セツトという)を予め定めておくもの
があるが、かゝる音声認識装置の入力単語の認識
率を向上させるには該単語セツトに似ている発音
(読み)のものがないようにしておくことが重要
である。単語セツトに含まれる単語それ自体は装
置使用目的により定まり、変更しにくいことが予
想されるが、単語の読みは変えても格別支障ない
から、単語セツト中の各単語の読みは紛らわしい
ものがないように選定しておくのがよい。 紛らわしいか否かは、簡単に分るものもある。
例えば数字の「7」は「しち」とも「なな」とも
読めるが、これを「しち」と発音すると数字の
「1」即ち「いち」と紛らわしく、両者は誤認識
され易い。そこで「7」は「なな」と発音するよ
うにすれば「いち」との区別が明瞭になり、これ
は経験的にも知られている。しかし音声認識対象
の単語の数が増加するにつれて、紛らわしいのは
どれとどれか簡単には分らなくなり、また紛らわ
しいものを見つけてその一方を他の読みに代える
と今度は他の単語と紛らわしくなるという問題も
ある。そこで音声認識対象の単語セツトは、2様
3様の読みがある単語については適当な1つを選
んで該単語セツトの読みを固定し、それで実際に
音声認識してみて誤認識が生じるか否かをテスト
し、誤認識が生じれば該当単語を他の読みに代え
て再びテストし、といつたカツトアンドトライの
方法をとつて適当な単語セツトを求めている。し
かしこの方法では時間的、労力的負担が非常に大
きい。 そこで実際に音声認識テストをするのではな
く、事前に、まだ文字の段階で、単語セツトの各
単語の読みの適否をチエツクするのが有効であ
る。そして紛らわしいという問題は単語セツト中
の任意の2つの単語間で発生することを考える
と、単語セツト中の全単語につき残りの全単語と
の紛らわしさの程度を全て調べ上げ、誤認識の恐
れがある単語対(の読み)があればその単語セツ
トは不採用とする、のが有効である。単語間の類
似、非類似度を数値で表わすものに単語間距離が
ある。 DPマツチング方法(Velichko et al.Int.J.
Man−Machine Studies、vol.2、p223、1970)
ではこの単語間距離を文字列相互間の距離として
求める。簡単には2つの単語の各音節間のローカ
ル距離を累積しこれらの音節には種々の組合せが
考えられ組合せが異なれば累積値も異なるが、そ
の中の最小値を単語間距離とするものである。 〔発明が解決しようとする問題点〕 しかしながらこのDP法は、各単語の音節数を
反映したものではない。例えば音節数2の単語A
と音節数3の単語Bとの距離が、音節数2の単語
Cと音節数2の単語Dとの距離に等しいという結
果が得られたとすると、単語A,Bの組の単語
C,Dの組の誤認識率は同じであるとされるが、
経験的に言つても音節数の異なる組A,Bの認識
率は文字数の等しい組C,Dの認識率より高いは
ずである。この点が、従来のDPマツチング法に
よる距離計算では反映されていない。 本発明は、上述したDP法の不十分さを補い、
認識対象単語の事前評価をより実用性の高いもの
にしようとするものである。 〔問題点を解決するための手段〕 本発明は、音声認識対象の単語セツトの各単語
間の距離を算出する方法において、各単語を個々
の音節に分解するステツプと、音節数Mの単語と
音節数Nの単語との距離をDPマツチング法で求
めるステツプと、得られた距離に、2つの単語
が同じ音節数を持てば、そうでない場合よりも距
離は小さい、2つの単語が同じ単語長さを持つ
場合には、DP法で求められた終点までの距離を
単語長で割つたものを正規化された距離とする、
距離は2つの距離について常に対称である、の
3条件を満足させる修正を施す正規化定数を乗じ
て単語間距離を求めるステツプを有することを特
徴とするものである。次に実施例を参照しながら
構成及び作用を詳細に説明する。 〔実施例〕 第1図はかな表記された2つの単語A,Bを処
理ブロツク1,2で音節に分解し、処理ブロツク
3でその単語間距離をDP法により求めるシステ
ムの概略図である。4は音節に分解する際に使用
するかなと音節の対応表、5は距離を求める際に
使用する音素距離マトリクスである。 単語A,Bのかな表記は50音(46音)、濁音、
鼻濁音、半濁音、促音、撥音、拗音、外来語の
“スイ”、“テイ”などと、これらの長音のうちの
任意の1つ又は複数の組合せからなる。また処理
ブロツク1,2により分割される音節は子音+母
音からなり、母音はa、i、u、……等、子音は
s、k、t、……等からなる。かなのローマ字表
記表の一部を次に示す。
【表】 あ

Claims (1)

  1. 【特許請求の範囲】 1 音声認識対象の単語セツトの各単語間の距離
    を算出する方法において、 各単語を個々の音節に分解するステツプと、 音節数Mの単語と音節数Nの単語との距離を
    DPマツチング法で求めるステツプと、 得られた距離に、2つの単語が同じ音節数を
    持てば、そうでない場合よりも距離は小さい、
    2つの単語が同じ単語長さを持つ場合には、DP
    法で求められた終点までの距離を単語長で割つた
    ものを正規化された距離とする、距離は2つの
    距離について常に対称である、の3条件を満足さ
    せる修正を施す正規化定数を乗じて単語間距離を
    求めるステツプを有することを特徴とする単語間
    距離の自動算出方法。
JP14718984A 1984-07-16 1984-07-16 単語間距離の自動算出方法 Granted JPS6126095A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14718984A JPS6126095A (ja) 1984-07-16 1984-07-16 単語間距離の自動算出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14718984A JPS6126095A (ja) 1984-07-16 1984-07-16 単語間距離の自動算出方法

Publications (2)

Publication Number Publication Date
JPS6126095A JPS6126095A (ja) 1986-02-05
JPH0574838B2 true JPH0574838B2 (ja) 1993-10-19

Family

ID=15424576

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14718984A Granted JPS6126095A (ja) 1984-07-16 1984-07-16 単語間距離の自動算出方法

Country Status (1)

Country Link
JP (1) JPS6126095A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0839757A (ja) * 1994-05-04 1996-02-13 Man Roland Druckmas Ag ゴム胴相互接触印刷のための印刷装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5276610B2 (ja) * 2010-02-05 2013-08-28 日本放送協会 言語モデル生成装置、そのプログラムおよび音声認識システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0839757A (ja) * 1994-05-04 1996-02-13 Man Roland Druckmas Ag ゴム胴相互接触印刷のための印刷装置

Also Published As

Publication number Publication date
JPS6126095A (ja) 1986-02-05

Similar Documents

Publication Publication Date Title
Cutler Forbear is a homophone: Lexical prosody does not constrain lexical access
Shipman et al. Properties of large lexicons: Implications for advanced isolated word recognition systems
US6912499B1 (en) Method and apparatus for training a multilingual speech model set
Picone et al. Automatic text alignment for speech system evaluation
Isenberg et al. A top‐down effect on the identification of function words
JPH0574838B2 (ja)
Kasparaitis Transcribing of the Lithuanian text using formal rules
El Méliani et al. New efficient fillers for unlimited word recognition and keyword spotting
Marshall et al. Stress and vowel duration effects on syllable recognition
JPS617890A (ja) 音声認識対象単語検査方式
Alleva et al. Automatic new word acquisition: Spelling from acoustics
Pitt et al. Using pronunciation data as a starting point in modeling word recognition
Delgado-Díaz et al. Sociolinguistic implications on perception
US8688452B2 (en) Automatic generation of distractors for special-purpose speech recognition grammars
Tohkura Speaker‐independent recognition of isolated digits using a weighted cepstral distance
JPH0574837B2 (ja)
KR19980065481A (ko) 운율 분석 결과에 근거한 음소 분리 방법
Ahmad et al. Towards designing a high intelligibility rule based standard malay text-to-speech synthesis system
JPS6146995A (ja) 音声認識システム
Meloni et al. A knowledge-based system for speaker-independent recognition of letters.
McCormick et al. A new approach to English text‐to‐phoneme conversion using Delta, version 2
Banner Simulating an acoustic recognizer
Gagnon et al. Gaining insight into the representational unit for spoken words with a naming task
JPS63153596A (ja) 音声文章入力装置
Tartter et al. Pig latin remembered: Test of a recoding explanation for modality/recency effects in short‐term recall