JP3885989B2 - Speech complementing method, speech complementing apparatus, and telephone terminal device - Google Patents
Speech complementing method, speech complementing apparatus, and telephone terminal device Download PDFInfo
- Publication number
- JP3885989B2 JP3885989B2 JP2001190422A JP2001190422A JP3885989B2 JP 3885989 B2 JP3885989 B2 JP 3885989B2 JP 2001190422 A JP2001190422 A JP 2001190422A JP 2001190422 A JP2001190422 A JP 2001190422A JP 3885989 B2 JP3885989 B2 JP 3885989B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- information
- telephone terminal
- speech
- registered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、音声補完方法及び音声補完装置に係り、詳しくは、音声通話の際に電話端末ユーザの音声を補完することで電話端末の省電力化が可能となる音声補完方法及び音声補完装置並びに電話端末に関する。
【0002】
【従来の技術】
現在のセルラー移動通信システムには、自動車電話、携帯電話(例:PDC(Personal Digital Cellular)方式の移動通信システム)、簡易携帯電話(例:PHS(Personal Handy phone System)などがある。これらの移動通信システムを使用する際には、移動端末(例:携帯電話)から相手先の電話番号を入力し、相手に接続された後に音声あるいはデータを相手先に送信する。
【0003】
移動端末をユーザが使用する場合、該ユーザからの入力操作が必要となるケースは、例えば、▲1▼電話番号の入力や電話帳の登録などを行う場合、▲2▼電子メールなどの文字データを作成する場合、▲3▼受信した文字データを読む場合、▲4▼相手との通話を行う場合などがある。従来、これらの入力(▲1▼〜▲4▼)を補助する方法として以下のような技術が提案されている。
【0004】
1.音声入力により電話装置の操作が行えるような端末操作を補助(上記▲1▼に対応)する技術として特開平8−23369が提案されている。また、回線番号をボタンで押すのではなく、「言葉のコード」を用いてコードを発生することにより接続を可能とする技術が特開2000−78267で開示されている。更に、相手先が発した音声から電話番号を抽出し、電話帳に登録することのできる技術が特願平10−369778で開示されている。
【0005】
2.携帯端末に蓄えられた電子メールのテキストデータを、合成音声にて形態情報端末の使用者に知らせるような文字データの作成補助(上記▲2▼に対応)、受信データの読み出し補助(上記▲3▼に対応)に関する技術として特開平9−32184が開示されている。
【0006】
3.通話の補助を行う技術(上記▲4▼に対応)として電話端末に送信すべき内容をデータ入力すると、合成音声信号に変換し電話回線に送出される技術が特開平9−32184で開示されている。また、使用者が特定の音声(言葉)を発生した場合に自動的に電話回線に接続し、予め記憶してある音声を出力して通報する技術が特開平6−131583に開示されている。
【0007】
【発明が解決しようとする課題】
上述したように、従来の方法では、ユーザが文字入力したデータを音声に変える方法のみであった。この場合、ユーザが伝えたいことを伝えるためにはキー操作を行って文字入力する必要があるため、そのキー操作のための時間がかかると共に煩わしい操作をユーザに強いてしまうという問題があった。また、合成した音声(コンピュータ等に音声を喋らせる音声合成)を利用する場合、韻律(アクセントやイントネーション)の制御や明瞭性などに問題が残されており、極めて人間のものに近い音声を生成するのが現状では難しい。従って、従来の方法では、ユーザ本人の声と異なるため違和感を生じる。
【0008】
そこで、本発明の第一の課題は、ユーザに煩雑な入力操作を課すことなく、ユーザ自身の声で音声補完をできるようにした音声補完方法及び音声補完装置並びに電話端末装置を提供することである。
【0009】
【課題を解決するための手段】
上記第一の課題を解決するため、本発明は、請求項1に記載されるように、電話端末が他の電話端末と所定通信網を介して音声通信を行う際に音声情報の補完を行う音声補完方法において、上記電話端末から音声情報を所定通信網に接続された音声補完情報格納手段に予め登録し、上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出し、その抽出された音声情報を上記他方の電話端末に送信するように構成される。
【0010】
このような音声補完方法では、電話端末のユーザ(以下、ユーザAという)が他の電話端末のユーザ(以下、ユーザBという)と通話しているときに、その通話中の音声情報を含む音声情報が所定網に接続された音声補完情報格納手段に登録されている音声情報から抽出され、その抽出された音声情報がユーザBの電話端末に対して送信される。
【0011】
例えば、ユーザAの端末から「おは」という音声情報が送信されると、音声補完情報格納手段は、予め登録されている音声情報から「おは」を含む「おはようございます」という音声情報を抽出する。このようにして抽出された「おはようございます」の音声はユーザ自身の音声でユーザBの電話端末に送信されるので、ユーザBは違和感なく聞くことができる。即ち、本発明によれば、ユーザAから発せられた「おは」の音声情報から差分となる「ようございます」の音声情報の補完が行われるようになっている。その結果、ユーザ間の会話がスムーズに運ぶように支援することが可能である。
【0012】
本発明における上記音声補完情報格納手段は、所定網に接続された通信事業者のネットワーク装置、あるいは新たなノードとして設けてもよく設置場所を限定しない。
【0013】
上記音声補完情報格納手段に登録されている音声情報を電話端末にも登録することができるという観点から、本発明は、請求項2に記載されるように、上記音声補完方法において、上記音声補完情報格納手段は、登録された音声情報を上記電話端末に送信し、上記電話端末は、上記音声情報を受信して登録するように構成される。
【0014】
ユーザから発せられる音声情報のうち使用頻度の高い音声情報を抽出して自動登録できるという観点から、本発明は、請求項3に記載されるように、上記音声補完方法において、上記音声補完情報格納手段は、上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザから送信される音声情報のうち出現頻度の高い音声情報を抽出して自動登録するように構成される。
【0015】
また、上記ユーザにて使用頻度の高い音声情報を電話端末にも登録できるという観点から、本発明は、請求項4に記載されるように、上記音声補完方法において、上記電話端末は、上記音声補完情報格納手段にて抽出された出現頻度の高い音声情報を該音声補完情報格納手段より受信して登録するように構成される。
【0016】
ユーザ自身にて上記音声補完情報格納手段に登録する音声を自由に選択し登録することができるという観点から、本発明は、請求項5に記載されるように、上記音声補完方法において、上記音声補完情報格納手段は、音声情報または出現頻度の高い音声情報のいずれかを蓄積し、蓄積された音声情報または該音声情報を伝達するための情報を上記電話端末に通知し、上記電話端末は、その通知に基づいて上記音声補完情報格納手段に登録させるべき音声情報がユーザにて選択された後、その選択結果を上記音声補完情報格納手段に報告し、上記音声補完情報格納手段は、上記無線端末からの報告に基づいて音声情報を登録するように構成される。
【0017】
また、本発明は、請求項6に記載されるように、上記音声補完方法において、上記電話端末は、上記音声補完情報格納手段に登録させるべき音声情報がユーザにて選択された後、その選択結果に基づいて得られる音声情報を登録するように構成される。
【0018】
音声補完情報格納手段にて補完された音声情報と同一の音声情報を再生させることが可能になるという観点から、本発明は、請求項7に記載されるように、上記音声補完方法において、上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、音声補完情報格納手段は、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出して、その抽出した音声情報と同一の音声情報を再生させるための指示となる信号を上記電話端末に送信し、上記電話端末は、上記指示に従って予め登録されている音声情報の再生を行うように構成される。
【0019】
このような音声補完方法では、音声補完情報格納手段は、ユーザAが発した音声情報から抽出した音声情報を該ユーザAに対し送信するのでなく、該抽出した音声情報をユーザAの電話端末に予め登録されている音声情報から読み出して再生させるための指示を送る。即ち、音声補完情報格納手段は、ユーザAの電話端末に対し上記指示となる信号のみを該電話端末に送信するだけなので、音声情報送信に関する無線リソースの節約が可能となる。
【0020】
電話端末の消費電力をより低減することができるという観点から、本発明は、請求項8に記載されるように、上記音声補完方法において、上記音声補完情報格納手段は、該音声補完情報格納手段で抽出された音声情報と同一の音声情報を再生させるための指示を上記電話端末に対して送信するときに、上記電話端末が上記音声補完情報格納手段からの指示に基づいて音声情報を再生している間、音声情報の送信を停止させる指示を上記電話端末に送信し、上記電話端末は、上記指示に従って予め登録されている音声情報の再生を行っている間、ユーザからの音声入力に係らず音声送信を停止するように構成される。
【0021】
このような音声補完方法では、電話端末が登録された音声を再生している間、ユーザからの音声入力に係らず音声送信の出力が停止されるので、該電話端末の消費電力を低減することが可能になる。
【0022】
また、本発明は、請求項9に記載されるように、電話端末が他の電話端末と所定通信網を介して音声通信を行う際に音声情報の補完を行う音声補完方法において、上記電話端末から音声情報を所定通信網に接続された音声補完情報格納手段に予め登録し、上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出し、その抽出された音声情報を上記電話端末及び他方の電話端末に送信するように構成される。
【0023】
更に、上記電話端末として移動端末(例:携帯電話)を用いることができるという観点から、本発明は、請求項10に記載されるように、上記音声補完方法において、上記電話端末として所定の通信網に接続される移動端末装置を用いるように構成される。
【0024】
また、上記課題を解決するため、本発明は、請求項11に記載されるように、電話端末が他の電話端末と所定通信網を介して音声通信を行う際に音声情報の補完を行う音声補完装置において、所定通信網に接続され、上記電話端末からの音声情報を予め登録する音声補完情報格納手段と、上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出する音声情報抽出手段と、その抽出された音声情報を上記他方の電話端末に送信する音声情報送信手段とを有するように構成される。
【0025】
また、更に、上記課題を解決するため、本発明は、請求項18に記載されるように、所定通信網を介して他の電話端末と通信を行う電話端末装置において、
上記所定通信網には、上記電話端末が音声通信を行う際に音声情報の補完を行う音声補完装置が接続され、上記音声補完装置には、上記電話端末からの音声情報が音声補完情報格納手段に予め登録され、上記電話端末から送信された音声情報を含む音声情報を音声補完情報格納手段に登録されている音声情報から抽出し、抽出された音声情報を上記他方の電話端末に送信し、上記電話端末は、上記音声補完情報格納手段にて送信された音声情報を受信して登録するように構成される。
【0026】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて説明する。
【0027】
本発明の実施の一形態に係る音声補完方法が適用される移動通信システムは、例えば、図1に示すように構成される。
【0028】
図1において、この移動通信システムは、例えば、PHS方式のシステムであり、移動端末10(携帯電話機)が無線基地局20と無線通信を行い、ネットワーク装置30(例えば、交換局装置)を介して他の端末(例:固定電話60、移動端末B70)との音声通信や非通話通信が行えるようになっている。尚、本例では、発信側の移動端末10を移動端末A、着信側の移動端末70を移動端末Bと仮定する。
【0029】
ネットワーク30装置に接続された音声補完装置40は、移動端末A10と固定電話60と間で通話がなされている場合に、その通話の音声情報を認識し、移動端末A10ユーザと固定電話ユーザ間の会話の中で頻繁に用いられているフレーズ(複数に分割された音声情報の一つ)を抽出して登録(=蓄積)する。このとき、音声補完装置40に登録された上記フレーズは移動端末A10にも登録(=登録)される。本発明では、移動端末A10ユーザが発したフレーズの最初の音節が音声補完装置40に登録されたフレーズと一致した場合に、音声補完装置40は、そのフレーズを補完して固定電話60に流すと共に、移動端末A10に対し自移動端末A10に蓄積されている上記フレーズを流させるための指示及び該フレーズを流している間の送信をOFFとする指示を無線基地局20経由で送出する。
【0030】
このように本発明では、移動端末A10ユーザが頻繁に使うフレーズが該ユーザ自身の声で音声補完装置40と自移動端末A10の双方に登録される。その後、移動端末A10ユーザが音声補完装置40に登録されているフレーズの最初の音節を発したとき、音声補完装置40は、そのフレーズの音節と一致するフレーズを補完して相手側の固定電話60あるいは移動端末B70に流すようにしている。例えば、本発明を会話の中で定型文句を繰り返すことの多いユーザに適用した場合、該ユーザは定型文句登録のための入力操作を行わなくても容易に該定型文句を相手方に伝えることができるようになる。このとき、ユーザが相手方に伝える際の音声はユーザ自身の声で録音された声で提供されるので、聞き手にとって違和感のない音声を聞くことができる。
【0031】
次に、本発明の音声補完装置40の装置構成について説明する。
【0032】
この音声補完装置40は、例えば、図2のように構成され、音声認識部41、ユーザ特定・音声分析処理部42、バッファメモリ部43、音声データベース44、比較・検出部45、音声再生部46、中央制御部47、音声入力部48、ユーザーインターフェース部49、音声出力部50、基地局制御部51とを具備する。
【0033】
続いて、音声補完装置40の動作について図2を参照しながら説明する。
【0034】
移動端末A10からの発呼要求に基づいて固定電話60との間の通話パスが確立され、移動端末A10ユーザと固定電話60ユーザとで会話が開始されると、その会話の音声が音声入力部48に入力される。この音声入力部48に入力された音声(=音声信号)は、音声認識部41で音声認識(例:入力された音声から音素テキスト(発声された文字列)を認識する)され、その音声認識で得られた結果がユーザ特定・音声分析処理部42に入力される。
【0035】
ユーザ特定・音声分析処理部42は、音声認識部41で得られた認識結果に基づいて移動端末A10ユーザ(話者)を特定するための分析処理を行うと共に、移動端末A10ユーザが固定電話60ユーザとの会話で使っている頻度の高いフレーズを抽出する役割を担う。このユーザ特定・音声分析処理部42で抽出された出現頻度の高いフレーズは一旦バッファメモリ43に蓄積され、その蓄積されたフレーズと同一のフレーズが一定回数以上繰り返された場合に、そのフレーズを移動端末A10ユーザでの利用頻度の高いフレーズとみなして音声データベース44に登録する。音声データベース44には、このようにして登録されるフレーズがユーザ毎に分類されている。
【0036】
図3は、ユーザにて使用頻度の高いフレーズをユーザ毎に登録する音声データベース44の内部構成例である。
【0037】
この音声データベース44は、ユーザを分類するフィールド(▲1▼)と、ユーザの選択・非選択を表すフィールド(▲2▼)と、登録されたフレーズの音声を管理するフィールド(▲3▼)とで構成される。
【0038】
ユーザを分類するフィールド(▲1▼)には、ユーザを識別することが可能な加入者番号や識別ID(例:U1、U2・・・)などが用いられる。また、ユーザの選択・非選択を表すフィールド(▲2▼)は、移動端末A10ユーザにて「登録」との選択がなされたフレーズに対して、選択を表すフラグを立て(「1」)、非選択の決定がなされたフレーズに対しては非選択を表すフラグ(「0」)を立てる。登録されたフレーズを管理するフィールド(▲3▼)は、登録したフレーズ毎に番号(登録音声認識番号)を割当て管理する。例えば、V001、V002・・・などの番号がフレーズごとに割付けられる。
【0039】
図2に戻って、音声補完装置40の動作の説明を続ける。
【0040】
本発明の音声補完装置40では、移動端末A10ユーザと固定電話60ユーザが通話している間(通話中)、音声認識部41の音声認識機能により通話中の音声の音声情報が常にモニタされる。比較・検出部45は、その通話中の音声の音声情報が音声データベース44に登録されたフレーズの最初の音節の音声情報と一致したかどうかを比較し、一致したフレーズを含む音声情報を音声データベース44から検出する。この比較・検出部45で検出されたフレーズの音声情報は音声再生部46で再生された後、音声再生信号となって音声出力部50から固定電話60へと送られる。固定電話60では、音声出力部50から出力された音声再生信号に基づいて音声の再生を行う。
【0041】
音声データベース44に登録されたフレーズの音声情報は、音声再生部46で音声再生信号となって音声出力部50から定期的に移動端末A10に通知され、移動端末A10では、音声データベース44に登録されたフレーズを聞くことができる。
【0042】
中央制御部47は、基地局制御部51を介して、移動端末A10が接続している無線基地局20に対し移動端末A10に登録されたフレーズの音声情報を再生させるための指令を送るよう命令する。尚、移動端末A10でのフレーズの音声情報の登録手順については後述する。また、ユーザーインターフェース部49はネットワーク装置30が音声データベース44にアクセスしたり、そのアクセスに基づいて音声データベース44から情報を出力したりする際のインターフェース機能を有する。
【0043】
次に、本発明の移動端末A10の装置構成を図4を参照しながら説明する。
【0044】
図4において、この移動端末A10は、音声補完制御部11、送受信制御部12、登録音声メモリ13、入力・再生部14、送受信部15、マイク/スピーカ部16、操作部17、アンテナ部18とを具備して構成される。
【0045】
続いて、移動端末A10の動作について図4を参照しながら説明する。
【0046】
アンテナ部18は、音声補完装置40内の音声出力部50から定期的に通知される無線信号(音声データベース44に登録されたフレーズの音声情報が含まれる)を無線基地局20経由で受信した後、送受信部15に送る。この無線信号は、送受信部15で周波数変換や復調処理が施された後、フレーズの音声情報が抽出されて入力・再生部14に送られる。入力・再生部14から出力されるフレーズの音声情報は操作部17からの指示によって、登録音声メモリ13に登録すべきかあるいは非登録とすべきかの選択が行えるようになっている。
【0047】
図5は、登録音声メモリ13の内部構成例を示した図である。
【0048】
この登録音声メモリ13は、ユーザを認識するフィールド(▲1▼)と、ユーザの選択を表すフィールド(▲2▼)と、登録されたフレーズの音声情報を管理するフィールド(▲3▼)とで構成される。
【0049】
ユーザを分類するフィールド(▲1▼)には、ユーザを識別するための加入者番号や識別ID(例:U1)などが用いられる。また、ユーザの選択を表すフィールド(▲2▼)は、移動端末ユーザにて登録するとの選択がなされたフレーズに対して、選択を表すフラグ(「1」)を立てる。登録されたフレーズの音声情報を管理するフィールド(▲3▼)は、登録したフレーズ毎に番号(登録音声認識番号)を割当て管理する。例えば、V001、V002・・・などの番号がフレーズごとに割付けられる。
【0050】
図4に戻って、移動端末A40の動作の説明を続ける。
【0051】
送受信制御部12は、送受信部15に具備される送信機あるいは受信機のON/OFF制御等を行う。例えば、送受信部15で無線信号を受信する際には、送受信制御部12は送受信部15に対し受信機ON、送信機OFFとなるよう制御し、反対に、送受信部15で無線信号を送信しる際には、送受信部15に対し送信機ON、受信機OFFとなるよう制御する。
【0052】
送受信部15の復調で得られたフレーズの音声情報は、入力・再生部14に入力された後、音声再生されてマイク/スピーカ部16に音声出力される。このマイク/スピーカ部16より出力された音声は、その後、操作部17で「選択」あるいは「非選択」の操作が移動端末A10ユーザにてなされて、登録音声メモリに登録される。つまり、ここでは、移動端末A10ユーザがどのフレーズを有効とするかどうかの選択を行う。尚、移動端末A10ユーザの操作に基づいて該当のフレーズの音声を登録音声メモリ13に登録する手順については後述する。
【0053】
上記操作部17の操作で、「選択」との決定がなされたフレーズの音声については、「選択」されたことを示す通知が送受信部15から出力され、アンテナ部18を介して音声補完装置40に通知される。この「選択」通知を受信した音声補完装置40内の音声データベース44は該当するフレーズの音声情報をON(有効)にする。
【0054】
また、上記音声補完装置40の動作の説明で述べたように、無線基地局20からは、移動端末A10の登録音声メモリ13に登録されたフレーズの音声を再生させるための指令が当該移動端末A10に対して送出される。この指令には、移動端末A10の送信をOFFにさせるための指令と、該移動端末A10内の登録音声メモリ13に登録されたフレーズのうち流すべきフレーズを指定する内容の指令が含まれている。
【0055】
上記指令を送受信部15経由で受けた送受信制御部12は、送受信部15に対し、送信をOFFにする命令を出す。また、上記指令は、送受信制御部12から音声補完制御部11に送られ、該音声補完制御部11で再生すべきフレーズの音声の登録音声認識番号などを読取ってその結果を入力・再生部14に伝える。入力・再生部は登録音声メモリ13にアクセスし、該当する登録音声認識番号のフレーズの音声情報を取得し音声再生する。このようにして入力・再生部14で再生されるフレーズの音声は、マイク/スピーカ部16で聞くことができるようになっている。
【0056】
次に、本発明の音声補完方法による音声補完の処理手順を図6を参照して詳述する。
【0057】
図6は、本発明の音声補完装置40による音声補完の処理手順の一例を示すフローチャートである。
【0058】
図6において、移動端末A10ユーザ(以下、ユーザAという)が固定電話60ユーザ(以下、ユーザBという)との通話をしているときに発したフレーズは、音声補完装置40内の音声認識部41で認識された後、そのフレーズ(以下、フレーズAという)を発したユーザ(この場合、ユーザA)を特定するための分析がユーザ特定・音声分析処理部42で行われる。このユーザ特定・音声分析処理部42で得られた分析結果は一旦バッファメモリ43に蓄積(S1)される。つまり、ここでは、ユーザAが発したフレーズAが一時、バッファメモリ43に蓄積43される。
【0059】
このようにしてバッファメモリ43に一時蓄積されたユーザAのフレーズAは比較・検出部45に送られ、そのフレーズAが前回にも使われているか否かが判定(S2)される。比較・検出部45は、この判定(S2)で、バッファメモリ43から出力されたユーザAのフレーズAが前回にも同じフレーズが使われていない判定(S2でNO)された場合、バッファメモリ43に対し、フレーズAの蓄積を保持しておく指示を出すが、該判定(S2)で、バッファメモリ43から出力されたユーザAのフレーズAが前回にも同じフレーズが使われていると判定(S2でYES)された場合、更に、そのフレーズAの使われている回数が予め定められた回数(n)以上に達したかどうかの判定(S3)を行う。例えば、n=3とした場合、(S3)の判定でフレーズAの出現回数Cがn以下の場合(S3でNO)、該出現回数Cが「1」インクリメント(S4)される。従って、上記判定(S3)で、フレーズAの出現回数Cがn以上(S3でYES)となったときに次のステップ(S5)に進む。
【0060】
上記判定(S3)で、フレーズAの出現回数Cがn以上となったと判定(S3でYES)された場合、比較・検出部45は、音声データベース44にアクセスして、そのフレーズAが既に登録されているかどうかを問合せる(S5)。この問合せ(S5)で、フレーズAが既に登録されているとの応答を音声データベース44より得た場合(S5でYES)、比較・検出部45は、音声データベース44に対し、更に、その登録済みのフレーズAが移動端末A10ユーザより有効とする旨の選択がなされているかどうかを問合せ(S7)を行う。
【0061】
比較・検出部45は、その問合せ(S7)で、フレーズAの「選択」がなされているとの応答を得た(S7でYES)場合、中央制御部47を介し基地局制御部51に移動端末A10の送信停止要求を表す信号を無線基地局20に出力するよう指示(S9)すると共に、音声データベース44からフレーズAの音声情報を検出して音声再生部46に送る。音声再生部46は、フレーズAの音声情報を移動端末B70で音声再生可能な音声再生信号に変換して音声出力部50に送る。
この音声出力部50から出力された音声再生信号は、移動端末A10の通話相手の(ユーザB)固定電話60に送られ、該固定電話60では受信した音声再生信号からフレーズAの音声を聞くことができる(S10)ようになっている。
【0062】
しかしながら、上記判定(S5)で、フレーズAが音声データベース44に登録されていないと判定(S5でNO)された場合、該フレーズAは音声データベース44に登録される。また、上記判定(S7)で、フレーズAが移動端末A10ユーザより選択されていない場合(S7でNO)は、補完を行わないで処理を中止する。
【0063】
このように本発明の音声補完方法では、ユーザAが使う頻度の高いフレーズが音声データベース44に自動的に登録される。ユーザAとユーザB間の通話は、常にモニタされ、ユーザAが音声データベース44に登録されたフレーズAの最初の音節を発したとき、音声データベース44に登録されている複数のフレーズからそのフレーズAの最初の音節と一致するフレーズが抽出される。例えば、音声データベース44に登録されているフレーズAを「いつもお世話になっております」とした場合、ユーザAがフレーズAの最初の音節「いつも」を発すると、比較・検出部45は音声データベース44にアクセスし、「いつも」を最初の音節とするフレーズを音声データベース44に登録されているフレーズからサーチする。このサーチで、「いつも」を最初の音節とするフレーズが「いつもお世話になっております」しか検出されなければ、このフレーズをフレーズAと一致したとみなして抽出する。
【0064】
このようにして抽出されたフレーズAは、ユーザBに提供され該ユーザBでは、ユーザAの声で「いつもお世話になっております」のフレーズを聞くことができる。しかしながら、「いつも」を最初の音節とするフレーズが複数検出された場合は、次の文字(この場合、「お」)が付加(「いつもお」)されて再度サーチが行われる。このような場合、ユーザAに対しては、「いつも」を最初の音節とするフレーズが複数検出された旨が通知されるが、ユーザAはこの通知に基づいて、次の文字を発すれば音声補完装置40で自動的に該当するフレーズAを検出してくれるようになっている。
【0065】
従って、ユーザAはフレーズの最初の音節を発するだけで相手方に意思伝達できるので、会話の中で定型文句を多く話すユーザにとっては該定型文句を全て話さなくてもよくなり利便性が向上する。また、高齢者や話すことが不自由なユーザであれば、予め伝えたいフレーズを予め登録しておけば、会話をスムーズに進めることも可能となる。
【0066】
また、本発明の音声補完装置40は、音声データベース44で抽出されたフレーズAの音声をユーザBに流すと共に、ユーザAの移動端末A10に対し、送信をOFFにし、自移動端末A10に登録されているフレーズAを流すよう指示する。この指示を無線基地局20を介して受信した移動端末A10は、登録されているフレーズAを流し、その間の送信をOFFにする。即ち、音声補完により補完したフレーズを流している間は移動端末A10の送信が停止となるので該移動端末A10の消費電力をより低減することが可能となる。
【0067】
また、上述の説明では、移動端末A10の相手方の端末を固定電話60と仮定したが、本発明はこれに限定されるものでなく相手方の端末が移動端末B70であっても勿論よい。
【0068】
上記実施例では、音声補完装置40内の音声データベース44にフレーズを登録する一例として、移動端末A10ユーザが固定電話60ユーザと通話中、通話内容が音声認識部41で音声認識された後、バッファメモリ43に一時蓄積し、同一フレーズが一定回数以上繰り返されたら、その同一フレーズがユーザの声で音声データベース44蓄積される場合を例示した。
【0069】
次に、移動端末A10にフレーズを登録する方法の一例を以下に示す。
【0070】
例えば、図7は、移動端末A10にフレーズを登録する手順の一例を示したフローチャートである。
【0071】
(登録方法1)
図7において、移動端末A10は音声補完装置40から音声データベース44に登録されたフレーズに係る情報(登録通知)を定期的に受信(S21)する。移動端末A10は、この登録通知を受信すると、所定タイミングで音声補完装置40の音声データベース44にアクセスし、該音声データベース44に登録されたフレーズの音声情報を受信する。移動端末A10は、そのフレーズの音声情報を受信後、音声再生を行い(S23)、その再生されたフレーズのうちどのフレーズを有効とするか否かの決定(選択あるいは非選択)が操作部17の操作によってなされる。操作部17の操作で「選択」を表す操作が移動端末A10ユーザによってなされた場合(S24でYES)、その「選択」で選ばれたフレーズを自移動端末A10内の登録音声メモリ13に記憶すると共に、音声補完装置40内の音声データベース44に対して、該フレーズを有効する旨の通知(選択通知)を送出(S25)する。一方、操作部17の操作で「非選択」を表す操作が移動端末A10ユーザにてなされた場合(S24でNO)、「非選択」したフレーズの登録は行われず、かつ音声補完装置40内の音声データベース44に対し、「非選択」したフレーズを有効としない旨の通知(非選択通知)を送出する。
続いて、移動端末A10にフレーズを登録する他の例を図8を参照しながら説明する。
【0072】
(登録方法2)
図8において、移動端末A10は音声補完装置40から音声データベース44に登録されたフレーズに係る情報(登録通知)を定期的に受信(S31)する。移動端末A10は、この登録通知を受信すると、iモード(文字情報サービスの一つ)などを用いて音声補完装置40内の音声データベース44にアクセス(S32)し、該音声データベース44に登録されているフレーズの音声情報の一覧をダウンロード(S33)する。このダウンロードしたフレーズの音声情報にはそれぞれを識別する番号が割り振られ、移動端末A10ユーザは、移動端末A10の画面上で番号をクリック(番号選択)することで該当する番号のフレーズの音声を聞けるようになっている。
【0073】
このようにして、フレーズの番号の選択がなされ(S34)、その選択されたフレーズの音声が再生(S35)されると、その再生されたフレーズのうちどのフレーズを有効とするか否かの決定(選択あるいは非選択)が操作部17の操作によってなされる。操作部17の操作で「選択」を表す操作が移動端末A10ユーザによってなされた場合(S36でYES)、その「選択」で選ばれたフレーズを自移動端末A10内の登録音声メモリ13に記憶すると共に、音声補完装置40内の音声データベース44に対して、該フレーズを有効する旨の通知(選択通知)を送出(S37)する。一方、操作部17の操作で「非選択」を表す操作が移動端末A10ユーザにてなされた場合(S37でNO)、その「非選択」したフレーズの登録は行われず、かつ音声補完装置40内の音声データベース44に対し、「非選択」したフレーズを有効としない旨の通知(非選択通知)を送出する。
【0074】
尚、上記(登録方法1)及び(登録方法2)において、音声補完装置40から移動端末A10に対し定期的に通知されるフレーズに係る情報(登録通知)は、音声情報であっても電子メールのようなテキスト形式になっているものでもかまわない。この場合、音声データベース44に登録されたフレーズの音声情報が音声再生部46で音声再生信号となった後、中央制御部47でその音声信号が読取られ、テキスト形式に変換された後、基地局制御部51を介して移動端末A10に送られる。
【0075】
上記例において、音声補完装置40内の音声データベース44の登録機能が音声補完情報格納手段に、比較・検出部45の音声比較検出機能が音声情報抽出手段に、中央制御部47の制御機能及び基地局制御部51の制御信号送出機能が再生指示手段及び音声送信停止指示手段に、ユーザ特定・音声分析処理部42のユーザ特定・音声分析機能および音声データベース44の登録機能が音声補完情報自動登録手段に対応する。また、音声出力部46の音声出力機能が音声情報送信手段及び第1の音声情報送信手段及び第2の音声情報送信手段に対応する。更に、同音声補完装置40内の中央制御部47の制御機能及び基地局制御部51の通知信号送出機能が音声情報通知手段に対応する。
【0076】
また、更に、移動端末A10内の登録音声メモリ13が第1〜3登録手段に対応し、操作部17の決定機能が音声情報選択手段に、入力・再生部14の音声再生機能が音声再生手段に対応する。送受信部15の送信機能が報告手段に、送受信制御部12の送受信部15制御機能が送信停止手段に対応する。
【0077】
【発明の効果】
以上、説明したように、請求項1乃至10記載の本願発明によれば、ユーザが特によく使うフレーズが音声補完装置に登録され、そのフレーズを登録したユーザが通話中、音声補完装置が登録されたフレーズの最初の音節が一致したことを認識した場合、該音声補完装置はユーザの電話端末が接続している無線基地局に対し、送信をOFFにし、自電話端末に登録された該当フレーズを流す指示を送るよう命令する。そして、無線基地局からその指示を受けた電話端末は、登録された該当フレーズを流し、その間の送信電力をOFFにする。同時に相手方の電話端末へは、該音声補完装置で補完した音声が流れるようになっている。
【0078】
その結果、ユーザが使用頻度の高いフレーズを発する度に上記のような音声補完がなされて送信電力がOFFとなることから、より電話端末の消費電力の軽減が図れる。また、ユーザでは、電話端末からデータ等の面倒な入力を行う必要がなく、かつ上記音声の補完に用いられる音声はユーザ自身の音声が用いられるため自然な音声補完サービスの提供が実現可能になる。
【0079】
また、請求項11乃至17記載の本願発明によれば、上記のような音声補完方法に従って音声の補完が可能となる音声補完装置を実現することができる。
【0080】
更に、請求項18乃至24記載の本願発明によれば、上記のような音声補完方法に従って音声を再生している間、送信電力を低減することのできる電話端末装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の実施の一形態に係る音声補完方法が適用される移動通信システムの構成例を示す図である。
【図2】図1に示す移動通信システムにおいて音声補完装置のブロック図を示す図である。
【図3】使用頻度の高いフレーズをユーザ毎に登録する音声データベースの内部構成例を示す図である。
【図4】図1に示す移動通信システムにおいて移動端末Aのブロック図を示す図である。図である。
【図5】ユーザにて選択したフレーズが登録される移動端末の登録音声メモリの内部構成例を示す図である。
【図6】本発明の音声補完装置による音声補完の処理手順の一例を示すフローチャートである。
【図7】移動端末にフレーズを登録する手順の一例(その1)を示す図である。
【図8】移動端末にフレーズを登録する手順の一例(その2)を示す図である。
【符号の説明】
10 移動端末A
11 音声補完制御部
12 送受信制御部
13 登録音声メモリ
14 入力・再生部
15 送受信部
16 マイク/スピーカ部
17 操作部
18 アンテナ部
20 無線基地局
30 ネットワーク装置
40 音声補完装置
41 音声認識部
42 ユーザ特定・音声分析処理部
43 バッファメモリ部
44 音声データベース
45 比較・検出部
46 音声再生部
47 中央制御部
48 音声入力部
49 ユーザーインターフェース部
50 音声出力部
51 基地局制御部
60 固定電話
70 移動端末B[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a voice complementing method and a voice complementing apparatus, and more particularly, a voice complementing method and a voice complementing apparatus capable of saving power of a telephone terminal by complementing a voice of a telephone terminal user during a voice call, and Regarding telephone terminals.
[0002]
[Prior art]
Current cellular mobile communication systems include car phones, mobile phones (eg, PDC (Personal Digital Cellular) mobile communication systems), simple mobile phones (eg, PHS (Personal Handy phone System)), and the like. When using a communication system, a telephone number of a partner is input from a mobile terminal (eg, a mobile phone), and after connecting to the partner, voice or data is transmitted to the partner.
[0003]
When a user uses a mobile terminal, an input operation from the user is required. For example, (1) when inputting a telephone number or registering a telephone book, (2) character data such as e-mail. (3) When reading received character data, (4) When making a call with the other party. Conventionally, the following techniques have been proposed as a method for assisting these inputs (1) to (4).
[0004]
1. Japanese Patent Laid-Open No. 8-23369 has been proposed as a technique for assisting (corresponding to (1) above) a terminal operation that enables operation of the telephone device by voice input. Japanese Patent Laid-Open No. 2000-78267 discloses a technique that enables connection by generating a code using a “word code” instead of pressing a line number with a button. Further, Japanese Patent Application No. 10-369778 discloses a technique capable of extracting a telephone number from a voice uttered by a partner and registering it in a telephone directory.
[0005]
2. Text data of e-mail stored in the portable terminal is supplemented with character data creation assistance (corresponding to (2) above) and synthetic data is used to inform the user of the morphological information terminal, and received data reading assistance (above (3) above) Japanese Patent Laid-Open No. 9-32184 is disclosed as a technique relating to (1).
[0006]
3. Japanese Patent Laid-Open No. 9-32184 discloses a technique for inputting contents to be transmitted to a telephone terminal as a technique for assisting a call (corresponding to the above (4)), and converting the data into a synthesized voice signal and sending it to a telephone line. Yes. Japanese Patent Application Laid-Open No. 6-131583 discloses a technique for automatically connecting to a telephone line when a user generates a specific voice (word) and outputting a voice stored in advance.
[0007]
[Problems to be solved by the invention]
As described above, in the conventional method, there is only a method of changing data input by the user into voice. In this case, in order to convey what the user wants to convey, it is necessary to perform a key operation and input characters, so there is a problem that it takes time for the key operation and forces the user to perform a troublesome operation. In addition, when using synthesized speech (speech synthesis that makes a computer or the like speak), problems remain in prosody (accent and intonation) control and intelligibility, and it produces speech that is very close to humans. It is difficult to do at present. Therefore, in the conventional method, it is different from the voice of the user himself / herself.
[0008]
Therefore, a first problem of the present invention is to provide a voice complementing method, a voice complementing apparatus, and a telephone terminal device that can perform voice complementing with the user's own voice without imposing a complicated input operation on the user. is there.
[0009]
[Means for Solving the Problems]
In order to solve the first problem, as described in
[0010]
In such a voice complementing method, when a user of a telephone terminal (hereinafter referred to as user A) is talking to a user of another telephone terminal (hereinafter referred to as user B), a voice including voice information during the call is included. The information is extracted from the voice information registered in the voice supplement information storage means connected to the predetermined network, and the extracted voice information is transmitted to the user B's telephone terminal.
[0011]
For example, when the voice information “Oha” is transmitted from the terminal of user A, the voice supplement information storage means receives the voice information “Good morning” including “Oha” from the voice information registered in advance. Extract. Since the voice of “Good morning” extracted in this way is transmitted to the user B's telephone terminal as the user's own voice, the user B can hear it without feeling uncomfortable. In other words, according to the present invention, the voice information “you are”, which is a difference from the voice information “oh” issued from the user A, is complemented. As a result, it is possible to support smooth conversation between users.
[0012]
The voice supplement information storage means in the present invention may be provided as a network device of a communication carrier connected to a predetermined network, or as a new node, and does not limit the installation location.
[0013]
From the viewpoint that voice information registered in the voice supplement information storage means can be registered in a telephone terminal as well, the present invention provides the voice complement method as described in
[0014]
From the viewpoint that voice information that is frequently used out of voice information emitted from a user can be extracted and automatically registered, the present invention provides the voice complement information storage in the voice complement method as described in claim 3. The means is configured to extract and automatically register voice information having a high appearance frequency from voice information transmitted from the user when the telephone terminal and the other telephone terminal are performing voice communication.
[0015]
In addition, from the viewpoint that voice information frequently used by the user can be registered in a telephone terminal, the present invention provides the voice complementing method according to claim 4, wherein the telephone terminal Voice information with a high appearance frequency extracted by the complementary information storage means is received from the voice supplement information storage means and registered.
[0016]
From the viewpoint that the user can freely select and register the voice to be registered in the voice supplement information storage means, the present invention provides the voice supplement method according to the fifth aspect of the present invention. The complementary information storage means stores either voice information or voice information with a high frequency of appearance. Accumulated, accumulated After notifying the telephone terminal of voice information or information for transmitting the voice information, the telephone terminal selects voice information to be registered in the voice complementary information storage unit based on the notification. The selection result is reported to the speech complement information storage means, and the speech complement information storage means is configured to register speech information based on the report from the wireless terminal.
[0017]
Further, according to the present invention, in the voice complementing method according to the sixth aspect, the telephone terminal selects the voice information to be registered in the voice complement information storage unit after the user selects the voice information. The audio information obtained based on the result is registered.
[0018]
From the viewpoint that it is possible to reproduce the same audio information as the audio information supplemented by the audio complement information storage means, the present invention provides the audio complement method according to claim 7, wherein When a user's voice is input during voice communication between the telephone terminal and the other telephone terminal, the voice supplement information storage means stores the voice information including the voice information transmitted from the telephone terminal. Extracted from the speech information registered in the complementary information storage means, and sends a signal to the telephone terminal as an instruction to reproduce the same voice information as the extracted voice information, and the telephone terminal Is configured to reproduce pre-registered audio information.
[0019]
In such a speech complementing method, the speech supplementation information storage means does not transmit the speech information extracted from the speech information emitted by the user A to the user A, but the extracted speech information is transmitted to the user A's telephone terminal. An instruction for reading out and reproducing from previously registered audio information is sent. That is, since the voice supplement information storage means only transmits a signal serving as the instruction to the telephone terminal of user A to the telephone terminal, it is possible to save radio resources related to voice information transmission.
[0020]
From the viewpoint that the power consumption of the telephone terminal can be further reduced, according to the present invention, as described in claim 8, in the speech complementation method, the speech complementation information storage unit includes the speech complementation information storage unit. When transmitting an instruction for reproducing the same audio information as the audio information extracted in step (b) to the telephone terminal, the telephone terminal reproduces the audio information based on the instruction from the audio complementary information storage unit. During the period, the voice terminal transmits an instruction to stop the transmission of voice information to the telephone terminal, and the telephone terminal is involved in voice input from the user while reproducing the voice information registered in advance according to the instruction. First, it is configured to stop voice transmission.
[0021]
In such a voice complementing method, while the telephone terminal is playing back the registered voice, the voice transmission output is stopped regardless of the voice input from the user, so that the power consumption of the telephone terminal is reduced. Is possible.
[0022]
According to a ninth aspect of the present invention, there is provided a voice complement method for complementing voice information when a telephone terminal performs voice communication with another telephone terminal via a predetermined communication network. Voice information is registered in advance in voice supplement information storage means connected to a predetermined communication network, and when the user's voice is input while the telephone terminal and the other telephone terminal are performing voice communication, Voice information including voice information transmitted from the telephone terminal is extracted from the voice information registered in the voice complementary information storage means, and the extracted voice information is transmitted to the telephone terminal and the other telephone terminal. Composed.
[0023]
Furthermore, from the viewpoint that a mobile terminal (eg, a mobile phone) can be used as the telephone terminal, the present invention provides a predetermined communication as the telephone terminal in the voice complementing method as described in claim 10. A mobile terminal device connected to the network is used.
[0024]
In order to solve the above-mentioned problem, the present invention provides, as described in
[0025]
Furthermore, in order to solve the above-mentioned problems, the present invention provides a communication system as defined in
The predetermined communication network is connected with a voice complementing device that complements voice information when the telephone terminal performs voice communication. The voice complementing device stores voice information from the telephone terminal. Pre-registered voice information including voice information transmitted from the telephone terminal is extracted from the voice information registered in the voice complementary information storage means, and the extracted voice information is transmitted to the other telephone terminal, The telephone terminal stores the voice supplement information. In steps The received voice information is received and registered.
[0026]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0027]
A mobile communication system to which a speech supplementing method according to an embodiment of the present invention is applied is configured as shown in FIG. 1, for example.
[0028]
In FIG. 1, this mobile communication system is, for example, a PHS system, in which a mobile terminal 10 (mobile phone) performs radio communication with a
[0029]
When a call is made between the mobile terminal A10 and the
[0030]
As described above, in the present invention, phrases frequently used by the mobile terminal A10 user are registered in both the
[0031]
Next, the device configuration of the
[0032]
The
[0033]
Next, the operation of the
[0034]
When a call path between the fixed
[0035]
The user identification / speech
[0036]
FIG. 3 is an internal configuration example of the
[0037]
The
[0038]
In the field (1) for classifying the user, a subscriber number or identification ID (eg, U1, U2,...) That can identify the user is used. In the field ((2)) indicating the selection / non-selection of the user, a flag indicating selection is set for the phrase selected as “register” by the user of the mobile terminal A10 (“1”), A flag (“0”) indicating non-selection is set for a phrase for which non-selection is determined. The field (3) for managing registered phrases assigns and manages a number (registered speech recognition number) for each registered phrase. For example, numbers such as V001, V002... Are assigned for each phrase.
[0039]
Returning to FIG. 2, the description of the operation of the
[0040]
In the
[0041]
The audio information of the phrase registered in the
[0042]
The
[0043]
Next, the apparatus configuration of the mobile terminal A10 of the present invention will be described with reference to FIG.
[0044]
In FIG. 4, the mobile terminal A 10 includes a voice
[0045]
Next, the operation of the mobile terminal A10 will be described with reference to FIG.
[0046]
The
[0047]
FIG. 5 is a diagram illustrating an internal configuration example of the registered voice memory 13.
[0048]
The registered voice memory 13 includes a field for recognizing a user (1), a field for selecting a user (2), and a field for managing voice information of a registered phrase (3). Composed.
[0049]
In the field (1) for classifying a user, a subscriber number for identifying the user, an identification ID (for example, U1) or the like is used. Also, the field ({circle around (2)}) representing the user's selection sets a flag (“1”) representing the selection for the phrase selected to be registered by the mobile terminal user. In the field ((3)) for managing the voice information of the registered phrase, a number (registered voice recognition number) is assigned and managed for each registered phrase. For example, numbers such as V001, V002... Are assigned for each phrase.
[0050]
Returning to FIG. 4, the description of the operation of the mobile terminal A40 will be continued.
[0051]
The transmission /
[0052]
The audio information of the phrase obtained by the demodulation of the transmission /
[0053]
With respect to the voice of the phrase that has been determined to be “selected” by the operation of the
[0054]
Further, as described in the explanation of the operation of the
[0055]
The transmission /
[0056]
Next, the processing procedure of speech complementing by the speech complementing method of the present invention will be described in detail with reference to FIG.
[0057]
FIG. 6 is a flowchart showing an example of a voice complement processing procedure by the
[0058]
In FIG. 6, a phrase issued when a mobile terminal A 10 user (hereinafter referred to as user A) is talking to a
[0059]
The phrase A of the user A temporarily stored in the buffer memory 43 in this manner is sent to the comparison / detection unit 45, and it is determined whether or not the phrase A has been used before (S2). In this determination (S2), the comparison / detection unit 45 determines that the phrase A of the user A output from the buffer memory 43 has not been used in the previous time (NO in S2). In response to the instruction to keep the accumulation of the phrase A, it is determined in the determination (S2) that the phrase A of the user A output from the buffer memory 43 is the same as the previous phrase ( If YES in S2, a determination is made as to whether or not the number of times the phrase A has been used has reached a predetermined number (n) or more (S3). For example, when n = 3, when the number of appearances C of the phrase A is n or less (NO in S3) in the determination of (S3), the number of appearances C is incremented by “1” (S4). Accordingly, when the number of appearances C of the phrase A is n or more (YES in S3) in the determination (S3), the process proceeds to the next step (S5).
[0060]
If it is determined in the above determination (S3) that the number of appearances C of the phrase A is n or more (YES in S3), the comparison / detection unit 45 accesses the
[0061]
The comparison / detection unit 45 moves to the base
The audio reproduction signal output from the
[0062]
However, when it is determined in the determination (S5) that the phrase A is not registered in the voice database 44 (NO in S5), the phrase A is registered in the
[0063]
Thus, in the speech complementing method of the present invention, phrases frequently used by the user A are automatically registered in the
[0064]
The phrase A thus extracted is provided to the user B, and the user B can hear the phrase “I am always indebted” with the voice of the user A. However, when a plurality of phrases having “always” as the first syllable are detected, the next character (in this case, “o”) is added (“always”) and the search is performed again. In such a case, the user A is notified that a plurality of phrases having “always” as the first syllable have been detected. However, if the user A utters the next character based on the notification, The
[0065]
Therefore, since the user A can communicate with the other party only by uttering the first syllable of the phrase, it is not necessary to speak all the fixed phrases in the conversation, and convenience is improved. Moreover, if it is an elderly person or a user with difficulty in speaking, if the phrase to convey beforehand is registered beforehand, it will also be possible to advance a conversation smoothly.
[0066]
In addition, the
[0067]
In the above description, the counterpart terminal of the mobile terminal A10 is assumed to be the fixed
[0068]
In the above embodiment, as an example of registering a phrase in the
[0069]
Next, an example of a method for registering a phrase in the mobile terminal A10 is shown below.
[0070]
For example, FIG. 7 is a flowchart showing an example of a procedure for registering a phrase in the mobile terminal A10.
[0071]
(Registration method 1)
In FIG. 7, the mobile terminal A10 periodically receives information (registration notification) related to the phrase registered in the
Next, another example of registering a phrase in the mobile terminal A10 will be described with reference to FIG.
[0072]
(Registration method 2)
In FIG. 8, the mobile terminal A10 periodically receives information (registration notification) related to the phrase registered in the
[0073]
Thus, when the number of the phrase is selected (S34) and the sound of the selected phrase is reproduced (S35), it is determined which of the reproduced phrases is valid. (Selection or non-selection) is performed by operating the
[0074]
In the above (Registration method 1) and (Registration method 2), the information (registration notification) related to the phrase periodically notified from the
[0075]
In the above example, the registration function of the
[0076]
Furthermore, the registered voice memory 13 in the mobile terminal A10 corresponds to the first to third registration means, the determination function of the
[0077]
【The invention's effect】
As described above, according to the present invention described in
[0078]
As a result, every time a user issues a frequently used phrase, the above-described speech compensation is performed and the transmission power is turned off. Therefore, the power consumption of the telephone terminal can be further reduced. In addition, the user does not need to perform troublesome input of data or the like from the telephone terminal, and the user's own voice is used as the voice to be supplemented with the voice, so that a natural voice supplement service can be provided. .
[0079]
Further, according to the present invention described in
[0080]
Furthermore, according to the present invention of
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration example of a mobile communication system to which a speech complementation method according to an embodiment of the present invention is applied.
FIG. 2 is a block diagram of a speech supplement apparatus in the mobile communication system shown in FIG.
FIG. 3 is a diagram showing an internal configuration example of a voice database that registers frequently used phrases for each user;
4 is a block diagram of mobile terminal A in the mobile communication system shown in FIG. FIG.
FIG. 5 is a diagram showing an internal configuration example of a registered voice memory of a mobile terminal in which a phrase selected by a user is registered.
FIG. 6 is a flowchart showing an example of a voice complement processing procedure by the voice complement device of the present invention.
FIG. 7 is a diagram illustrating an example of a procedure for registering a phrase in a mobile terminal (part 1);
FIG. 8 is a diagram illustrating an example (part 2) of a procedure for registering a phrase in a mobile terminal;
[Explanation of symbols]
10 Mobile terminal A
11 Speech Complementation Control Unit
12 Transmission / reception controller
13 Registered voice memory
14 Input and playback unit
15 Transceiver
16 Microphone / speaker section
17 Operation unit
18 Antenna section
20 radio base stations
30 Network equipment
40 Voice Complementary Device
41 Voice recognition unit
42 User identification / voice analysis processing unit
43 Buffer memory section
44 voice database
45 Comparison / detection unit
46 Audio playback unit
47 Central control unit
48 Voice input part
49 User interface
50 Audio output section
51 Base station controller
60 Landline
70 Mobile terminal B
Claims (24)
上記電話端末から音声情報を所定通信網に接続された音声補完情報格納手段に予め登録し、
上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出し、
その抽出された音声情報を上記他方の電話端末に送信する音声補完方法。In the voice complementing method for complementing voice information when a telephone terminal performs voice communication with another telephone terminal via a predetermined communication network,
Voice information from the telephone terminal is registered in advance in voice supplement information storage means connected to a predetermined communication network,
When the user's voice is input while the telephone terminal and the other telephone terminal are performing voice communication, the voice information including the voice information transmitted from the telephone terminal is registered in the voice complementary information storage unit. Extracted from the audio information,
A speech complementing method of transmitting the extracted speech information to the other telephone terminal.
上記音声補完情報格納手段は、登録された音声情報を上記電話端末に送信し、
上記電話端末は、上記音声情報を受信して登録する音声補完方法。The speech completion method according to claim 1,
The voice supplement information storage means transmits the registered voice information to the telephone terminal,
An audio complementing method in which the telephone terminal receives and registers the audio information.
上記音声補完情報格納手段は、上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザから送信される音声情報のうち出現頻度の高い音声情報を抽出して自動登録する音声補完方法。The speech completion method according to claim 1,
The voice complement information storage means extracts voice information that is frequently registered from voice information transmitted from the user and automatically registers when the telephone terminal and the other telephone terminal are performing voice communication. Completion method.
上記電話端末は、上記音声補完情報格納手段にて抽出された出現頻度の高い音声情報を該音声補完情報格納手段より受信して登録する音声補完方法。The speech completion method according to claim 3,
A speech complementing method in which the telephone terminal receives and registers speech information having a high appearance frequency extracted by the speech complementation information storage unit from the speech supplementation information storage unit.
上記音声補完情報格納手段は、音声情報または出現頻度の高い音声情報のいずれかを蓄積し、蓄積された音声情報または該音声情報を伝達するための情報を上記電話端末に通知し、
上記電話端末は、その通知に基づいて上記音声補完情報格納手段に登録させるべき音声情報がユーザにて選択された後、その選択結果を上記音声補完情報格納手段に報告し、
上記音声補完情報格納手段は、上記無線端末からの報告に基づいて音声情報を登録する音声補完方法。The speech complementing method according to claim 2 or 4,
The voice complementary information storage means accumulates either voice information or voice information with high appearance frequency, notifies the telephone terminal of the stored voice information or information for transmitting the voice information,
The telephone terminal reports the selection result to the voice supplement information storage means after the voice information to be registered in the voice supplement information storage means is selected by the user based on the notification,
The voice supplement information storage means registers voice information based on a report from the wireless terminal.
上記電話端末は、上記音声補完情報格納手段に登録させるべき音声情報がユーザにて選択された後、その選択結果に基づいて得られる音声情報を登録する音声補完方法。The speech completion method according to claim 5,
The telephone terminal is a voice supplement method for registering voice information obtained based on a selection result after voice information to be registered in the voice supplement information storage unit is selected by a user.
上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、音声補完情報格納手段は、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出して、その抽出した音声情報と同一の音声情報を再生させるための指示となる信号を上記電話端末に送信し、
上記電話端末は、上記指示に従って予め登録されている音声情報の再生を行う音声補完方法。The speech completion method according to any one of claims 1 to 6,
When the user's voice is input while the telephone terminal and the other telephone terminal are performing voice communication, the voice supplement information storage means stores the voice information including the voice information transmitted from the telephone terminal. Extracted from the voice information registered in the voice complementary information storage means, and sends a signal to the telephone terminal as an instruction to reproduce the same voice information as the extracted voice information,
An audio complementing method in which the telephone terminal reproduces audio information registered in advance according to the instruction.
上記音声補完情報格納手段は、該音声補完情報格納手段で抽出された音声情報と同一の音声情報を再生させるための指示を上記電話端末に対して送信するときに、上記電話端末が上記音声補完情報格納手段からの指示に基づいて音声情報を再生している間、音声情報の送信を停止させる指示を上記電話端末に送信し、
上記電話端末は、上記指示に従って予め登録されている音声情報の再生を行っている間、ユーザからの音声入力に係らず音声送信を停止する音声補完方法。The speech completion method according to claim 7,
The voice supplement information storage means transmits the instruction for reproducing the same voice information as the voice information extracted by the voice complement information storage means to the voice terminal when the telephone terminal transmits the voice complement information. While reproducing the audio information based on the instruction from the information storage means, an instruction to stop the transmission of the audio information is transmitted to the telephone terminal,
A voice complementing method in which the telephone terminal stops voice transmission regardless of voice input from a user while playing back voice information registered in advance according to the instruction.
上記電話端末から音声情報を所定通信網に接続された音声補完情報格納手段に予め登録し、
上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出し、
その抽出された音声情報を上記電話端末及び他方の電話端末に送信する音声補完方法。In the voice complementing method for complementing voice information when a telephone terminal performs voice communication with another telephone terminal via a predetermined communication network,
Voice information from the telephone terminal is registered in advance in voice supplement information storage means connected to a predetermined communication network,
When the user's voice is input while the telephone terminal and the other telephone terminal are performing voice communication, the voice information including the voice information transmitted from the telephone terminal is registered in the voice complementary information storage unit. Extracted from the audio information,
A speech complementing method for transmitting the extracted speech information to the telephone terminal and the other telephone terminal.
上記電話端末として所定の通信網に接続される移動端末装置を用いる音声補完方法。The speech completion method according to any one of claims 1 to 9,
A speech complementing method using a mobile terminal device connected to a predetermined communication network as the telephone terminal.
所定通信網に接続され、上記電話端末からの音声情報を予め登録する音声補完情報格納手段と、
上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出する音声情報抽出手段と、
その抽出された音声情報を上記他方の電話端末に送信する音声情報送信手段とを有する音声補完装置。In a speech complementing apparatus that supplements speech information when a telephone terminal performs voice communication with another telephone terminal via a predetermined communication network,
Voice complementary information storage means connected to a predetermined communication network and pre-registering voice information from the telephone terminal;
When the user's voice is input while the telephone terminal and the other telephone terminal are performing voice communication, the voice information including the voice information transmitted from the telephone terminal is registered in the voice complementary information storage unit. Voice information extraction means for extracting from the voice information that has been made,
A speech complementing device comprising speech information transmitting means for transmitting the extracted speech information to the other telephone terminal.
上記音声補完情報格納手段は、上記電話端末から送信された音声情報を含む音声情報を抽出した際に、その抽出した音声情報を上記電話端末に送信する第1の音声情報送信手段を有する音声補完装置。The speech complementing device according to claim 11,
The voice complement information storage means includes first voice information transmission means for sending voice information including voice information transmitted from the telephone terminal to the telephone terminal when the voice information including the voice information is extracted. apparatus.
上記音声補完情報格納手段は、上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザから送信される音声情報のうち出現頻度の高い音声情報を抽出して自動登録する音声情報自動登録手段を有する音声補完完装置。The speech supplement apparatus according to claim 11 or 12,
The voice complement information storage means extracts voice information that is frequently registered from voice information transmitted from the user and automatically registers when the telephone terminal and the other telephone terminal are performing voice communication. A speech completion device having automatic information registration means.
上記音声補完情報格納手段は、音声情報または出現頻度の高い音声情報のいずれかを抽出した際に、該抽出で得られた音声情報または該音声情報を伝達するための情報を上記電話端末に通知する音声情報通知手段と、
上記電話端末が上記音声補完情報格納手段に登録させるべき音声情報を選択した際に送信する報告に基づいて音声情報を登録する音声補完装置。The speech supplement device according to any one of claims 11 to 13,
The voice supplement information storage means, when extracting either voice information or voice information having a high appearance frequency, notifies the telephone terminal of voice information obtained by the extraction or information for transmitting the voice information. Voice information notification means for
A speech complementing apparatus for registering speech information based on a report transmitted when the telephone terminal selects speech information to be registered in the speech complementing information storage unit.
上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、音声補完情報格納手段は、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出してその抽出した音声情報と同一の音声情報を再生させるための指示となる信号を上記電話端末に送信する再生指示手段を有する音声補完装置。The speech complementation device according to any one of claims 11 to 14,
When the user's voice is input while the telephone terminal and the other telephone terminal are performing voice communication, the voice supplement information storage means stores the voice information including the voice information transmitted from the telephone terminal. A speech complementing device having a playback instruction means for extracting from the speech information registered in the speech complementation information storage means and transmitting a signal serving as an instruction for reproducing the same speech information as the extracted speech information to the telephone terminal .
上記音声補完情報格納手段は、該音声補完情報格納手段で抽出された音声情報と同一の音声情報を再生させるための指示を上記電話端末に対して送信するときに、上記電話端末が上記音声補完情報格納手段からの指示に基づいて音声情報を再生している間、音声情報の送信を停止させる指示を上記電話端末に送信する音声送信停止指示手段を有する音声補完装置。The speech complementation device according to any one of claims 11 to 15,
The voice supplement information storage means transmits the instruction for reproducing the same voice information as the voice information extracted by the voice complement information storage means to the voice terminal when the telephone terminal transmits the voice complement information. A voice complementing apparatus comprising voice transmission stop instruction means for sending an instruction to stop transmission of voice information to the telephone terminal while reproducing voice information based on an instruction from the information storage means.
所定通信網に接続され、上記電話端末からの音声情報を予め登録する音声補完情報格納手段と、
上記電話端末と他方の電話端末とが音声通信を行っている際に、ユーザの音声が入力されたとき、上記電話端末から送信された音声情報を含む音声情報を該音声補完情報格納手段に登録されている音声情報から抽出する音声情報抽出手段と、
その抽出された音声情報を上記電話端末及び他方の電話端末に送信する第2の音声情報送信手段を有する音声補完装置。In a speech complementing apparatus that supplements speech information when a telephone terminal performs voice communication with another telephone terminal via a predetermined communication network,
Voice complementary information storage means connected to a predetermined communication network and pre-registering voice information from the telephone terminal;
When the user's voice is input while the telephone terminal and the other telephone terminal are performing voice communication, the voice information including the voice information transmitted from the telephone terminal is registered in the voice complementary information storage unit. Voice information extraction means for extracting from the voice information that has been made,
A speech complementing device comprising second speech information transmitting means for transmitting the extracted speech information to the telephone terminal and the other telephone terminal.
上記所定通信網には、上記電話端末が音声通信を行う際に音声情報の補完を行う音声補 完装置が接続され、上記音声補完装置には、上記電話端末からの音声情報が音声補完情報格納手段に予め登録され、上記電話端末から送信された音声情報を含む音声情報を音声補完情報格納手段に登録されている音声情報から抽出し、抽出された音声情報を上記他方の電話端末に送信し、
上記電話端末は、上記音声補完情報格納手段にて送信された音声情報を受信して登録する第1登録手段を有する電話端末。In a telephone terminal that communicates with other telephone terminals via a predetermined communication network,
The aforementioned predetermined communication network, the telephone terminal is connected to the voice complements apparatus for performing complementary audio information when performing voice communication, the aforementioned speech complementary device, audio information stored voice complementary information from the telephone terminal Voice information including voice information registered in advance in the means and transmitted from the telephone terminal is extracted from the voice information registered in the voice supplement information storage means, and the extracted voice information is transmitted to the other telephone terminal. ,
The telephone terminal, the telephone terminal having a first registration means for registering to receive audio information transmitted hand the speech complementary information stored hand stage.
上記電話端末は、上記音声補完情報格納手段にて抽出された出現頻度の高い音声情報を該音声補完情報格納手段より受信して登録する第2登録手段を有する電話端末。The telephone terminal according to claim 18,
The telephone terminal has second registration means for receiving and registering voice information with a high appearance frequency extracted by the voice supplement information storage means from the voice supplement information storage means.
上記電話端末は、上記音声補完情報格納手段の音声情報通知手段からの通知に基づいて上記音声補完情報格納手段に登録させるべき音声情報の選択がユーザにてなされる音声情報選択手段と、
その選択結果を該音声補完情報格納手段に報告する報告手段と
を有する電話端末。The telephone terminal according to claim 18 or 19,
The telephone terminal includes: a voice information selection unit that allows a user to select voice information to be registered in the voice supplement information storage unit based on a notification from the voice information notification unit of the voice supplement information storage unit;
A telephone terminal having reporting means for reporting the selection result to the voice complementary information storage means.
上記電話端末は、上記音声補完情報格納手段に登録させるべき音声情報がユーザにて選択された後、その選択結果に基づいて得られる音声情報を登録する第3登録手段
を有する電話端末。The telephone terminal according to any one of claims 18 to 20,
The telephone terminal has third registration means for registering voice information obtained based on a selection result after voice information to be registered in the voice complementary information storage means is selected by a user.
上記電話端末は、上記音声補完情報格納手段の再生指示手段によって指示される指示内容に従って予め登録されている音声情報の再生を行う音声再生手段を有する電話端末。The telephone terminal according to any one of claims 18 to 21,
The telephone terminal includes a voice reproduction unit that reproduces voice information registered in advance according to the instruction content instructed by the reproduction instruction unit of the voice supplement information storage unit.
上記電話端末は、上記音声補完情報格納手段の送信停止手段にて指示される指示内容に従って予め登録されている音声情報の再生を行っている間、ユーザからの音声入力に係らず音声送信を停止する送信停止手段を有する電話端末。The telephone terminal according to any one of claims 18 to 22,
The telephone terminal stops the voice transmission regardless of the voice input from the user while reproducing the voice information registered in advance according to the instruction contents instructed by the transmission stopping means of the voice complementary information storing means. A telephone terminal having a transmission stop means.
上記電話端末として所定の通信網に接続される移動端末装置を用いる電話端末。The telephone terminal according to any one of claims 18 to 23,
A telephone terminal using a mobile terminal device connected to a predetermined communication network as the telephone terminal.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001190422A JP3885989B2 (en) | 2001-06-22 | 2001-06-22 | Speech complementing method, speech complementing apparatus, and telephone terminal device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001190422A JP3885989B2 (en) | 2001-06-22 | 2001-06-22 | Speech complementing method, speech complementing apparatus, and telephone terminal device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2003008745A JP2003008745A (en) | 2003-01-10 |
| JP3885989B2 true JP3885989B2 (en) | 2007-02-28 |
Family
ID=19029193
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001190422A Expired - Fee Related JP3885989B2 (en) | 2001-06-22 | 2001-06-22 | Speech complementing method, speech complementing apparatus, and telephone terminal device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3885989B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006038955A (en) * | 2004-07-22 | 2006-02-09 | Docomo Engineering Tohoku Inc | Voiceprint recognition system |
-
2001
- 2001-06-22 JP JP2001190422A patent/JP3885989B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2003008745A (en) | 2003-01-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6424945B1 (en) | Voice packet data network browsing for mobile terminals system and method using a dual-mode wireless connection | |
| KR101136769B1 (en) | Voice and text communication system, method and apparatus | |
| US7072686B1 (en) | Voice controlled multimedia and communications device | |
| KR100804855B1 (en) | Method and apparatus for voice controlled foreign language translator | |
| KR100387918B1 (en) | Interpreter | |
| JP2007529916A (en) | Voice communication with a computer | |
| CN113194203A (en) | Communication system, answering and dialing method and communication system for hearing-impaired people | |
| CN121662019A (en) | Speech processing method, device, system, storage medium and program product | |
| US20100017193A1 (en) | Method, spoken dialog system, and telecommunications terminal device for multilingual speech output | |
| US7164934B2 (en) | Mobile telephone having voice recording, playback and automatic voice dial pad | |
| JP3885989B2 (en) | Speech complementing method, speech complementing apparatus, and telephone terminal device | |
| JP2002057752A (en) | Mobile terminal device | |
| US8271110B2 (en) | Sound source supply apparatus and sound source supply method | |
| KR20080054591A (en) | Call service method of mobile terminal | |
| KR100553437B1 (en) | Wireless communication terminal having voice message transmission function using speech synthesis and method thereof | |
| JP3362615B2 (en) | Mobile phone and voice data transmission method | |
| KR100578724B1 (en) | Sound Providing System and Method for Telephones | |
| JP2005222410A (en) | On-vehicle handsfree mail apparatus | |
| CN111274828A (en) | Language translation method, system, computer program and handheld terminal based on message leaving | |
| JP5326539B2 (en) | Answering Machine, Answering Machine Service Server, and Answering Machine Service Method | |
| JP2002344572A (en) | Mobile phone terminal, program, recording medium storing program | |
| JP2002218016A (en) | Portable telephone set and translation method using the same | |
| JP2002051116A (en) | Mobile communication device | |
| JP2008060776A (en) | Portable terminal device, recording notification method thereby, and communication system | |
| KR20060018148A (en) | Communication device and method for speech impaired in mobile terminal |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041004 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060901 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060912 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061005 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061114 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061116 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101201 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101201 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111201 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111201 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121201 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |