JP4003544B2 - Display / voice linkage system, server and method - Google Patents
Display / voice linkage system, server and method Download PDFInfo
- Publication number
- JP4003544B2 JP4003544B2 JP2002166294A JP2002166294A JP4003544B2 JP 4003544 B2 JP4003544 B2 JP 4003544B2 JP 2002166294 A JP2002166294 A JP 2002166294A JP 2002166294 A JP2002166294 A JP 2002166294A JP 4003544 B2 JP4003544 B2 JP 4003544B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- voice
- server
- web page
- terminal device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、ユーザの個人情報を用いることなくWebページの表示による表示サービスと音声対話を行うことによる音声サービスとの連携を図ることができる表示・音声連携システム、表示・音声連携サーバ、および表示・音声連携方法に関する。
【0002】
【従来の技術】
従来から、インターネットなどの通信ネットワークに接続されているWWW(World Wide Web)サーバによるWebページの表示を利用した表示サービスと、公衆電話回線などの通信ネットワークに接続されている音声対話サーバによる音声対話機能を用いた音声サービスとを連携させた表示・音声連携システムが利用されている。
【0003】
図8は、従来の表示・音声連携システムの構成例を示すブロック図である。表示・音声連携システム100は、表示サービスを実行するWWWサーバ120と、音声サービスを実行する音声対話サーバ130と、ブラウザ機能141および通話機能142を備えた例えば携帯電話端末などのユーザ端末140とを含む。ここでは、WWWサーバ120は、着信メロディ(電話機での着信時に着信音として用いられるメロディ)を提供するための着信メロディ提供サイトを運営しているものとする。WWWサーバ120およびユーザ端末140は、それぞれ、インターネットなどの通信ネットワーク150に接続される。また、音声対話サーバ130およびユーザ端末140は、公衆電話回線網160に接続される。なお、公衆電話回線網160は、通信ネットワーク150に接続されている。
【0004】
次に、表示・音声連携システム100の動作例について説明する。ユーザ端末140は、ユーザの操作に応じて、ブラウザ機能141を用いてWWWサーバ120が提供する着信メロディ提供サイトにアクセスし、着信メロディ提供サイトにおける着信メロディを選択するためのWebページを自己が備える表示装置に表示する。このWebページには、着信メロディとして取得しようとするメロディのタイトル(以下、「着信メロディのタイトル」という)を入力するためのタイトル入力領域が含まれる。
【0005】
次いで、ユーザ端末140は、ユーザからの指示があると、通話機能142を用いて音声対話サーバ130に発呼する。ユーザ端末140と音声対話サーバ130との接続が確立すると、音声対話サーバ130は、ユーザが取得を希望している着信メロディのタイトルを特定するための音声対話処理を実行する。音声対話処理によって着信メロディのタイトルが特定され、音声対話処理が終了すると、音声対話サーバ130は、音声対話処理によって特定された着信メロディのタイトルを示す情報を例えば専用回線などの通信ネットワークを介してWWWサーバ120に送信する。
【0006】
また、音声対話処理が終了すると、ユーザ端末140は、ブラウザ機能141を用いてWWWサーバ120が提供する着信メロディ提供サイトにアクセスし、Webページの更新を要求する。WWWサーバ120は、Webページの更新要求に応じて、音声対話サーバから取得した着信メロディのタイトルを示す情報を反映させたWebページを示すデータを送信する。すると、ユーザ端末140の表示装置に、着信メロディを選択するためのWebページが、タイトル入力領域にタイトルが表示された状態で表示される。つまり、ユーザ端末140の表示装置に表示されているWebページのタイトル入力領域に、ユーザ端末140と音声対話サーバ130との間で実行された音声対話によって特定された着信メロディのタイトルが入力されたことになる。
【0007】
このように、表示・音声連携システムを利用することで、例えば、携帯電話端末などのユーザ端末が備える表示装置に表示されている情報入力領域への情報入力を、音声を発声することによって行うことができる。
【0008】
【発明が解決しようとする課題】
上記のような表示・音声連携システムにおいては、WWWサーバによる表示サービスと音声サーバによる音声サービスは通信経路が異なるため、WWWサーバと音声サーバとを関連付けて、表示サービスと音声サービスとの連携を図る必要がある。従来は表示サービスと音声サービスとの連携は、例えば特開2001−268241に開示されているシステムのように、表示・音声連携システムを利用するユーザ端末における音声通話のための発信者番号にもとづいて図られている。
【0009】
従って、表示・音声連携システムを利用するためには、WWWサーバによる表示サービスを利用して使用する端末装置の電話番号をあらかじめ登録しておく必要があった。このように、個人情報を開示したあとでなければ表示・音声連携システムを利用することができないため、表示・音声連携システムの利用を促進することが困難であるという問題があった。
【0010】
また、表示・音声連携システムが提供するサービスを受けるときには、そのサービスの提供のために必要とされているか否かにかかわらず、ログイン操作が必要であった。ログイン操作は、電話番号を入力することで行われたり、WWWサーバに電話番号を登録するユーザ登録の際に定められたユーザ名を入力することで行われる。このように、表示・音声連携システムを利用する度にログイン操作を行わなければならなず、ユーザにとって煩わしい操作を強いられるという問題があった。
【0011】
本発明は上述した問題を解消し、個人情報を開示することなく簡単な操作で表示と音声の連携サービスを受けることができるようにすることを目的とする。
【0012】
【課題を解決するための手段】
上記の問題を解決するために、本発明の表示・音声連携システム(例えば表示・音声連携システム10)は、通信ネットワークに接続される端末装置(例えばユーザ端末40)と、Webページを用いて情報の提供や収集を行うWWWサーバ(例えばWWWサーバ20)と、通信ネットワークを介して音声による情報の入出力によって音声対話処理を実行する音声対話サーバ(例えば音声対話サーバ30)とを備えた表示・音声連携システムであって、端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、Webページを表示するためのWebページデータは、音声対話サーバに向けて発呼するための発呼データ(例えば電話番号データ)を含み、WWWサーバは、端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データ(例えば図4に示すデータ)として使用する文字列データを決定し、セッション情報及び端末装置についての通信管理情報(例えばCookieなどのセッション識別子)に連携データを対応付けしてセッションデータベースに保存するとともに(例えばステップS103)、連携データを発呼データに関連付けしてWebページデータに設定したあと(例えばステップS104)、連携データが設定されたWebページデータを端末装置に向けて送信する処理(例えばステップS105)を実行し、端末装置は、受信したWebページデータにもとづいてWebページを表示するブラウザ機能(例えばブラウザ機能41)と、ユーザからの要求に応じてWebページデータに含まれている発呼データを用いて音声対話サーバに向けて発呼し、当該発呼データに関連付けされている連携データとしての文字列データにもとづくトーンを出力する通話機能(例えば通話機能42)とを有し、音声対話サーバは、端末装置からのトーンを文字列データとすることで連携データを生成し(例えばステップS110)、生成した連携データをWWWサーバに送信し、WWWサーバは、さらに、セッションデータベースが記憶するセッション情報のうち、音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、端末装置が要求した音声によるサービスの判断結果を音声対話サーバに送信し、音声対話サーバは、さらに、WWWサーバから受信した判断結果に基づいて生成した連携データを用いて音声対話処理の実行内容を決定する(例えばステップS111)ようにしたものである。
WWWサーバは、音声対話サーバから受信した連携データに対応するセッション情報を特定すると、特定したセッション情報の中から、音声対話サーバから受信した連携データと同一の連携データが設定されているWebページデータを特定し、特定したWebページデータから端末装置が要求した音声によるサービスがいずれのサービスであるかを判断する構成とされてもよい。
セッションデータベースは、セッション情報及び通信管理情報を連携データに対応付けて記憶する構成とされてもよい。
WWWサーバは、数字又は記号からなる文字列を更新する文字列カウンタが更新した文字列を抽出することによって、連携データとして文字列を決定する構成とされてもよい。
【0013】
上記の構成としたことで、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザは、個人情報を開示することなく簡単な操作で表示と音声の連携サービスを受けることができるようになる。
【0014】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定する構成とされていてもよい。
【0015】
上記の構成としたことで、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0016】
WWWサーバが、端末装置からのWebページの取得要求に応じて文字列データを生成し(例えばステップS102)、生成した文字列データを使用する連携データに決定する構成とされていてもよい。
【0017】
上記の構成としたことで、WWWサーバが生成した連携データを用いて、WWWサーバと音声対話サーバとの連携を図ることができる。
【0018】
音声対話サーバが、音声対話処理を実行し、音声対話処理結果を示す音声対話処理結果データを、生成した連携データと同一の連携データが対応付けされている端末装置についての通信管理情報に対応付けしてシステム内(例えばWWWサーバ20、データベースサーバ)に保存するための処理(例えばWWWサーバ20に向けて連携データおよび音声対話処理結果データを送信する処理)を実行するように構成されていてもよい。
【0019】
上記の構成としたことで、音声対話サーバによる音声対話処理の結果を、音声対話処理によるサービスを受けた端末装置に関する情報に関連付けしてシステム内に保存しておくことができる。よって、WWWサーバが、端末装置に関する情報を特定することによって、その端末装置によって行われた音声対話の結果を示す情報を取得することができる。
【0020】
WWWサーバが、端末装置からのWebページ取得要求に応じて、端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを送信するように構成されていてもよい。
【0021】
上記の構成としたことで、音声対話処理の結果を、Webページに反映させることができる。
【0022】
WWWサーバが、端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを端末装置に送信するように構成されていてもよい。
【0023】
上記の構成としたことで、Webページ取得要求を端末装置に行わせることなく、音声対話処理の結果を、Webページに反映させることができる。
【0024】
連携データは、文字に対応したトーンが端末装置にて発せられる当該文字を任意に組合せた複数の文字からなる文字列データであるように構成されていてもよい。
【0025】
上記の構成としたことで、文字列データとして通信ネットワークを介して連携データを送受することができるとともに、音データとして通信ネットワークを介して連携データを送受することができる。
【0026】
通信管理情報として、端末装置に対応して管理されている端末管理情報(例えばCookie)が用いられる構成とされていてもよい。
【0027】
上記の構成としたことで、端末管理情報に対応付けして連携データなどの各種の情報を保存しておくことができる。
【0028】
また、本発明の表示・音声連携サーバは、Webページを用いて情報の提供や収集を行うWWWサーバ(例えばWWWサーバ20)と、通信ネットワークを介して音声による情報の入出力によって音声対話処理を実行する音声対話サーバ(例えば音声対話サーバ30)とを備えた表示・音声連携サーバ(例えばWWWサーバ20と音声対話サーバ30とからなるサーバ)であって、通信ネットワークに接続される端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、Webページを表示するためのWebページデータは、音声対話サーバに向けて発呼するための発呼データを含み、WWWサーバは、端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして文字列データを決定し、セッション情報及び端末装置についての通信管理情報に生成した連携データを対応付けしてセッションデータベースに保存するとともに、生成した連携データを発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行し、音声対話サーバは、端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて、当該端末装置との接続を確立するための処理を実行し、接続が確立されている端末装置によって発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、セッションデータベースが記憶するセッション情報のうち、生成した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、判断結果に基づいて音声対話処理の実行内容を決定するようにしたものである。
【0029】
上記の構成としたことで、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザに対して、個人情報を開示させることなく簡単な操作で行うことができる表示と音声の連携サービスを提供することができる。
【0030】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定するように構成されていてもよい。
【0031】
上記の構成としたことで、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0032】
また、本発明の表示・音声連携方法は、Webページを用いて情報の提供や収集を行うWWWサーバ(例えばWWWサーバ20)と、通信ネットワークを介して音声による情報の入出力によって音声対話処理を実行する音声対話サーバ(音声対話サーバ30)との連携を図るための表示・音声連携方法であって、Webページを表示するためのWebページデータは、音声対話サーバに向けて発呼するための発呼データを含み、WWWサーバは、通信ネットワークに接続された端末装置(例えばユーザ端末40)からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして文字列データを決定し(例えばステップS102)、端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報、及び端末装置についての通信管理情報に、生成した連携データを対応付けしてセッションデータベースに保存するとともに(例えばステップS103)、生成した連携データを発呼データに関連付けしてWebページデータに設定したあと(例えばステップS104)、生成した連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行し(例えばステップS104)、音声対話サーバが、端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて、当該端末装置との接続を確立するための処理を実行し、接続が確立されている端末装置によって発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し(例えばステップS110)、生成した連携データをWWWサーバに送信し、WWWサーバは、さらに、セッションデータベースが記憶するセッション情報のうち、音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、端末装置が要求した音声によるサービスの判断結果を音声対話サーバに送信し、音声対話サーバは、さらに、WWWサーバから受信した判断結果に基づいて生成した連携データを用いて音声対話処理の実行内容を決定する(例えばステップS111)ものである。
【0033】
上記の構成としたことで、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザに対して、個人情報を開示させることなく簡単な操作で行うことができる表示と音声の連携サービスを提供することができる。
【0034】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定するように構成されていてもよい。
【0035】
上記の構成としたことで、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0036】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本発明の一実施形態である表示・音声連携システム10の構成の例を示すブロック図である。表示・音声連携システム10は、WWWサーバ20と、音声対話サーバ30と、ユーザ端末40とを含む。WWWサーバ20およびユーザ端末40は、それぞれ、インターネットなどの通信ネットワーク50に接続される。また、音声対話サーバ30およびユーザ端末40は、公衆電話回線網60に接続される。なお、公衆電話回線網60は、通信ネットワーク50に接続されている。以下の説明において、公衆電話回線網60含むネットワークを通信ネットワーク50ということがある。
【0037】
WWWサーバ20は、例えばインターネットサーバなどの情報処理装置により構成される。WWWサーバ20は、例えばHTML(Hypertext Markup Language)などのマークアップ言語により作成されたWebページデータを管理し、Webページデータにもとづいて表示されるWebページを用いて、各種の情報の提供や取得を行う機能を有している。Webページには、例えば、商品の受注を行うためのものや、アンケートの回収を行うためのものなどがある。
【0038】
WWWサーバ20は、本例では、Cookieと呼ばれるユーザを識別するための文字列情報を利用して本システムを利用する各ユーザを管理する。ここで、Cookieを利用してユーザ管理を行う場合の処理について簡単に説明する。先ず、WWWサーバ20は、Cookieを生成し、ユーザ端末(例えばユーザ端末40、具体的には、ユーザ端末40に搭載されているブラウザ)に向けて送信する。Cookieを取得すると、ユーザ端末は、Cookieが格納されたファイル(Cookieファイル)を保存する。その後は、ユーザ端末は、WWWサーバ20にアクセスする際に、ユーザ端末に搭載されているブラウザの機能によってCookieファイルを送信する。WWWサーバ20は、取得したCookieファイルによって、ユーザに関する情報を認識する。このようにしてユーザに関する情報を認識することができるため、WWWサーバ20は、最新のユーザ情報を把握することができるようになる。
【0039】
また、WWWサーバ20は、Webページを表示するためのWebページデータの他、各ユーザ端末についてのセッション(ユーザ端末とWWWサーバとの間で行われた一連の処理の流れ)を示すセッション情報、各ユーザ端末に付与されているセッション識別子(各ユーザ端末の通信履歴などの通信に関する各種の情報をユーザ端末毎に管理するために用いられる通信管理情報の一例)、後述する連携データなどが格納されるデータベース21を備えている(図5参照)。なお、本例では、セッション識別子として、上述したCookieが用いられる。また、各セッション情報は、それぞれ、セッション情報が示すセッションに関与したユーザ端末についてのセッション識別子に対応付けされている。従って、セッション識別子に対応付けされているセッション情報は、そのセッション識別子が示すユーザ端末と、WWWサーバ20とのセッションを示す情報である。
【0040】
音声対話サーバ30は、一般公衆回線網60を介して入力した音声データが示す音声を認識する音声認識機能と、文字情報にもとづいて音声合成して音声データ出力を行う音声合成機能とを有する。音声対話サーバ30は、音声認識機能と音声合成機能とを用いて、音声よる情報の伝達や情報の取得を行う音声対話処理を実行する。この例では、音声対話サーバ30は、WWWサーバ20と連携して各種のサービスを提供する。例えば、WWWサーバ20が運営しているWebページに設けられている情報入力領域に入力される情報を、音声対話処理によって取得するサービスを行う。この音声対話サーバ30は、音声認識や音声合成を行うための辞書データを有している。
【0041】
ユーザ端末40は、図1に示すように、一般公衆回線網60を介して接続先との間で音声通話を行うための通話機能41を有するとともに、自己が備える例えばLCD(Liquid Crystal Display)などの表示装置にWebページを表示したり、自己が備える入力装置を用いてWebページ上で文字入力や情報選択を行うためのブラウザ機能42を有している。ユーザ端末40は、例えばPDC(Personal Digital Cellular)規格に準拠したディジタル携帯電話などの携帯電話端末によって構成される。ユーザ端末40は、通信ネットワーク50への接続や、通信ネットワーク50を利用した情報の送受などを行うことができる環境(例えばブラウザなどのソフトウェアや、ハードウェアなどにおける環境)を備えている。
【0042】
次に、本例の表示・音声連携システム10の動作について図面を参照して説明する。図2、図3は、本例の表示・音声連携システム10における表示・音声連携処理および処理タイミングの一例を示すタイミングチャートである。
【0043】
先ず、ユーザ端末40は、ユーザの操作に応じて、通信ネットワーク50を介してWWWサーバ20にアクセスする(ステップS101)。例えば、WWWサーバ20が提供しているWebページのURL(Uniform Resource Locator)を指定することでアクセスする。
【0044】
ユーザ端末40からのアクセスがあり、Webページを表示するためのWebページデータの取得要求があった場合には、WWWサーバ20は、先ず、音声対話サーバ30との連携を図るための連携データを生成する(ステップS102)。連携データは、例えば図4に示すように、特定のトーンを発することを電話機に指定することができる数字や記号(例えば「#」)を、複数個任意に組合せた文字列によって構成される。この例では、連携データは、既に生成されて保存している他の連携データの何れにも一致しない文字列となるように生成される。
【0045】
なお、この例では、Webページデータには、音声対話サーバ30との音声対話による処理を選択するための音声対話選択領域をWebページ上に表示するための音声対話選択領域表示データと、音声対話サーバ30に向けて発呼するための電話番号を示す電話番号データとが、互いに関連付けされた状態で含まれている。すなわち、音声対話選択領域表示データと電話番号データとが、マークアップ言語によってWebページデータ内に表記されている。また、Webページデータ内に、マークアップ言語によって、音声対話選択領域表示データが示す音声対話選択領域が選択されると、電話番号データが示す電話番号を用いて発呼を行うように指示する記述がなされている。
【0046】
次いで、WWWサーバ20は、生成した連携データを、ユーザ端末30についてのセッション識別子に対応付けた状態でデータベース21に保存する(ステップS103)。図5は、データベース21の格納状態の例を示す説明図である。図5に示すように、各セッション識別子に対応付けされた状態で、セッション情報、連携データ、音声対話結果情報などの各種の情報が格納されている。従って、連携データに対応するセッション情報やセッション識別子を確認することで、その連携データが設定されたWebページデータをどのユーザ端末が取得したかを特定することができるようになる。
【0047】
また、WWWサーバ20は、生成した連携データを、ユーザ端末40に送信するWebページデータの中に設定する(ステップS104)。具体的には、マークアップ言語で構成されているWebページデータ内の所定の箇所に、連携データを表記する処理を行う。この例では、連携データは、Webページデータに含まれている音声対話サーバ30の電話番号を示す電話番号データに関連付けされた状態で設定される。
【0048】
次いで、WWWサーバ20は、連携データを設定したWebページデータを、ユーザ端末40に向けて通信ネットワーク50を介して送信する(ステップS105)。送信されるWebページデータには、音声対話サーバ30の電話番号を示す電話番号データと、ステップS102で生成された連携データとが含まれている。
【0049】
ユーザ端末40は、Webページデータを受信すると、ブラウザ機能41によって、受信したWebページデータにもとづくWebページを自己が備える表示装置に表示する(ステップS106)。
【0050】
図6は、ユーザ端末40に表示されるWebページの表示状態の例を示す説明図である。ここでは、WWWサーバ20が、チケットの予約受付、チケットの予約内容の変更、チケットの予約の取消しなどのサービスを提供している場合を例に説明する。図6には、チケットの予約内容の変更を行うためのWebページの表示状態の例が示されている。図6に示すように、Webページには、現在のチケットの予約内容を表示する表示領域と、変更後の予約内容を入力する入力領域と、音声対話によって変更後の予約内容を入力することを選択する音声対話選択領域70とが設けられている。
【0051】
Webページにおいて音声対話選択領域70が押下されると、ユーザ端末40のブラウザ機能41は、通話機能42を呼び出し(ステップS107)、音声対話選択領域70を表示させるための音声対話選択領域表示データに関連付けされている電話番号データが示す電話番号を用いて発呼することを指示する。呼び出された通話機能42は、ブラウザ機能41からの指示に従って、Webページデータ内に設定されている電話番号データが示す電話番号を用いて、音声対話サーバ30に向けて発呼を行う(ステップS108)。
【0052】
音声対話サーバ30がユーザ端末40からの発呼に応じて通信回線が接続状態になったことを確認すると、ユーザ端末40は、発呼に用いた電話番号データに関連付けされている連携データが示す文字列にもとづいて、文字列の各文字に対応するトーンを発する処理を実行する(ステップS109)。
【0053】
ユーザ端末40からのトーンが入力すると、音声対話サーバ30は、入力したトーンに対応する文字列を生成することで、文字列による連携データを生成する(ステップS110)。
【0054】
連携データを生成すると、音声対話サーバ30は、生成した連携データを用いて音声対話処理の実行内容を決定する(ステップS111)。具体的には、例えば、音声対話サーバ30は、先ず、生成した連携データをWWWサーバ20に送信し、WWWサーバ20に、ステップS110で生成した連携データと同一の連携データに関連付けされているセッション情報(例えば、最近追加された数バイト分のデータなど、セッション情報の一部であってもよい)をデータベース21から探索させる。次いで、WWWサーバ20は、探索したセッション情報の中からステップS110で生成された連携データと同一の連携データが設定されているWebページデータを特定する。この特定したWebページデータにもとづいて、ユーザ端末40がどのWebページを経由して音声対話サーバ30に向けて発呼を行ったかを確認することができる。WWWサーバ20は、特定したWebページデータから、ユーザ端末40を用いてどのようなサービスを音声によって受けようとしていたかを確認し、その確認結果を音声対話サーバ30に送信する。そして、音声対話サーバ30は、受信した確認結果を示す情報にもとづいて、実行する音声対話処理の内容を決定する。例えば、図6に示したWebページを経由して音声対話サーバ30に向けて発呼を行ったことが特定された場合には、チケットの変更を音声対話によって行うための音声対話処理を実行することに決定する。このようにして、ステップS111での音声対話処理の実行内容が決定されるようにすればよい。
【0055】
なお、ステップS111での音声対話処理の実行内容の決定は、どのようにして行われるようにしてもよい。例えば、本システムを、例えばデータベース21の格納データを管理するデータベースサーバを有する構成とし、音声対話サーバ30がデータベースサーバにアクセスすることで、ユーザ端末40を用いてどのようなサービスを音声によって受けようとしていたかを確認するようにしてもよい。
【0056】
音声対話処理の実行内容を決定すると、音声対話サーバ30は、決定した音声対話処理を実行し、音声対話処理にて、ユーザ端末40に対して音声による情報の報知を行うとともに、ユーザ端末40からの音声を入力して情報を取得する(ステップS112)。
【0057】
音声対話処理を終了すると、音声対話サーバ30は、音声対話処理の結果を示す音声対話処理結果データと、ステップS110にて生成した文字列の連携データをWWWサーバ20に向けて送信する(ステップS113)。WWWサーバ20は、受信した音声対話処理結果データを、受信した連携データと同一の連携データに対応付けされているセッション識別子に対応付けして保存する(ステップS114)。
【0058】
また、音声対話処理を終了すると、ユーザ端末40の通話機能42は、ブラウザ機能41を呼び出す(ステップS115)。呼び出されたユーザ端末40のブラウザ機能41は、WWWサーバ20に対して、ユーザ端末40の表示装置に表示されている表示情報の更新を要求する(ステップS116)。WWWサーバ20は、更新要求に応じて、ユーザ端末40についてのセッション識別子に対応付けされている音声対話処理結果データを読み出して、音声対話処理の結果を反映させたWebページデータを作成する(ステップS117)。そして、音声対話処理の結果を反映させたWebページデータを送信する(ステップS118)。
【0059】
Webページデータを受信すると、ユーザ端末40のブラウザ機能41によって、受信したWebページデータにもとづくWebページが表示される(ステップS119)。Webページの表示内容は、例えば図7に示すように、音声対話処理によって入力された情報の内容が反映された状態となっている。なお、図7は、図6に示すWebページから音声対話が選択され、音声対話処理によってチケット予約の変更内容を示す情報が音声入力されたあと、音声対話処理の結果が反映されたWebページの表示状態の例を示す説明図である。
【0060】
以上説明したように、WWWサーバ20が生成した文字列による連携データを、連携データにもとづくトーンによって音声対話サーバ30に伝達する構成としたので、WWWサーバ20が生成した連携データによって、音声対話サーバ30が、どのWebページを経由してユーザ端末40が接続してきたかを確認することができ、WWWサーバ20によるWebページによるサービスと、音声対話サーバ30による音声対話によるサービスとを連携させることができる。このように、連携データを用いて表示と音声の連携を図っているので、端末装置を使用するユーザは、ユーザ端末の電話番号などの個人情報を開示することなく表示と音声の連携サービスを受けることができるようになる。なお、ユーザ端末40は、音声対話サーバ30に発呼するときに発信者電話番号を通知しなくてよいので、WWWサーバ20だけでなく音声対話サーバ30に対しても個人情報を開示する必要はない。
【0061】
また、上述したように、Cookieと呼ばれるユーザ管理情報(端末管理情報)を用いてユーザ管理(端末管理)を行う構成としているので、ユーザは、ログイン動作の必要のない簡単な操作で表示と音声の連携サービスを受けることができるようになる。
【0062】
また、上述したように、WWWサーバ20が生成した文字列による連携データをセッション情報などに対応付けして保存し、音声対話サーバ30が音声対話結果データを連携データとともに送信する構成としたことで、WWWサーバ20が、音声対話の結果を示す情報を、音声対話を行ったユーザ端末40についてのセッション情報に対応付けして保存することができる。
【0063】
なお、上述した実施の形態では、音声対話処理を実行する音声対話サーバ30を用いる構成とし、音声対話処理を音声認識や音声合成を行うことによって実行するようにしていたが、音声対話処理を人間が行うようにしてもよい。すなわち、音声対話サーバ30の代わりに、オペレーションセンタを備える構成としてもよい。この場合、オペレーションセンタでは、通信回線が接続されたあとに入力したトーンから文字列の連携データを生成する処理などは上述した音声対話サーバ30と同様に実行されるが、音声対話処理はオペレータによって行われる。
【0064】
また、上述した実施の形態では、WWWサーバ20が、Webページデータの送信要求を受けたときに、任意の文字列による連携データを生成する構成としていたが、WWWサーバ20から音声対話サーバ30に向けての一方の連携だけを図るようにする場合(上述した音声・表示連携処理におけるステップS112までの処理を行う場合)には、あらかじめ定められている文字列による連携データを用いる構成としてもよい。この場合、各Webページデータに、それぞれ、あらかじめ定められている所定の連携データ(Webページデータ毎に定められている別個の連携データ)を設定しておくようにすればよい。また、音声対話サーバ30が、各連携データが設定されているWebページデータによるWebページの内容(例えば、チケット予約をするWebページであるなどのような内容)を示す情報が格納されているデータベースを備えるようにすればよい。また、上述したあらかじめ定められている文字列と、WWWサーバ20が、Webページデータの送信要求を受けたときに生成する任意の文字列を組み合わせ、連携データとして用いる構成としてもよい。この場合、音声対話サーバ30が、各連携データが設定されているWebページデータによるWebページの内容(例えば、チケット予約をするWebページであるなどのような内容)を示す情報が格納されているデータベースを備え、音声対話処理結果は任意の文字列と関連付けられシステム内に保存されるようにすればよい。
【0065】
また、上述した実施の形態では、WWWサーバ20が、連携データとしての文字列データを、既に生成されて保存している他の連携データの何れにも一致しない文字列となるように生成する構成としていたが、他の連携データの内容とは無関係に、特定のトーンを発することを電話機に指定することができる数字や記号からなる文字列を更新していく文字更新カウンタ(文字更新手段の一例)から文字列を抽出することで、連携データとしての文字列を生成するようにしてもよい。このように構成しても、連携データとしての文字列の桁数を多くすれば、他の連携データを一致した連携データが生成されることは防止できる。この場合、文字更新カウンタは、例えば、0〜9の数字や「♯」などの記号の組合せからなる所定桁数の文字列をランダムに更新する構成とすればよい。そして、WWWサーバ20が、ステップS102にて、文字更新カウンタから文字列を抽出し、連携データとしての文字列データを生成するようにすればよい。このように構成すれば、連携データとしての文字列データをランダムに決定することができ、自己と前後して他人に付与された連携データであっても、自己に付与された連携データにもとづいて他人の連携データを予測することができないようにすることができる。すなわち、文字列データを規則的な順番で生成する構成とすると、あるユーザ端末に対して付与した連携データと、次にアクセスしてきた他のユーザ端末に付与した連携データとが、連番となってしまう。よって、連携データが付与されたユーザ端末のユーザは、自己に付与された連携データから他人に付与された連携データを容易に予測できてしまう。しかし、文字更新カウンタを用いて連携データを生成する構成とすれば、他人に付与された連携データを予測することは不可能となる。従って、他人に付与された連携データを音声対話サーバ30に送信し、音声対話サーバ30やWWWサーバ20に謝った処理を実行させるような行為は防止される。よって、システム10を安全に運用することができるようになる。
【0066】
なお、文字更新カウンタは、生成する文字列と同じ桁数の文字列をランダムに更新するものに限らず、例えば1桁などの他の桁数の文字あるいは文字列をランダムに更新するものであってもよい。この場合、WWWサーバ20が、生成する文字列の桁数の文字を抽出するまで、文字更新カウンタから文字または文字列を数回抽出し、抽出した文字または文字列を組合せて連携データとしての文字列を生成するようにすればよい。
【0067】
また、上述した実施の形態では、セッション識別子としてCookieを用いる構成としていたが、ブラウザ機能41にCookieを取り扱う機能が搭載されていないユーザ端末により本システムが利用される場合には、WWWサーバ20が、ユーザ端末に向けて送信するWebページデータ(例えばURL)にセッションを識別するためのパラメータを付加することとし、そのパラメータによって各ユーザ端末におけるセッションを管理するようにすればよい。
【0068】
また、上述した実施の形態では、ユーザ端末40が携帯電話端末であるものとして説明していたが、ブラウザ機能と通話機能とをともに備えるものであれば、PDA(Personal Digital Assistants)やパーソナルコンピュータなどの他の端末装置であってもよい。
【0069】
また、上述した実施の形態では、ステップS113にて、音声対話サーバ30が音声対話処理結果データと文字列の連携データをWWWサーバ20に向けて送信する構成としていたが、本システムがデータベース21の格納データを管理するデータベースサーバを有する構成とし、そのデータベースサーバに向けて送信する構成としてもよい。この場合、データベースサーバは、受信した音声対話処理結果データを、受信した連携データと同一の連携データに対応付けされているセッション識別子に対応付けして保存するようにし、WWWサーバ20からの音声対話処理結果の問い合わせに応じて保存している音声対話処理結果データをWWWサーバ20に送信するようにしてもよい。すなわち、データベース21の格納情報は、WWWサーバ20によって管理されていなくてもよく、本システムに含まれる他のサーバ(例えば音声対話サーバ30、データベースサーバ)によって管理されていても、複数のサーバによって共通に管理されていてもよい。つまり、データベース21の格納情報は、本システムで管理できるような状態で保存されていれば、何処にどのような状態で保存されていてもよい。
【0070】
また、上述した実施の形態では、WWWサーバ20が、ユーザ端末40からのWebページ取得要求(ステップS116の表示情報更新要求)に応じて、音声対話処理結果データを取得して(ステップS117)、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを送信する構成(ステップS118)としていたが、音声対話処理結果データを保存したあと(ステップS114)に、ユーザ端末40からのWebページ取得要求の有無に関わらず、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータをユーザ端末40に送信する構成としてもよい。このように構成すれば、Webページ取得要求をユーザ端末40に行わせることなく、音声対話処理の結果を、Webページに反映させることができる。
【0071】
また、上述した実施の形態では、ユーザ端末40が、ステップS108にて音声対話サーバ30に向けて発呼を行い、接続が確立したあとにステップS109にてトーンを発するようにしていたが、ユーザ端末40は電話番号と連携データの文字列によるトーンとを同時に出力し、公衆電話回線網60に接続されている交換機が、ユーザ端末40と音声対話サーバ30との接続が確立したあとにトーンを音声対話サーバ30に向けて出力する構成としてもよい。
【0072】
また、上述した各実施の形態では、Webページデータを生成するための表示用言語としてHTMLを例にしていたが、携帯電話端末のブラウザでWebページの表示などを行うために広く用いられているC-HTML(Compact HTML)などの携帯電話端末用のマークアップ言語や、HDML(Handheld Device Markup Language)、WML(Wireless Markup Language)などの他のマークアップ言語を用いるようにしてもよい。
【0073】
さらに、上述した各実施の形態では、音声サーバ、ユーザ端末ともに公衆電話回線網60に接続されているが、VoIP(Voice over Internet Protocol)等のIPネットワークに接続してもよい。
【0074】
【発明の効果】
以上のように、本発明の表示・音声連携システムによれば、端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、WWWサーバが、端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして使用する文字列データを決定し、セッション情報及び端末装置についての通信管理情報に連携データを対応付けしてセッションデータベースに保存するとともに、連携データを発呼データに関連付けしてWebページデータに設定したあと、連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行する。また、端末装置が、受信したWebページデータにもとづいてWebページを表示するブラウザ機能と、ユーザからの要求に応じてWebページデータに含まれている発呼データを用いて音声対話サーバに向けて発呼し、当該発呼データに関連付けされている連携データとしての文字列データにもとづくトーンを出力する通話機能とを有する。さらに、音声対話サーバが、端末装置からのトーンを文字列データとすることで連携データを生成し、生成した連携データをWWWサーバに送信する。WWWサーバは、さらに、セッションデータベースが記憶するセッション情報のうち、音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、端末装置が要求した音声によるサービスの判断結果を音声対話サーバに送信する。音声対話サーバは、さらに、WWWサーバから受信した判断結果に基づいて音声対話処理の実行内容を決定する。このように構成したことで、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザは、個人情報を開示することなく簡単な操作で表示と音声の連携サービスを受けることができるようになる。
【0075】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定する構成とされているので、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0076】
WWWサーバが、端末装置からのWebページの取得要求に応じて文字列データを生成し、生成した文字列データを使用する連携データに決定する構成とされているので、WWWサーバが生成した連携データを用いて、WWWサーバと音声対話サーバとの連携を図ることができる。
【0077】
音声対話サーバが、音声対話処理を実行し、音声対話処理結果を示す音声対話処理結果データを、生成した連携データと同一の連携データが対応付けされている端末装置についての通信管理情報に対応付けしてシステム内に保存するための処理を実行するように構成されているので、音声対話サーバによる音声対話処理の結果を、音声対話処理によるサービスを受けた端末装置に関する情報に関連付けしてシステム内に保存しておくことができる。
【0078】
WWWサーバが、端末装置からのWebページ取得要求に応じて、端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを送信するように構成されているので、音声対話処理の結果を、Webページに反映させることができる。
【0079】
WWWサーバが、端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを端末装置に送信するように構成されているので、Webページ取得要求を端末装置に行わせることなく、音声対話処理の結果を、Webページに反映させることができる。
【0080】
連携データは、文字に対応したトーンが端末装置にて発せられる当該文字を任意に組合せた複数の文字からなる文字列データであるように構成されているので、文字列データとして通信ネットワークを介して連携データを送受することができるとともに、音データとして通信ネットワークを介して連携データを送受することができる。
【0081】
WWWサーバが、少なくとも1つの文字を更新する文字更新手段を備え、文字更新手段から抽出した文字によって連携データとしての文字列データを決定するように構成されているので、連携データとしての文字列データをランダムに決定することができ、自己と前後して他人に付与された連携データであっても、自己に付与された連携データにもとづいて予測することはできないので、他人に付与された連携データを音声対話サーバに送信して処理を実行させるような行為が防止され、システムを安全に運用することができる。
【0082】
通信管理情報として、端末装置に対応して管理されている端末管理情報が用いられる構成とされているので、端末管理情報に対応付けして連携データなどの各種の情報を保存しておくことができる。
【0083】
また、本発明の表示・音声連携サーバによれば、通信ネットワークに接続される端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、WWWサーバが、端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして文字列データを決定し、セッション情報及び端末装置についての通信管理情報に生成した連携データを対応付けしてセッションデータベースに保存するとともに、生成した連携データを発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行する。また、音声対話サーバが、端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて、当該端末装置との接続を確立するための処理を実行し、接続が確立されている端末装置によって発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、セッションデータベースが記憶するセッション情報のうち、生成した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、判断結果に基づいて音声対話処理の実行内容を決定する。このように構成されているので、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザに対して、個人情報を開示させることなく簡単な操作で行うことができる表示と音声の連携サービスを提供することができる。
【0084】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定するように構成されているので、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0085】
また、本発明の表示・音声連携方法によれば、WWWサーバが、通信ネットワークに接続された端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして文字列データを決定し、端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報、及び端末装置についての通信管理情報に、生成した連携データを対応付けしてセッションデータベースに保存するとともに、生成した連携データを発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行し、音声対話サーバが、端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて、当該端末装置との接続を確立するための処理を実行し、接続が確立されている端末装置によって発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、生成した連携データをWWWサーバに送信し、WWWサーバは、さらに、セッションデータベースが記憶するセッション情報のうち、音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、端末装置が要求した音声によるサービスの判断結果を音声対話サーバに送信し、音声対話サーバは、さらに、WWWサーバから受信した判断結果に基づいて音声対話処理の実行内容を決定するので、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザに対して、個人情報を開示させることなく簡単な操作で行うことができる表示と音声の連携サービスを提供することができる。
【0086】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定するように構成されているので、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【図面の簡単な説明】
【図1】 本発明の一実施の形態における表示・音声連携システムの構成の例を示すブロック図である。
【図2】 本発明の一実施の形態における表示・音声連携処理および処理タイミングの一例を示すタイミングチャートである。
【図3】 本発明の一実施の形態における表示・音声連携処理および処理タイミングの一例を示すタイミングチャートである。
【図4】 連携データの一例を示す説明図である。
【図5】 データベースの格納状態の例を示す説明図である。
【図6】 Webページの表示状態の例を示す説明図である。
【図7】 音声対話処理結果が反映されたWebページの表示状態の例を示す説明図である。
【図8】 従来の表示・音声連携システムの構成の例を示すブロック図である。
【符号の説明】
10 表示・音声連携システム
20 WWWサーバ
21 データベース
30 音声対話サーバ
40 ユーザ端末
41 ブラウザ機能
42 通話機能
50 通信ネットワーク
60 一般公衆電話回線
70 音声対話選択領域[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a display / speech cooperation system, a display / speech cooperation server, and a display capable of cooperating with a display service by displaying a web page and a voice service by performing a voice dialogue without using personal information of the user -Concerning voice linkage methods.
[0002]
[Prior art]
Conventionally, a display service using display of a Web page by a WWW (World Wide Web) server connected to a communication network such as the Internet, and a voice dialog by a voice dialog server connected to a communication network such as a public telephone line. A display / speech linkage system linked with a voice service using a function is used.
[0003]
FIG. 8 is a block diagram illustrating a configuration example of a conventional display / voice cooperation system. The display / voice cooperation system 100 includes a
[0004]
Next, an operation example of the display / voice cooperation system 100 will be described. The
[0005]
Next, when receiving an instruction from the user, the
[0006]
When the voice interaction process is completed, the
[0007]
In this way, by using the display / voice cooperation system, for example, information input to the information input area displayed on the display device provided in the user terminal such as a mobile phone terminal is performed by uttering voice. Can do.
[0008]
[Problems to be solved by the invention]
In the display / voice cooperation system as described above, since the communication path is different between the display service by the WWW server and the voice service by the voice server, the WWW server and the voice server are associated with each other so as to link the display service and the voice service. There is a need. Conventionally, the linkage between the display service and the voice service is based on the caller number for voice call in the user terminal using the display / voice linkage system, for example, as in the system disclosed in Japanese Patent Laid-Open No. 2001-268241. It is illustrated.
[0009]
Therefore, in order to use the display / voice cooperation system, it is necessary to register in advance the telephone number of the terminal device to be used by using the display service by the WWW server. As described above, since the display / voice linkage system can be used only after the personal information is disclosed, there is a problem that it is difficult to promote the use of the display / voice linkage system.
[0010]
In addition, when receiving a service provided by the display / speech cooperation system, a login operation is required regardless of whether or not the service is required for providing the service. The login operation is performed by inputting a telephone number, or by inputting a user name determined at the time of user registration for registering a telephone number in the WWW server. As described above, there is a problem that a login operation has to be performed every time the display / voice cooperation system is used, and the user is forced to perform a troublesome operation.
[0011]
SUMMARY OF THE INVENTION It is an object of the present invention to solve the above-described problems, and to receive a display and audio linkage service with a simple operation without disclosing personal information.
[0012]
[Means for Solving the Problems]
In order to solve the above problem, the display / voice cooperation system (for example, the display / voice cooperation system 10) of the present invention uses a terminal device (for example, the user terminal 40) connected to the communication network and a Web page to provide information. A display / provided with a WWW server (for example, WWW server 20) that provides and collects and a voice dialog server (for example, voice dialog server 30) that executes voice dialog processing by inputting and outputting information by voice via a communication network A voice linkage system comprising a session database that stores session information indicating a flow of a series of processes performed between a terminal device and a WWW server, and Web page data for displaying a Web page is a voice dialog Including call data (for example, telephone number data) for making a call to the server. In response to a Web page acquisition request from the apparatus, character string data to be used as cooperation data (for example, data shown in FIG. 4) for cooperation with the voice interaction server is determined, and communication about session information and terminal apparatus is performed. The association data is associated with management information (for example, a session identifier such as a cookie) and stored in the session database (for example, step S103), and the association data is associated with the call data and set in the web page data (for example, step). S104), a process of transmitting the Web page data in which the cooperation data is set to the terminal device (for example, step S105), and the terminal device displays a Web page based on the received Web page data ( For example, according to browser function 41) and user requests A call function (for example, calling a voice dialogue server using call data included in Web page data and outputting a tone based on character string data as linkage data associated with the call data) The voice dialogue server generates the linkage data by using the tone from the terminal device as the character string data (for example, step S110).The generated cooperation data is transmitted to the WWW server, and the WWW server furtherOf the session information stored in the session database,Receive from spoken dialogue serverIdentifying session information corresponding to the linked data, determining from the identified session information which service the voice service requested by the terminal device is,The voice service requested by the terminal device is transmitted to the voice dialogue server, and the voice dialogue server further receives the result from the WWW server.The execution content of the voice interaction process is determined using the cooperation data generated based on the determination result (for example, step S111).
When the WWW server specifies session information corresponding to the cooperation data received from the voice interaction server, Web page data in which the same cooperation data as the cooperation data received from the voice interaction server is set from the specified session information. It may be configured to determine which service is the voice service requested by the terminal device from the specified Web page data.
The session database may be configured to store session information and communication management information in association with linkage data.
The WWW server may be configured to determine a character string as linkage data by extracting a character string updated by a character string counter that updates a character string composed of numbers or symbols.
[0013]
With the above configuration, the cooperation between the WWW server and the voice conversation server can be achieved using the cooperation data, and the user using the terminal device can perform a simple operation without disclosing personal information. It will be possible to receive display and audio linkage services.
[0014]
The voice conversation server may be configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the Web page based on the Web page data for which the cooperation data has been set is performed.
[0015]
With the above-described configuration, it is possible to execute voice conversation processing that matches the content of the service by the Web page for which processing by voice conversation is selected, using the cooperation data.
[0016]
The WWW server may be configured to generate character string data in response to a Web page acquisition request from the terminal device (for example, step S102) and to determine link data that uses the generated character string data.
[0017]
With the above configuration, it is possible to achieve cooperation between the WWW server and the voice conversation server using the cooperation data generated by the WWW server.
[0018]
The voice dialogue server executes voice dialogue processing, and associates the voice dialogue processing result data indicating the voice dialogue processing result with the communication management information about the terminal device associated with the same linkage data as the generated linkage data. And processing for saving in the system (for example, the
[0019]
With the above configuration, the result of the voice dialogue processing by the voice dialogue server can be stored in the system in association with the information related to the terminal device that has received the service by the voice dialogue processing. Therefore, the WWW server can acquire information indicating the result of the voice conversation performed by the terminal device by specifying the information related to the terminal device.
[0020]
In response to a Web page acquisition request from the terminal device, the WWW server acquires voice interaction processing result data associated with the communication management information about the terminal device and stored in the system. Web page data reflecting the voice dialogue processing result shown may be transmitted.
[0021]
With the above configuration, the result of the voice interaction process can be reflected on the Web page.
[0022]
Web page data in which the WWW server obtains the voice interaction processing result data stored in the system in association with the communication management information about the terminal device, and reflects the voice interaction processing result indicated by the voice interaction processing result data May be configured to be transmitted to the terminal device.
[0023]
With the above configuration, the result of the voice interaction process can be reflected on the Web page without causing the terminal device to make a Web page acquisition request.
[0024]
The linkage data may be configured to be character string data including a plurality of characters obtained by arbitrarily combining the characters generated by the terminal device with a tone corresponding to the characters.
[0025]
With the above-described configuration, it is possible to transmit / receive cooperative data as character string data via a communication network, and to transmit / receive cooperative data as sound data via a communication network.
[0026]
As the communication management information, terminal management information (for example, Cookie) managed corresponding to the terminal device may be used.
[0027]
With the above configuration, various types of information such as cooperation data can be stored in association with the terminal management information.
[0028]
In addition, the display / speech cooperation server of the present invention performs a voice interaction process by inputting / outputting information by voice via a communication network and a WWW server (for example, WWW server 20) that provides and collects information using a Web page. A display / voice cooperation server (for example, a server comprising the
[0029]
With the above configuration, it becomes possible to link the WWW server and the voice conversation server using the link data, and it is simple without disclosing personal information to the user who uses the terminal device. It is possible to provide a display and audio linkage service that can be performed by operation.
[0030]
The voice conversation server may be configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. .
[0031]
With the above-described configuration, it is possible to execute voice conversation processing that matches the content of the service by the Web page for which processing by voice conversation is selected, using the cooperation data.
[0032]
In addition, the display / speech cooperation method of the present invention performs a voice interaction process by inputting / outputting information via a communication network and a WWW server (for example, the WWW server 20) that provides and collects information using a Web page. A display / speech cooperation method for coordinating with a voice dialogue server to be executed (voice dialogue server 30), wherein web page data for displaying a web page is for calling to the voice dialogue server The WWW server includes the call data, and in response to a Web page acquisition request from a terminal device (for example, the user terminal 40) connected to the communication network, Session for determining data (for example, step S102) and showing a flow of a series of processes performed between the terminal device and the WWW server Information and the communication management information about the terminal device are associated with the generated cooperation data and stored in the session database (for example, step S103), and the generated cooperation data is associated with the call data and set in the Web page data. (For example, step S104), a process of transmitting the generated web page data set with the cooperation data to the terminal device is executed (for example, step S104), and the voice dialogue server includes the terminal device in the web page data. Using outgoing call dataCalled the voice conversation serverDepending on,In response to execution of a process for establishing a connection with the terminal device, and a tone based on the character string data as linkage data associated with the call data is issued by the terminal device with which the connection is established The linkage data is generated using the tone as character string data (for example, step S110),The generated cooperation data is transmitted to the WWW server, and the WWW server furtherOf the session information stored in the session database,Receive from spoken dialogue serverIdentifying session information corresponding to the linked data, determining from the identified session information which service the voice service requested by the terminal device is,The voice service requested by the terminal device is transmitted to the voice dialogue server, and the voice dialogue server further receives the result from the WWW server.The execution content of the voice interaction process is determined using the cooperation data generated based on the determination result (for example, step S111).
[0033]
With the above configuration, it becomes possible to link the WWW server and the voice conversation server using the link data, and it is simple without disclosing personal information to the user who uses the terminal device. It is possible to provide a display and audio linkage service that can be performed by operation.
[0034]
The voice conversation server may be configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. .
[0035]
With the above-described configuration, it is possible to execute voice conversation processing that matches the content of the service by the Web page for which processing by voice conversation is selected, using the cooperation data.
[0036]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing an example of the configuration of a display / voice cooperation system 10 according to an embodiment of the present invention. The display / voice cooperation system 10 includes a
[0037]
The
[0038]
In this example, the
[0039]
In addition to Web page data for displaying a Web page, the
[0040]
The voice dialogue server 30 has a voice recognition function for recognizing voice indicated by voice data input via the general public network 60 and a voice synthesis function for voice synthesis based on character information and outputting voice data. The voice dialogue server 30 executes voice dialogue processing for transmitting information and obtaining information by voice using a voice recognition function and a voice synthesis function. In this example, the voice interaction server 30 provides various services in cooperation with the
[0041]
As shown in FIG. 1, the
[0042]
Next, the operation of the display / voice cooperation system 10 of this example will be described with reference to the drawings. 2 and 3 are timing charts showing an example of display / voice cooperation processing and processing timing in the display / voice cooperation system 10 of this example.
[0043]
First, the
[0044]
When there is an access from the
[0045]
In this example, the web page data includes voice dialogue selection area display data for displaying a voice dialogue selection area for selecting processing by voice dialogue with the voice dialogue server 30 on the web page, and voice dialogue. Phone number data indicating a phone number for making a call to the server 30 is included in a state of being associated with each other. That is, the voice dialog selection area display data and the telephone number data are written in the Web page data in the markup language. In addition, when the voice dialog selection area indicated by the voice dialog selection area display data is selected in the markup language in the Web page data, a description instructing to make a call using the telephone number indicated by the telephone number data Has been made.
[0046]
Next, the
[0047]
Further, the
[0048]
Next, the
[0049]
When the
[0050]
FIG.These are explanatory drawings showing an example of a display state of a Web page displayed on the
[0051]
When the voice dialog selection area 70 is pressed on the Web page, the browser function 41 of the
[0052]
When the voice conversation server 30 confirms that the communication line is in a connected state in response to a call from the
[0053]
When a tone from the
[0054]
When the cooperation data is generated, the voice interaction server 30 determines the execution contents of the voice interaction process using the generated cooperation data (step S111). Specifically, for example, the voice interaction server 30 first transmits the generated cooperation data to the
[0055]
Note that the execution content of the voice interaction process in step S111 may be determined in any way. For example, this system is configured to have a database server that manages data stored in the database 21, for example, and any service can be received by voice using the
[0056]
When the execution content of the voice dialogue processing is determined, the voice dialogue server 30 executes the determined voice dialogue processing, notifies the
[0057]
When the voice dialogue processing is completed, the voice dialogue server 30 transmits the voice dialogue processing result data indicating the result of the voice dialogue processing and the link data of the character string generated in step S110 to the WWW server 20 (step S113). ). The
[0058]
When the voice interaction process is finished, the call function 42 of the
[0059]
When the web page data is received, the browser function 41 of the
[0060]
As described above, the link data based on the character string generated by the
[0061]
In addition, as described above, since user management (terminal management) is performed using user management information (terminal management information) called a cookie, the user can display and sound with a simple operation that does not require a login operation. It will be possible to receive the cooperation service.
[0062]
In addition, as described above, the cooperation data by the character string generated by the
[0063]
In the above-described embodiment, the voice dialogue server 30 that executes the voice dialogue processing is used, and the voice dialogue processing is executed by performing voice recognition or voice synthesis. May be performed. In other words, instead of the voice interaction server 30, an operation center may be provided. In this case, in the operation center, processing for generating linked data of character strings from the tone input after the communication line is connected is executed in the same manner as the voice dialogue server 30 described above, but the voice dialogue processing is performed by the operator. Done.
[0064]
In the above-described embodiment, the
[0065]
In the above-described embodiment, the
[0066]
Note that the character update counter is not limited to a character string having the same number of digits as the character string to be generated, but to update a character or character string having other digits such as one digit at random. May be. In this case, the character or character string is extracted from the character update counter several times until the
[0067]
In the above-described embodiment, the cookie is used as the session identifier. However, when the system is used by a user terminal that does not have a function for handling the cookie in the browser function 41, the WWW server 20 A parameter for identifying a session may be added to Web page data (for example, URL) transmitted to the user terminal, and the session at each user terminal may be managed based on the parameter.
[0068]
In the above-described embodiment, the
[0069]
In the above-described embodiment, the voice dialogue server 30 transmits the voice dialogue processing result data and the character string linkage data to the
[0070]
In the above-described embodiment, the
[0071]
In the above-described embodiment, the
[0072]
In each of the above-described embodiments, HTML is used as an example of a display language for generating Web page data. However, it is widely used for displaying a Web page on a browser of a mobile phone terminal. A markup language for mobile phone terminals such as C-HTML (Compact HTML), or other markup languages such as HDML (Handheld Device Markup Language) and WML (Wireless Markup Language) may be used.
[0073]
Furthermore, in each of the embodiments described above, both the voice server and the user terminal are connected to the public telephone line network 60, but may be connected to an IP network such as VoIP (Voice over Internet Protocol).
[0074]
【The invention's effect】
As described above, according to the display / voice cooperation system of the present invention, the WWW server includes a session database that stores session information indicating a flow of a series of processes performed between the terminal device and the WWW server. In response to a Web page acquisition request from the terminal device, character string data to be used as linkage data for linking with the voice interaction server is determined, and the linkage data is associated with the session information and the communication management information for the terminal device. At the same time, the data is stored in the session database, and the link data is associated with the call data and set as Web page data, and then processing for transmitting the Web page data set with the link data to the terminal device is executed. In addition, the terminal device uses the browser function for displaying the Web page based on the received Web page data, and the call data included in the Web page data in response to a request from the user, toward the voice conversation server. A call function for making a call and outputting a tone based on character string data as linked data associated with the call data. Furthermore, the voice dialogue server generates linkage data by using the tone from the terminal device as character string data,The generated cooperation data is transmitted to the WWW server. The WWW serverOf the session information stored in the session database,Receive from spoken dialogue serverIdentifying session information corresponding to the linked data, determining from the identified session information which service the voice service requested by the terminal device is,The determination result of the voice service requested by the terminal device is transmitted to the voice conversation server. The voice dialogue server further received from the WWW serverBased on the determination result, the execution content of the voice interaction process is determined. With this configuration, the WWW server and the voice interaction server can be linked using the linked data, and the user using the terminal device can perform simple operations without disclosing personal information. It will be possible to receive display and audio linkage services.
[0075]
Since the voice conversation server is configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. Using the data, it is possible to execute a voice dialogue process that matches the content of the service by the Web page for which the voice dialogue process is selected.
[0076]
Since the WWW server is configured to generate character string data in response to a Web page acquisition request from the terminal device and determine the link data using the generated character string data, the link data generated by the WWW server Can be used to link the WWW server and the voice dialogue server.
[0077]
The voice dialogue server executes voice dialogue processing, and associates the voice dialogue processing result data indicating the voice dialogue processing result with the communication management information about the terminal device associated with the same linkage data as the generated linkage data. In this system, the result of the voice dialogue processing by the voice dialogue server is associated with the information about the terminal device that received the service by the voice dialogue processing. Can be stored in
[0078]
In response to a Web page acquisition request from the terminal device, the WWW server acquires voice interaction processing result data associated with the communication management information about the terminal device and stored in the system. Since the web page data reflecting the voice dialogue processing result shown is transmitted, the result of the voice dialogue processing can be reflected on the web page.
[0079]
Web page data in which the WWW server obtains the voice interaction processing result data stored in the system in association with the communication management information about the terminal device, and reflects the voice interaction processing result indicated by the voice interaction processing result data Is transmitted to the terminal device, the result of the voice interaction process can be reflected on the Web page without causing the terminal device to make a Web page acquisition request.
[0080]
Since the linkage data is configured to be character string data composed of a plurality of characters in which a tone corresponding to the character is emitted in the terminal device, the character string data is transmitted via the communication network. The cooperative data can be transmitted and received, and the cooperative data can be transmitted and received as sound data via the communication network.
[0081]
Since the WWW server includes character update means for updating at least one character and is configured to determine character string data as linkage data based on characters extracted from the character update means, character string data as linkage data Can be determined at random, even if it is linked data given to others before and after self, it cannot be predicted based on the linked data given to itself, so the linked data given to others Is prevented from being sent to the voice interaction server and executed, and the system can be operated safely.
[0082]
Since the terminal management information managed corresponding to the terminal device is used as the communication management information, it is possible to store various information such as cooperation data in association with the terminal management information. it can.
[0083]
In addition, according to the display / voice cooperation server of the present invention, the WWW server includes a session database that stores session information indicating a flow of a series of processing performed between the terminal device connected to the communication network and the WWW server. In response to a Web page acquisition request from the terminal device, the server determines character string data as cooperation data for cooperation with the voice interaction server, and generates the session information and communication management information for the terminal device. The data is stored in the session database in association with each other, and the generated cooperative data is associated with the call data and set as Web page data, and then the Web page data in which the generated cooperative data is set is directed to the terminal device. Execute the process to send. Further, the voice conversation server uses the call data included in the Web page data by the terminal device.Called the voice conversation serverDepending on,In response to execution of a process for establishing a connection with the terminal device, and a tone based on the character string data as linkage data associated with the call data is issued by the terminal device with which the connection is established Then, the linkage data is generated using the tone as character string data, the session information corresponding to the generated linkage data is identified from the session information stored in the session database, and the terminal device uses the voice requested by the terminal device from the identified session information. It is determined which service is the service, and the execution content of the voice interaction process is determined based on the determination result. Since it is configured in this way, it becomes possible to achieve cooperation between the WWW server and the voice conversation server using the cooperation data, and it is easy without disclosing personal information to the user who uses the terminal device. It is possible to provide a display and audio linkage service that can be performed with simple operations.
[0084]
Since the voice conversation server is configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the linkage data has been set is performed. Using the cooperation data, it is possible to execute a voice dialogue process that matches the content of the service by the Web page for which the voice dialogue process is selected.
[0085]
In addition, according to the display / voice cooperation method of the present invention, the WWW server responds to a web page acquisition request from a terminal device connected to the communication network as cooperation data for cooperation with the voice conversation server. A session database that determines character string data and associates the generated linkage data with session information indicating a flow of a series of processes performed between the terminal device and the WWW server, and communication management information about the terminal device. And storing the generated linkage data in association with the call data and setting it as Web page data, and then executing a process of transmitting the Web page data in which the generated linkage data has been set to the terminal device. The dialog server uses the call data included in the Web page data by the terminal device.Called the voice conversation serverDepending on,In response to execution of a process for establishing a connection with the terminal device, and a tone based on the character string data as linkage data associated with the call data is issued by the terminal device with which the connection is established To generate linkage data using the tone as character string data,The generated cooperation data is transmitted to the WWW server, and the WWW server furtherOf the session information stored in the session database,Receive from spoken dialogue serverIdentifying session information corresponding to the linked data, determining from the identified session information which service the voice service requested by the terminal device is,The voice service requested by the terminal device is transmitted to the voice dialogue server, and the voice dialogue server further receives the result from the WWW server.Since the execution content of the voice interaction processing is determined based on the determination result, the cooperation between the WWW server and the voice interaction server can be achieved using the cooperation data. It is possible to provide a display and audio link service that can be performed with a simple operation without disclosing information.
[0086]
Since the voice conversation server is configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the linkage data has been set is performed. Using the cooperation data, it is possible to execute a voice dialogue process that matches the content of the service by the Web page for which the voice dialogue process is selected.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an example of a configuration of a display / voice cooperation system according to an embodiment of the present invention.
FIG. 2 is a timing chart showing an example of display / voice cooperation processing and processing timing in an embodiment of the present invention.
FIG. 3 is a timing chart showing an example of display / audio cooperation processing and processing timing in an embodiment of the present invention.
FIG. 4 is an explanatory diagram showing an example of cooperation data.
FIG. 5 is an explanatory diagram showing an example of a database storage state;
FIG. 6 is an explanatory diagram illustrating an example of a display state of a Web page.
FIG. 7 is an explanatory diagram illustrating an example of a display state of a Web page in which a voice conversation processing result is reflected.
FIG. 8 is a block diagram showing an example of the configuration of a conventional display / voice cooperation system.
[Explanation of symbols]
10 Display / Voice Cooperation System
20 WWW server
21 Database
30 Spoken Dialogue Server
40 User terminal
41 Browser function
42 Call function
50 Communication network
60 Public telephone line
70 Voice dialogue selection area
Claims (16)
前記端末装置と前記WWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、
Webページを表示するためのWebページデータは、前記音声対話サーバに向けて発呼するための発呼データを含み、
前記WWWサーバは、前記端末装置からのWebページの取得要求に応じて、前記音声対話サーバとの連携を図るための連携データとして使用する文字列データを決定し、前記セッション情報及び前記端末装置についての通信管理情報に前記連携データを対応付けして前記セッションデータベースに保存するとともに、連携データを前記発呼データに関連付けしてWebページデータに設定したあと、連携データが設定されたWebページデータを前記端末装置に向けて送信する処理を実行し、
前記端末装置は、受信したWebページデータにもとづいてWebページを表示するブラウザ機能と、ユーザからの要求に応じてWebページデータに含まれている発呼データを用いて前記音声対話サーバに向けて発呼し、当該発呼データに関連付けされている連携データとしての文字列データにもとづくトーンを出力する通話機能とを有し、
前記音声対話サーバは、端末装置からのトーンを文字列データとすることで連携データを生成し、生成した連携データを前記WWWサーバに送信し、
前記WWWサーバは、さらに、前記セッションデータベースが記憶するセッション情報のうち、前記音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から前記端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、前記端末装置が要求した音声によるサービスの判断結果を前記音声対話サーバに送信し、
前記音声対話サーバは、さらに、前記WWWサーバから受信した前記判断結果に基づいて音声対話処理の実行内容を決定する
ことを特徴とする表示・音声連携システム。A terminal device connected to a communication network; a WWW server that provides and collects information using a Web page; and a voice dialog server that executes voice dialog processing by inputting and outputting voice information via the communication network. Display / voice linkage system,
A session database for storing session information indicating a flow of a series of processing performed between the terminal device and the WWW server;
Web page data for displaying the Web page includes a call data for a call toward the voice interaction server,
The WWW server in response to said request for acquisition of a Web page from the terminal device, the determined character string data to be used as the link data for realizing cooperation with the audio interactive server for the session information and the terminal device The link data is associated with the communication management information and stored in the session database, and the link data is set in the Web page data in association with the call data, and then the Web page data in which the link data is set is displayed. Execute a process of transmitting to the terminal device;
The terminal device includes a browser function of displaying a Web page based on the Web page data received, toward the audio interactive server using the call data contained in the Web page data in response to a request from a user A call function for making a call and outputting a tone based on character string data as linked data associated with the call data;
The voice interaction server generates linkage data by using a tone from a terminal device as character string data, and transmits the generated linkage data to the WWW server.
The WWW server further specifies session information corresponding to the cooperation data received from the voice dialogue server from the session information stored in the session database, and a voice service requested by the terminal device from the specified session information. Is transmitted to the voice dialogue server, the result of the voice service requested by the terminal device is determined,
The voice dialogue server further determines execution contents of voice dialogue processing based on the determination result received from the WWW server .
請求項1から請求項4のうちのいずれか1項に記載の表示・音声連携システム。Voice interaction server, as spoken dialogue that matches the display contents of a Web page based on the Web page data link data is set is made, from the claims 1 to determine the execution content of the voice interaction process of claim 4 The display / voice cooperation system according to any one of the above.
請求項1から請求項5のうちのいずれか1項に記載の表示・音声連携システム。WWW server generates character string data in response to the acquisition request for the Web page from the terminal apparatus, any one of claims 5 the generated character string data from claim 1 to determine the link data to be used Display / speech linkage system described in 1.
請求項6記載の表示・音声連携システム。The voice dialogue server executes voice dialogue processing, and associates the voice dialogue processing result data indicating the voice dialogue processing result with the communication management information about the terminal device associated with the same linkage data as the generated linkage data. The display / speech cooperation system according to claim 6, wherein the processing for storing in the system is executed.
請求項7記載の表示・音声連携システム。In response to a Web page acquisition request from the terminal device, the WWW server acquires voice interaction processing result data associated with communication management information about the terminal device and stored in the system, and the voice interaction processing result The display / voice cooperation system according to claim 7, wherein the Web page data reflecting the voice dialogue processing result indicated by the data is transmitted.
請求項7記載の表示・音声連携システム。A WWW server acquires voice dialogue processing result data associated with communication management information about a terminal device and stored in the system, and reflects a voice dialogue processing result indicated by the voice dialogue processing result data The display / voice cooperation system according to claim 7 , wherein data is transmitted to the terminal device.
請求項1から請求項9のうちいずれかに記載の表示・音声連携システム。The display / sound according to any one of claims 1 to 9 , wherein the linkage data is character string data composed of a plurality of characters in which a tone corresponding to the character is emitted from the terminal device. Cooperation system.
請求項10記載の表示・音声連携システム。The display / speech cooperation system according to claim 10 , wherein the WWW server includes character update means for updating at least one character, and determines character string data as cooperation data based on the character extracted from the character update means.
請求項1から請求項11のうちいずれかに記載の表示・音声連携システム。The display / speech cooperation system according to any one of claims 1 to 11 , wherein terminal management information managed corresponding to a terminal device is used as the communication management information.
通信ネットワークに接続される端末装置と前記WWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、
Webページを表示するためのWebページデータは、前記音声対話サーバに向けて発呼するための発呼データを含み、
前記WWWサーバは、前記端末装置からのWebページの取得要求に応じて、前記音声対話サーバとの連携を図るための連携データとして文字列データを決定し、前記セッション情報及び前記端末装置についての通信管理情報に生成した連携データを対応付けして前記セッションデータベースに保存するとともに、生成した連携データを前記発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを前記端末装置に向けて送信する処理を実行し、
前記音声対話サーバは、前記端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて、当該端末装置との接続を確立するための処理を実行し、接続が確立されている前記端末装置によって前記発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、前記セッションデータベースが記憶するセッション情報のうち、生成した連携データに対応するセッション情報を特定し、特定したセッション情報から前記端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、前記判断結果に基づいて音声対話処理の実行内容を決定する
ことを特徴とする表示・音声連携サーバ。A display / voice cooperation server comprising a WWW server that provides and collects information using a web page and a voice dialogue server that executes voice dialogue processing by inputting and outputting information by voice via a communication network,
A session database for storing session information indicating a flow of a series of processing performed between a terminal device connected to a communication network and the WWW server;
Web page data for displaying the Web page includes a call data for a call toward the voice interaction server,
The WWW server in response to said request for acquisition of a Web page from the terminal device, wherein the character string data is determined as the link data for realizing cooperation with the audio interactive server, communication for the session information and the terminal device The association data generated in association with the management information is stored in the session database, and the generated association data is associated with the call data and set in the Web page data, and then the generated association data is set in the Web. Executing a process of transmitting page data to the terminal device;
The voice conversation server performs processing for establishing a connection with the terminal device in response to the terminal device calling the voice conversation server using the call data included in the web page data. In response to a tone based on the character string data as the cooperation data associated with the call data being executed by the terminal device that has been established and connected, the tone is used as the character string data. Among the session information stored in the session database, the session information corresponding to the generated linkage data is identified, and the voice service requested by the terminal device is identified from the identified session information. A display / speech characterized by determining and determining the execution content of the voice dialogue processing based on the determination result Linked server.
請求項13記載の表示・音声連携サーバ。The display / voice according to claim 13 , wherein the voice dialogue server determines the execution contents of the voice dialogue processing so that the voice dialogue matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. Linked server.
Webページを表示するためのWebページデータは、前記音声対話サーバに向けて発呼するための発呼データを含み、
前記WWWサーバは、
通信ネットワークに接続された端末装置からのWebページの取得要求に応じて、前記音声対話サーバとの連携を図るための連携データとして文字列データを決定し、
前記端末装置と前記WWWサーバとの間で行われた一連の処理の流れを示すセッション情報、及び前記端末装置についての通信管理情報に、生成した連携データを対応付けしてセッションデータベースに保存するとともに、生成した連携データを前記発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを前記端末装置に向けて送信する処理を実行し、
前記音声対話サーバは、
前記端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて、当該端末装置との接続を確立するための処理を実行し、
接続が確立されている前記端末装置によって前記発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、
生成した連携データを前記WWWサーバに送信し、
前記WWWサーバは、さらに、
前記セッションデータベースが記憶するセッション情報のうち、前記音声対話サーバから受信した連携データに対応するセッション情報を特定し、
特定したセッション情報から前記端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、
前記端末装置が要求した音声によるサービスの判断結果を前記音声対話サーバに送信し、
前記音声対話サーバは、さらに、前記WWWサーバから受信した前記判断結果に基づいて音声対話処理の実行内容を決定する
ことを特徴とする表示・音声連携方法。A display / voice linkage method for linking a WWW server that provides and collects information using a Web page and a voice dialogue server that executes voice dialogue processing by inputting and outputting voice information via a communication network. There,
Web page data for displaying the Web page includes a call data for a call toward the voice interaction server,
The WWW server
In response to an acquisition request for a Web page from a terminal device connected to the communication network, determines the character string data as the link data for realizing cooperation with said audio interactive server,
The session information indicating a flow of a series of processes performed between the terminal device and the WWW server, and the communication management information about the terminal device are associated with the generated linkage data and stored in the session database. , After associating the generated linkage data with the call data and setting it as Web page data, executing processing for transmitting the Web page data set with the generated linkage data to the terminal device,
The voice dialogue server
In response to the terminal device calling the voice conversation server using the call data included in the web page data, a process for establishing a connection with the terminal device is executed.
In response to the tone based on the character string data as the cooperation data associated with the call data by the terminal device that has been established, the cooperation data is generated using the tone as the character string data. ,
Send the generated cooperation data to the WWW server,
The WWW server further includes:
Among the session information stored in the session database, identify the session information corresponding to the cooperation data received from the voice dialogue server ,
Determine which service is the voice service requested by the terminal device from the identified session information,
Transmitting the result of the service determination by voice requested by the terminal device to the voice dialogue server;
The voice dialogue server further determines the execution contents of voice dialogue processing based on the determination result received from the WWW server .
請求項15記載の表示・音声連携方法。The display / voice according to claim 15 , wherein the voice dialogue server determines the execution contents of the voice dialogue processing so that the voice dialogue matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. Cooperation method.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002166294A JP4003544B2 (en) | 2002-06-06 | 2002-06-06 | Display / voice linkage system, server and method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002166294A JP4003544B2 (en) | 2002-06-06 | 2002-06-06 | Display / voice linkage system, server and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2004015443A JP2004015443A (en) | 2004-01-15 |
| JP4003544B2 true JP4003544B2 (en) | 2007-11-07 |
Family
ID=30433914
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002166294A Expired - Fee Related JP4003544B2 (en) | 2002-06-06 | 2002-06-06 | Display / voice linkage system, server and method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4003544B2 (en) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11048995B2 (en) | 2017-05-16 | 2021-06-29 | Google Llc | Delayed responses by computational assistant |
| CN111524516A (en) * | 2020-04-30 | 2020-08-11 | 青岛海信网络科技股份有限公司 | Control method based on voice interaction, server and display device |
-
2002
- 2002-06-06 JP JP2002166294A patent/JP4003544B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2004015443A (en) | 2004-01-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8155280B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
| US8903073B2 (en) | Systems and methods for visual presentation and selection of IVR menu | |
| US8929517B1 (en) | Systems and methods for visual presentation and selection of IVR menu | |
| US20190082043A1 (en) | Systems and methods for visual presentation and selection of ivr menu | |
| US20090117884A1 (en) | Method and telephone for use of telephone book data stored in a telephone book data bank of a server | |
| US7277733B2 (en) | System and method for providing web content provision service using subscriber terminal in exchange system | |
| US7653381B2 (en) | Method for inputting and searching information about an object in a remote database | |
| JP3322262B2 (en) | Wireless mobile terminal communication system | |
| KR100393048B1 (en) | A method for connecting on the wireless site by the phone number | |
| JP2004015763A (en) | Call center support device and program | |
| JP4003544B2 (en) | Display / voice linkage system, server and method | |
| JP2013042374A (en) | Registration support system, registration support server and registration support program | |
| US20120192083A1 (en) | Method and system for enhanced online searching | |
| JP2004221902A (en) | Information providing system and information providing method | |
| JP3925326B2 (en) | Terminal communication system, linkage server, voice dialogue server, voice dialogue processing method, and voice dialogue processing program | |
| JP3781000B2 (en) | Display / sound linkage system, display / sound linkage server, display / sound linkage method, and display / sound linkage program | |
| US7894834B1 (en) | Method and system to facilitate multiple media content providers to inter-work with media serving system | |
| KR100688877B1 (en) | Mobile phone number provision method, server and system thereof | |
| US20090180467A1 (en) | System and Method for Connecting Remote Callers with PBX Extensions Using Internet Telephony | |
| JP2007096570A (en) | Phone connection method | |
| JP4196534B2 (en) | Information providing system and information providing method related to printing apparatus | |
| JP2004110687A (en) | Personal identification information management system for communication terminals | |
| KR100964389B1 (en) | Apparatus and Method for Providing Customized Guidance in Intelligent Network | |
| KR100920074B1 (en) | How to Provide Specific (Voice) Service Based on Outgoing Client | |
| KR100592933B1 (en) | National representative number service method of VoIP environment |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051116 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20051116 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060518 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060523 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060724 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070130 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070330 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070731 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070813 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100831 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110831 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110831 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120831 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130831 Year of fee payment: 6 |
|
| LAPS | Cancellation because of no payment of annual fees |