Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP4003544B2 - Display / voice linkage system, server and method - Google Patents
[go: Go Back, main page]

JP4003544B2 - Display / voice linkage system, server and method - Google Patents

Display / voice linkage system, server and method Download PDF

Info

Publication number
JP4003544B2
JP4003544B2 JP2002166294A JP2002166294A JP4003544B2 JP 4003544 B2 JP4003544 B2 JP 4003544B2 JP 2002166294 A JP2002166294 A JP 2002166294A JP 2002166294 A JP2002166294 A JP 2002166294A JP 4003544 B2 JP4003544 B2 JP 4003544B2
Authority
JP
Japan
Prior art keywords
data
voice
server
web page
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002166294A
Other languages
Japanese (ja)
Other versions
JP2004015443A (en
Inventor
隆浩 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2002166294A priority Critical patent/JP4003544B2/en
Publication of JP2004015443A publication Critical patent/JP2004015443A/en
Application granted granted Critical
Publication of JP4003544B2 publication Critical patent/JP4003544B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Telephonic Communication Services (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ユーザの個人情報を用いることなくWebページの表示による表示サービスと音声対話を行うことによる音声サービスとの連携を図ることができる表示・音声連携システム、表示・音声連携サーバ、および表示・音声連携方法に関する。
【0002】
【従来の技術】
従来から、インターネットなどの通信ネットワークに接続されているWWW(World Wide Web)サーバによるWebページの表示を利用した表示サービスと、公衆電話回線などの通信ネットワークに接続されている音声対話サーバによる音声対話機能を用いた音声サービスとを連携させた表示・音声連携システムが利用されている。
【0003】
図8は、従来の表示・音声連携システムの構成例を示すブロック図である。表示・音声連携システム100は、表示サービスを実行するWWWサーバ120と、音声サービスを実行する音声対話サーバ130と、ブラウザ機能141および通話機能142を備えた例えば携帯電話端末などのユーザ端末140とを含む。ここでは、WWWサーバ120は、着信メロディ(電話機での着信時に着信音として用いられるメロディ)を提供するための着信メロディ提供サイトを運営しているものとする。WWWサーバ120およびユーザ端末140は、それぞれ、インターネットなどの通信ネットワーク150に接続される。また、音声対話サーバ130およびユーザ端末140は、公衆電話回線網160に接続される。なお、公衆電話回線網160は、通信ネットワーク150に接続されている。
【0004】
次に、表示・音声連携システム100の動作例について説明する。ユーザ端末140は、ユーザの操作に応じて、ブラウザ機能141を用いてWWWサーバ120が提供する着信メロディ提供サイトにアクセスし、着信メロディ提供サイトにおける着信メロディを選択するためのWebページを自己が備える表示装置に表示する。このWebページには、着信メロディとして取得しようとするメロディのタイトル(以下、「着信メロディのタイトル」という)を入力するためのタイトル入力領域が含まれる。
【0005】
次いで、ユーザ端末140は、ユーザからの指示があると、通話機能142を用いて音声対話サーバ130に発呼する。ユーザ端末140と音声対話サーバ130との接続が確立すると、音声対話サーバ130は、ユーザが取得を希望している着信メロディのタイトルを特定するための音声対話処理を実行する。音声対話処理によって着信メロディのタイトルが特定され、音声対話処理が終了すると、音声対話サーバ130は、音声対話処理によって特定された着信メロディのタイトルを示す情報を例えば専用回線などの通信ネットワークを介してWWWサーバ120に送信する。
【0006】
また、音声対話処理が終了すると、ユーザ端末140は、ブラウザ機能141を用いてWWWサーバ120が提供する着信メロディ提供サイトにアクセスし、Webページの更新を要求する。WWWサーバ120は、Webページの更新要求に応じて、音声対話サーバから取得した着信メロディのタイトルを示す情報を反映させたWebページを示すデータを送信する。すると、ユーザ端末140の表示装置に、着信メロディを選択するためのWebページが、タイトル入力領域にタイトルが表示された状態で表示される。つまり、ユーザ端末140の表示装置に表示されているWebページのタイトル入力領域に、ユーザ端末140と音声対話サーバ130との間で実行された音声対話によって特定された着信メロディのタイトルが入力されたことになる。
【0007】
このように、表示・音声連携システムを利用することで、例えば、携帯電話端末などのユーザ端末が備える表示装置に表示されている情報入力領域への情報入力を、音声を発声することによって行うことができる。
【0008】
【発明が解決しようとする課題】
上記のような表示・音声連携システムにおいては、WWWサーバによる表示サービスと音声サーバによる音声サービスは通信経路が異なるため、WWWサーバと音声サーバとを関連付けて、表示サービスと音声サービスとの連携を図る必要がある。従来は表示サービスと音声サービスとの連携は、例えば特開2001−268241に開示されているシステムのように、表示・音声連携システムを利用するユーザ端末における音声通話のための発信者番号にもとづいて図られている。
【0009】
従って、表示・音声連携システムを利用するためには、WWWサーバによる表示サービスを利用して使用する端末装置の電話番号をあらかじめ登録しておく必要があった。このように、個人情報を開示したあとでなければ表示・音声連携システムを利用することができないため、表示・音声連携システムの利用を促進することが困難であるという問題があった。
【0010】
また、表示・音声連携システムが提供するサービスを受けるときには、そのサービスの提供のために必要とされているか否かにかかわらず、ログイン操作が必要であった。ログイン操作は、電話番号を入力することで行われたり、WWWサーバに電話番号を登録するユーザ登録の際に定められたユーザ名を入力することで行われる。このように、表示・音声連携システムを利用する度にログイン操作を行わなければならなず、ユーザにとって煩わしい操作を強いられるという問題があった。
【0011】
本発明は上述した問題を解消し、個人情報を開示することなく簡単な操作で表示と音声の連携サービスを受けることができるようにすることを目的とする。
【0012】
【課題を解決するための手段】
上記の問題を解決するために、本発明の表示・音声連携システム(例えば表示・音声連携システム10)は、通信ネットワークに接続される端末装置(例えばユーザ端末40)と、Webページを用いて情報の提供や収集を行うWWWサーバ(例えばWWWサーバ20)と、通信ネットワークを介して音声による情報の入出力によって音声対話処理を実行する音声対話サーバ(例えば音声対話サーバ30)とを備えた表示・音声連携システムであって、端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、Webページを表示するためのWebページデータは、音声対話サーバに向けて発呼するための発呼データ(例えば電話番号データ)を含み、WWWサーバは、端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データ(例えば図4に示すデータ)として使用する文字列データを決定し、セッション情報及び端末装置についての通信管理情報(例えばCookieなどのセッション識別子)に連携データを対応付けしてセッションデータベースに保存するとともに(例えばステップS103)、連携データを発呼データに関連付けしてWebページデータに設定したあと(例えばステップS104)、連携データが設定されたWebページデータを端末装置に向けて送信する処理(例えばステップS105)を実行し、端末装置は、受信したWebページデータにもとづいてWebページを表示するブラウザ機能(例えばブラウザ機能41)と、ユーザからの要求に応じてWebページデータに含まれている発呼データを用いて音声対話サーバに向けて発呼し、当該発呼データに関連付けされている連携データとしての文字列データにもとづくトーンを出力する通話機能(例えば通話機能42)とを有し、音声対話サーバは、端末装置からのトーンを文字列データとすることで連携データを生成し(例えばステップS110)、生成した連携データをWWWサーバに送信し、WWWサーバは、さらに、セッションデータベースが記憶するセッション情報のうち、音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、端末装置が要求した音声によるサービスの判断結果を音声対話サーバに送信し、音声対話サーバは、さらに、WWWサーバから受信した判断結果に基づいて生成した連携データを用いて音声対話処理の実行内容を決定する(例えばステップS111)ようにしたものである。
WWWサーバは、音声対話サーバから受信した連携データに対応するセッション情報を特定すると、特定したセッション情報の中から、音声対話サーバから受信した連携データと同一の連携データが設定されているWebページデータを特定し、特定したWebページデータから端末装置が要求した音声によるサービスがいずれのサービスであるかを判断する構成とされてもよい。
セッションデータベースは、セッション情報及び通信管理情報を連携データに対応付けて記憶する構成とされてもよい。
WWWサーバは、数字又は記号からなる文字列を更新する文字列カウンタが更新した文字列を抽出することによって、連携データとして文字列を決定する構成とされてもよい。
【0013】
上記の構成としたことで、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザは、個人情報を開示することなく簡単な操作で表示と音声の連携サービスを受けることができるようになる。
【0014】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定する構成とされていてもよい。
【0015】
上記の構成としたことで、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0016】
WWWサーバが、端末装置からのWebページの取得要求に応じて文字列データを生成し(例えばステップS102)、生成した文字列データを使用する連携データに決定する構成とされていてもよい。
【0017】
上記の構成としたことで、WWWサーバが生成した連携データを用いて、WWWサーバと音声対話サーバとの連携を図ることができる。
【0018】
音声対話サーバが、音声対話処理を実行し、音声対話処理結果を示す音声対話処理結果データを、生成した連携データと同一の連携データが対応付けされている端末装置についての通信管理情報に対応付けしてシステム内(例えばWWWサーバ20、データベースサーバ)に保存するための処理(例えばWWWサーバ20に向けて連携データおよび音声対話処理結果データを送信する処理)を実行するように構成されていてもよい。
【0019】
上記の構成としたことで、音声対話サーバによる音声対話処理の結果を、音声対話処理によるサービスを受けた端末装置に関する情報に関連付けしてシステム内に保存しておくことができる。よって、WWWサーバが、端末装置に関する情報を特定することによって、その端末装置によって行われた音声対話の結果を示す情報を取得することができる。
【0020】
WWWサーバが、端末装置からのWebページ取得要求に応じて、端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを送信するように構成されていてもよい。
【0021】
上記の構成としたことで、音声対話処理の結果を、Webページに反映させることができる。
【0022】
WWWサーバが、端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを端末装置に送信するように構成されていてもよい。
【0023】
上記の構成としたことで、Webページ取得要求を端末装置に行わせることなく、音声対話処理の結果を、Webページに反映させることができる。
【0024】
連携データは、文字に対応したトーンが端末装置にて発せられる当該文字を任意に組合せた複数の文字からなる文字列データであるように構成されていてもよい。
【0025】
上記の構成としたことで、文字列データとして通信ネットワークを介して連携データを送受することができるとともに、音データとして通信ネットワークを介して連携データを送受することができる。
【0026】
通信管理情報として、端末装置に対応して管理されている端末管理情報(例えばCookie)が用いられる構成とされていてもよい。
【0027】
上記の構成としたことで、端末管理情報に対応付けして連携データなどの各種の情報を保存しておくことができる。
【0028】
また、本発明の表示・音声連携サーバは、Webページを用いて情報の提供や収集を行うWWWサーバ(例えばWWWサーバ20)と、通信ネットワークを介して音声による情報の入出力によって音声対話処理を実行する音声対話サーバ(例えば音声対話サーバ30)とを備えた表示・音声連携サーバ(例えばWWWサーバ20と音声対話サーバ30とからなるサーバ)であって、通信ネットワークに接続される端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、Webページを表示するためのWebページデータは、音声対話サーバに向けて発呼するための発呼データを含み、WWWサーバは、端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして文字列データを決定し、セッション情報及び端末装置についての通信管理情報に生成した連携データを対応付けしてセッションデータベースに保存するとともに、生成した連携データを発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行し、音声対話サーバは、端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて当該端末装置との接続を確立するための処理を実行し、接続が確立されている端末装置によって発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、セッションデータベースが記憶するセッション情報のうち、生成した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、判断結果に基づいて音声対話処理の実行内容を決定するようにしたものである。
【0029】
上記の構成としたことで、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザに対して、個人情報を開示させることなく簡単な操作で行うことができる表示と音声の連携サービスを提供することができる。
【0030】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定するように構成されていてもよい。
【0031】
上記の構成としたことで、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0032】
また、本発明の表示・音声連携方法は、Webページを用いて情報の提供や収集を行うWWWサーバ(例えばWWWサーバ20)と、通信ネットワークを介して音声による情報の入出力によって音声対話処理を実行する音声対話サーバ(音声対話サーバ30)との連携を図るための表示・音声連携方法であって、Webページを表示するためのWebページデータは、音声対話サーバに向けて発呼するための発呼データを含み、WWWサーバは、通信ネットワークに接続された端末装置(例えばユーザ端末40)からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして文字列データを決定し(例えばステップS102)、端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報、及び端末装置についての通信管理情報に、生成した連携データを対応付けしてセッションデータベースに保存するとともに(例えばステップS103)、生成した連携データを発呼データに関連付けしてWebページデータに設定したあと(例えばステップS104)、生成した連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行し(例えばステップS104)、音声対話サーバが、端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて当該端末装置との接続を確立するための処理を実行し、接続が確立されている端末装置によって発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し(例えばステップS110)、生成した連携データをWWWサーバに送信し、WWWサーバは、さらに、セッションデータベースが記憶するセッション情報のうち、音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、端末装置が要求した音声によるサービスの判断結果を音声対話サーバに送信し、音声対話サーバは、さらに、WWWサーバから受信した判断結果に基づいて生成した連携データを用いて音声対話処理の実行内容を決定する(例えばステップS111)ものである。
【0033】
上記の構成としたことで、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザに対して、個人情報を開示させることなく簡単な操作で行うことができる表示と音声の連携サービスを提供することができる。
【0034】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定するように構成されていてもよい。
【0035】
上記の構成としたことで、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0036】
【発明の実施の形態】
以下、本発明の実施の形態について図面を参照して説明する。
図1は、本発明の一実施形態である表示・音声連携システム10の構成の例を示すブロック図である。表示・音声連携システム10は、WWWサーバ20と、音声対話サーバ30と、ユーザ端末40とを含む。WWWサーバ20およびユーザ端末40は、それぞれ、インターネットなどの通信ネットワーク50に接続される。また、音声対話サーバ30およびユーザ端末40は、公衆電話回線網60に接続される。なお、公衆電話回線網60は、通信ネットワーク50に接続されている。以下の説明において、公衆電話回線網60含むネットワークを通信ネットワーク50ということがある。
【0037】
WWWサーバ20は、例えばインターネットサーバなどの情報処理装置により構成される。WWWサーバ20は、例えばHTML(Hypertext Markup Language)などのマークアップ言語により作成されたWebページデータを管理し、Webページデータにもとづいて表示されるWebページを用いて、各種の情報の提供や取得を行う機能を有している。Webページには、例えば、商品の受注を行うためのものや、アンケートの回収を行うためのものなどがある。
【0038】
WWWサーバ20は、本例では、Cookieと呼ばれるユーザを識別するための文字列情報を利用して本システムを利用する各ユーザを管理する。ここで、Cookieを利用してユーザ管理を行う場合の処理について簡単に説明する。先ず、WWWサーバ20は、Cookieを生成し、ユーザ端末(例えばユーザ端末40、具体的には、ユーザ端末40に搭載されているブラウザ)に向けて送信する。Cookieを取得すると、ユーザ端末は、Cookieが格納されたファイル(Cookieファイル)を保存する。その後は、ユーザ端末は、WWWサーバ20にアクセスする際に、ユーザ端末に搭載されているブラウザの機能によってCookieファイルを送信する。WWWサーバ20は、取得したCookieファイルによって、ユーザに関する情報を認識する。このようにしてユーザに関する情報を認識することができるため、WWWサーバ20は、最新のユーザ情報を把握することができるようになる。
【0039】
また、WWWサーバ20は、Webページを表示するためのWebページデータの他、各ユーザ端末についてのセッション(ユーザ端末とWWWサーバとの間で行われた一連の処理の流れ)を示すセッション情報、各ユーザ端末に付与されているセッション識別子(各ユーザ端末の通信履歴などの通信に関する各種の情報をユーザ端末毎に管理するために用いられる通信管理情報の一例)、後述する連携データなどが格納されるデータベース21を備えている(図5参照)。なお、本例では、セッション識別子として、上述したCookieが用いられる。また、各セッション情報は、それぞれ、セッション情報が示すセッションに関与したユーザ端末についてのセッション識別子に対応付けされている。従って、セッション識別子に対応付けされているセッション情報は、そのセッション識別子が示すユーザ端末と、WWWサーバ20とのセッションを示す情報である。
【0040】
音声対話サーバ30は、一般公衆回線網60を介して入力した音声データが示す音声を認識する音声認識機能と、文字情報にもとづいて音声合成して音声データ出力を行う音声合成機能とを有する。音声対話サーバ30は、音声認識機能と音声合成機能とを用いて、音声よる情報の伝達や情報の取得を行う音声対話処理を実行する。この例では、音声対話サーバ30は、WWWサーバ20と連携して各種のサービスを提供する。例えば、WWWサーバ20が運営しているWebページに設けられている情報入力領域に入力される情報を、音声対話処理によって取得するサービスを行う。この音声対話サーバ30は、音声認識や音声合成を行うための辞書データを有している。
【0041】
ユーザ端末40は、図1に示すように、一般公衆回線網60を介して接続先との間で音声通話を行うための通話機能41を有するとともに、自己が備える例えばLCD(Liquid Crystal Display)などの表示装置にWebページを表示したり、自己が備える入力装置を用いてWebページ上で文字入力や情報選択を行うためのブラウザ機能42を有している。ユーザ端末40は、例えばPDC(Personal Digital Cellular)規格に準拠したディジタル携帯電話などの携帯電話端末によって構成される。ユーザ端末40は、通信ネットワーク50への接続や、通信ネットワーク50を利用した情報の送受などを行うことができる環境(例えばブラウザなどのソフトウェアや、ハードウェアなどにおける環境)を備えている。
【0042】
次に、本例の表示・音声連携システム10の動作について図面を参照して説明する。図2、図3は、本例の表示・音声連携システム10における表示・音声連携処理および処理タイミングの一例を示すタイミングチャートである。
【0043】
先ず、ユーザ端末40は、ユーザの操作に応じて、通信ネットワーク50を介してWWWサーバ20にアクセスする(ステップS101)。例えば、WWWサーバ20が提供しているWebページのURL(Uniform Resource Locator)を指定することでアクセスする。
【0044】
ユーザ端末40からのアクセスがあり、Webページを表示するためのWebページデータの取得要求があった場合には、WWWサーバ20は、先ず、音声対話サーバ30との連携を図るための連携データを生成する(ステップS102)。連携データは、例えば図4に示すように、特定のトーンを発することを電話機に指定することができる数字や記号(例えば「#」)を、複数個任意に組合せた文字列によって構成される。この例では、連携データは、既に生成されて保存している他の連携データの何れにも一致しない文字列となるように生成される。
【0045】
なお、この例では、Webページデータには、音声対話サーバ30との音声対話による処理を選択するための音声対話選択領域をWebページ上に表示するための音声対話選択領域表示データと、音声対話サーバ30に向けて発呼するための電話番号を示す電話番号データとが、互いに関連付けされた状態で含まれている。すなわち、音声対話選択領域表示データと電話番号データとが、マークアップ言語によってWebページデータ内に表記されている。また、Webページデータ内に、マークアップ言語によって、音声対話選択領域表示データが示す音声対話選択領域が選択されると、電話番号データが示す電話番号を用いて発呼を行うように指示する記述がなされている。
【0046】
次いで、WWWサーバ20は、生成した連携データを、ユーザ端末30についてのセッション識別子に対応付けた状態でデータベース21に保存する(ステップS103)。図5は、データベース21の格納状態の例を示す説明図である。図5に示すように、各セッション識別子に対応付けされた状態で、セッション情報、連携データ、音声対話結果情報などの各種の情報が格納されている。従って、連携データに対応するセッション情報やセッション識別子を確認することで、その連携データが設定されたWebページデータをどのユーザ端末が取得したかを特定することができるようになる。
【0047】
また、WWWサーバ20は、生成した連携データを、ユーザ端末40に送信するWebページデータの中に設定する(ステップS104)。具体的には、マークアップ言語で構成されているWebページデータ内の所定の箇所に、連携データを表記する処理を行う。この例では、連携データは、Webページデータに含まれている音声対話サーバ30の電話番号を示す電話番号データに関連付けされた状態で設定される。
【0048】
次いで、WWWサーバ20は、連携データを設定したWebページデータを、ユーザ端末40に向けて通信ネットワーク50を介して送信する(ステップS105)。送信されるWebページデータには、音声対話サーバ30の電話番号を示す電話番号データと、ステップS102で生成された連携データとが含まれている。
【0049】
ユーザ端末40は、Webページデータを受信すると、ブラウザ機能41によって、受信したWebページデータにもとづくWebページを自己が備える表示装置に表示する(ステップS106)。
【0050】
図6は、ユーザ端末40に表示されるWebページの表示状態の例を示す説明図である。ここでは、WWWサーバ20が、チケットの予約受付、チケットの予約内容の変更、チケットの予約の取消しなどのサービスを提供している場合を例に説明する。図6には、チケットの予約内容の変更を行うためのWebページの表示状態の例が示されている。図6に示すように、Webページには、現在のチケットの予約内容を表示する表示領域と、変更後の予約内容を入力する入力領域と、音声対話によって変更後の予約内容を入力することを選択する音声対話選択領域70とが設けられている。
【0051】
Webページにおいて音声対話選択領域70が押下されると、ユーザ端末40のブラウザ機能41は、通話機能42を呼び出し(ステップS107)、音声対話選択領域70を表示させるための音声対話選択領域表示データに関連付けされている電話番号データが示す電話番号を用いて発呼することを指示する。呼び出された通話機能42は、ブラウザ機能41からの指示に従って、Webページデータ内に設定されている電話番号データが示す電話番号を用いて、音声対話サーバ30に向けて発呼を行う(ステップS108)。
【0052】
音声対話サーバ30がユーザ端末40からの発呼に応じて通信回線が接続状態になったことを確認すると、ユーザ端末40は、発呼に用いた電話番号データに関連付けされている連携データが示す文字列にもとづいて、文字列の各文字に対応するトーンを発する処理を実行する(ステップS109)。
【0053】
ユーザ端末40からのトーンが入力すると、音声対話サーバ30は、入力したトーンに対応する文字列を生成することで、文字列による連携データを生成する(ステップS110)。
【0054】
連携データを生成すると、音声対話サーバ30は、生成した連携データを用いて音声対話処理の実行内容を決定する(ステップS111)。具体的には、例えば、音声対話サーバ30は、先ず、生成した連携データをWWWサーバ20に送信し、WWWサーバ20に、ステップS110で生成した連携データと同一の連携データに関連付けされているセッション情報(例えば、最近追加された数バイト分のデータなど、セッション情報の一部であってもよい)をデータベース21から探索させる。次いで、WWWサーバ20は、探索したセッション情報の中からステップS110で生成された連携データと同一の連携データが設定されているWebページデータを特定する。この特定したWebページデータにもとづいて、ユーザ端末40がどのWebページを経由して音声対話サーバ30に向けて発呼を行ったかを確認することができる。WWWサーバ20は、特定したWebページデータから、ユーザ端末40を用いてどのようなサービスを音声によって受けようとしていたかを確認し、その確認結果を音声対話サーバ30に送信する。そして、音声対話サーバ30は、受信した確認結果を示す情報にもとづいて、実行する音声対話処理の内容を決定する。例えば、図6に示したWebページを経由して音声対話サーバ30に向けて発呼を行ったことが特定された場合には、チケットの変更を音声対話によって行うための音声対話処理を実行することに決定する。このようにして、ステップS111での音声対話処理の実行内容が決定されるようにすればよい。
【0055】
なお、ステップS111での音声対話処理の実行内容の決定は、どのようにして行われるようにしてもよい。例えば、本システムを、例えばデータベース21の格納データを管理するデータベースサーバを有する構成とし、音声対話サーバ30がデータベースサーバにアクセスすることで、ユーザ端末40を用いてどのようなサービスを音声によって受けようとしていたかを確認するようにしてもよい。
【0056】
音声対話処理の実行内容を決定すると、音声対話サーバ30は、決定した音声対話処理を実行し、音声対話処理にて、ユーザ端末40に対して音声による情報の報知を行うとともに、ユーザ端末40からの音声を入力して情報を取得する(ステップS112)。
【0057】
音声対話処理を終了すると、音声対話サーバ30は、音声対話処理の結果を示す音声対話処理結果データと、ステップS110にて生成した文字列の連携データをWWWサーバ20に向けて送信する(ステップS113)。WWWサーバ20は、受信した音声対話処理結果データを、受信した連携データと同一の連携データに対応付けされているセッション識別子に対応付けして保存する(ステップS114)。
【0058】
また、音声対話処理を終了すると、ユーザ端末40の通話機能42は、ブラウザ機能41を呼び出す(ステップS115)。呼び出されたユーザ端末40のブラウザ機能41は、WWWサーバ20に対して、ユーザ端末40の表示装置に表示されている表示情報の更新を要求する(ステップS116)。WWWサーバ20は、更新要求に応じて、ユーザ端末40についてのセッション識別子に対応付けされている音声対話処理結果データを読み出して、音声対話処理の結果を反映させたWebページデータを作成する(ステップS117)。そして、音声対話処理の結果を反映させたWebページデータを送信する(ステップS118)。
【0059】
Webページデータを受信すると、ユーザ端末40のブラウザ機能41によって、受信したWebページデータにもとづくWebページが表示される(ステップS119)。Webページの表示内容は、例えば図7に示すように、音声対話処理によって入力された情報の内容が反映された状態となっている。なお、図7は、図6に示すWebページから音声対話が選択され、音声対話処理によってチケット予約の変更内容を示す情報が音声入力されたあと、音声対話処理の結果が反映されたWebページの表示状態の例を示す説明図である。
【0060】
以上説明したように、WWWサーバ20が生成した文字列による連携データを、連携データにもとづくトーンによって音声対話サーバ30に伝達する構成としたので、WWWサーバ20が生成した連携データによって、音声対話サーバ30が、どのWebページを経由してユーザ端末40が接続してきたかを確認することができ、WWWサーバ20によるWebページによるサービスと、音声対話サーバ30による音声対話によるサービスとを連携させることができる。このように、連携データを用いて表示と音声の連携を図っているので、端末装置を使用するユーザは、ユーザ端末の電話番号などの個人情報を開示することなく表示と音声の連携サービスを受けることができるようになる。なお、ユーザ端末40は、音声対話サーバ30に発呼するときに発信者電話番号を通知しなくてよいので、WWWサーバ20だけでなく音声対話サーバ30に対しても個人情報を開示する必要はない。
【0061】
また、上述したように、Cookieと呼ばれるユーザ管理情報(端末管理情報)を用いてユーザ管理(端末管理)を行う構成としているので、ユーザは、ログイン動作の必要のない簡単な操作で表示と音声の連携サービスを受けることができるようになる。
【0062】
また、上述したように、WWWサーバ20が生成した文字列による連携データをセッション情報などに対応付けして保存し、音声対話サーバ30が音声対話結果データを連携データとともに送信する構成としたことで、WWWサーバ20が、音声対話の結果を示す情報を、音声対話を行ったユーザ端末40についてのセッション情報に対応付けして保存することができる。
【0063】
なお、上述した実施の形態では、音声対話処理を実行する音声対話サーバ30を用いる構成とし、音声対話処理を音声認識や音声合成を行うことによって実行するようにしていたが、音声対話処理を人間が行うようにしてもよい。すなわち、音声対話サーバ30の代わりに、オペレーションセンタを備える構成としてもよい。この場合、オペレーションセンタでは、通信回線が接続されたあとに入力したトーンから文字列の連携データを生成する処理などは上述した音声対話サーバ30と同様に実行されるが、音声対話処理はオペレータによって行われる。
【0064】
また、上述した実施の形態では、WWWサーバ20が、Webページデータの送信要求を受けたときに、任意の文字列による連携データを生成する構成としていたが、WWWサーバ20から音声対話サーバ30に向けての一方の連携だけを図るようにする場合(上述した音声・表示連携処理におけるステップS112までの処理を行う場合)には、あらかじめ定められている文字列による連携データを用いる構成としてもよい。この場合、各Webページデータに、それぞれ、あらかじめ定められている所定の連携データ(Webページデータ毎に定められている別個の連携データ)を設定しておくようにすればよい。また、音声対話サーバ30が、各連携データが設定されているWebページデータによるWebページの内容(例えば、チケット予約をするWebページであるなどのような内容)を示す情報が格納されているデータベースを備えるようにすればよい。また、上述したあらかじめ定められている文字列と、WWWサーバ20が、Webページデータの送信要求を受けたときに生成する任意の文字列を組み合わせ、連携データとして用いる構成としてもよい。この場合、音声対話サーバ30が、各連携データが設定されているWebページデータによるWebページの内容(例えば、チケット予約をするWebページであるなどのような内容)を示す情報が格納されているデータベースを備え、音声対話処理結果は任意の文字列と関連付けられシステム内に保存されるようにすればよい。
【0065】
また、上述した実施の形態では、WWWサーバ20が、連携データとしての文字列データを、既に生成されて保存している他の連携データの何れにも一致しない文字列となるように生成する構成としていたが、他の連携データの内容とは無関係に、特定のトーンを発することを電話機に指定することができる数字や記号からなる文字列を更新していく文字更新カウンタ(文字更新手段の一例)から文字列を抽出することで、連携データとしての文字列を生成するようにしてもよい。このように構成しても、連携データとしての文字列の桁数を多くすれば、他の連携データを一致した連携データが生成されることは防止できる。この場合、文字更新カウンタは、例えば、0〜9の数字や「♯」などの記号の組合せからなる所定桁数の文字列をランダムに更新する構成とすればよい。そして、WWWサーバ20が、ステップS102にて、文字更新カウンタから文字列を抽出し、連携データとしての文字列データを生成するようにすればよい。このように構成すれば、連携データとしての文字列データをランダムに決定することができ、自己と前後して他人に付与された連携データであっても、自己に付与された連携データにもとづいて他人の連携データを予測することができないようにすることができる。すなわち、文字列データを規則的な順番で生成する構成とすると、あるユーザ端末に対して付与した連携データと、次にアクセスしてきた他のユーザ端末に付与した連携データとが、連番となってしまう。よって、連携データが付与されたユーザ端末のユーザは、自己に付与された連携データから他人に付与された連携データを容易に予測できてしまう。しかし、文字更新カウンタを用いて連携データを生成する構成とすれば、他人に付与された連携データを予測することは不可能となる。従って、他人に付与された連携データを音声対話サーバ30に送信し、音声対話サーバ30やWWWサーバ20に謝った処理を実行させるような行為は防止される。よって、システム10を安全に運用することができるようになる。
【0066】
なお、文字更新カウンタは、生成する文字列と同じ桁数の文字列をランダムに更新するものに限らず、例えば1桁などの他の桁数の文字あるいは文字列をランダムに更新するものであってもよい。この場合、WWWサーバ20が、生成する文字列の桁数の文字を抽出するまで、文字更新カウンタから文字または文字列を数回抽出し、抽出した文字または文字列を組合せて連携データとしての文字列を生成するようにすればよい。
【0067】
また、上述した実施の形態では、セッション識別子としてCookieを用いる構成としていたが、ブラウザ機能41にCookieを取り扱う機能が搭載されていないユーザ端末により本システムが利用される場合には、WWWサーバ20が、ユーザ端末に向けて送信するWebページデータ(例えばURL)にセッションを識別するためのパラメータを付加することとし、そのパラメータによって各ユーザ端末におけるセッションを管理するようにすればよい。
【0068】
また、上述した実施の形態では、ユーザ端末40が携帯電話端末であるものとして説明していたが、ブラウザ機能と通話機能とをともに備えるものであれば、PDA(Personal Digital Assistants)やパーソナルコンピュータなどの他の端末装置であってもよい。
【0069】
また、上述した実施の形態では、ステップS113にて、音声対話サーバ30が音声対話処理結果データと文字列の連携データをWWWサーバ20に向けて送信する構成としていたが、本システムがデータベース21の格納データを管理するデータベースサーバを有する構成とし、そのデータベースサーバに向けて送信する構成としてもよい。この場合、データベースサーバは、受信した音声対話処理結果データを、受信した連携データと同一の連携データに対応付けされているセッション識別子に対応付けして保存するようにし、WWWサーバ20からの音声対話処理結果の問い合わせに応じて保存している音声対話処理結果データをWWWサーバ20に送信するようにしてもよい。すなわち、データベース21の格納情報は、WWWサーバ20によって管理されていなくてもよく、本システムに含まれる他のサーバ(例えば音声対話サーバ30、データベースサーバ)によって管理されていても、複数のサーバによって共通に管理されていてもよい。つまり、データベース21の格納情報は、本システムで管理できるような状態で保存されていれば、何処にどのような状態で保存されていてもよい。
【0070】
また、上述した実施の形態では、WWWサーバ20が、ユーザ端末40からのWebページ取得要求(ステップS116の表示情報更新要求)に応じて、音声対話処理結果データを取得して(ステップS117)、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを送信する構成(ステップS118)としていたが、音声対話処理結果データを保存したあと(ステップS114)に、ユーザ端末40からのWebページ取得要求の有無に関わらず、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータをユーザ端末40に送信する構成としてもよい。このように構成すれば、Webページ取得要求をユーザ端末40に行わせることなく、音声対話処理の結果を、Webページに反映させることができる。
【0071】
また、上述した実施の形態では、ユーザ端末40が、ステップS108にて音声対話サーバ30に向けて発呼を行い、接続が確立したあとにステップS109にてトーンを発するようにしていたが、ユーザ端末40は電話番号と連携データの文字列によるトーンとを同時に出力し、公衆電話回線網60に接続されている交換機が、ユーザ端末40と音声対話サーバ30との接続が確立したあとにトーンを音声対話サーバ30に向けて出力する構成としてもよい。
【0072】
また、上述した各実施の形態では、Webページデータを生成するための表示用言語としてHTMLを例にしていたが、携帯電話端末のブラウザでWebページの表示などを行うために広く用いられているC-HTML(Compact HTML)などの携帯電話端末用のマークアップ言語や、HDML(Handheld Device Markup Language)、WML(Wireless Markup Language)などの他のマークアップ言語を用いるようにしてもよい。
【0073】
さらに、上述した各実施の形態では、音声サーバ、ユーザ端末ともに公衆電話回線網60に接続されているが、VoIP(Voice over Internet Protocol)等のIPネットワークに接続してもよい。
【0074】
【発明の効果】
以上のように、本発明の表示・音声連携システムによれば、端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、WWWサーバが、端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして使用する文字列データを決定し、セッション情報及び端末装置についての通信管理情報に連携データを対応付けしてセッションデータベースに保存するとともに、連携データを発呼データに関連付けしてWebページデータに設定したあと、連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行する。また、端末装置が、受信したWebページデータにもとづいてWebページを表示するブラウザ機能と、ユーザからの要求に応じてWebページデータに含まれている発呼データを用いて音声対話サーバに向けて発呼し、当該発呼データに関連付けされている連携データとしての文字列データにもとづくトーンを出力する通話機能とを有する。さらに、音声対話サーバが、端末装置からのトーンを文字列データとすることで連携データを生成し、生成した連携データをWWWサーバに送信する。WWWサーバは、さらに、セッションデータベースが記憶するセッション情報のうち、音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、端末装置が要求した音声によるサービスの判断結果を音声対話サーバに送信する。音声対話サーバは、さらに、WWWサーバから受信した判断結果に基づいて音声対話処理の実行内容を決定する。このように構成したことで、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザは、個人情報を開示することなく簡単な操作で表示と音声の連携サービスを受けることができるようになる。
【0075】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定する構成とされているので、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0076】
WWWサーバが、端末装置からのWebページの取得要求に応じて文字列データを生成し、生成した文字列データを使用する連携データに決定する構成とされているので、WWWサーバが生成した連携データを用いて、WWWサーバと音声対話サーバとの連携を図ることができる。
【0077】
音声対話サーバが、音声対話処理を実行し、音声対話処理結果を示す音声対話処理結果データを、生成した連携データと同一の連携データが対応付けされている端末装置についての通信管理情報に対応付けしてシステム内に保存するための処理を実行するように構成されているので、音声対話サーバによる音声対話処理の結果を、音声対話処理によるサービスを受けた端末装置に関する情報に関連付けしてシステム内に保存しておくことができる。
【0078】
WWWサーバが、端末装置からのWebページ取得要求に応じて、端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを送信するように構成されているので、音声対話処理の結果を、Webページに反映させることができる。
【0079】
WWWサーバが、端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを端末装置に送信するように構成されているので、Webページ取得要求を端末装置に行わせることなく、音声対話処理の結果を、Webページに反映させることができる。
【0080】
連携データは、文字に対応したトーンが端末装置にて発せられる当該文字を任意に組合せた複数の文字からなる文字列データであるように構成されているので、文字列データとして通信ネットワークを介して連携データを送受することができるとともに、音データとして通信ネットワークを介して連携データを送受することができる。
【0081】
WWWサーバが、少なくとも1つの文字を更新する文字更新手段を備え、文字更新手段から抽出した文字によって連携データとしての文字列データを決定するように構成されているので、連携データとしての文字列データをランダムに決定することができ、自己と前後して他人に付与された連携データであっても、自己に付与された連携データにもとづいて予測することはできないので、他人に付与された連携データを音声対話サーバに送信して処理を実行させるような行為が防止され、システムを安全に運用することができる。
【0082】
通信管理情報として、端末装置に対応して管理されている端末管理情報が用いられる構成とされているので、端末管理情報に対応付けして連携データなどの各種の情報を保存しておくことができる。
【0083】
また、本発明の表示・音声連携サーバによれば、通信ネットワークに接続される端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、WWWサーバが、端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして文字列データを決定し、セッション情報及び端末装置についての通信管理情報に生成した連携データを対応付けしてセッションデータベースに保存するとともに、生成した連携データを発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行する。また、音声対話サーバが、端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて当該端末装置との接続を確立するための処理を実行し、接続が確立されている端末装置によって発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、セッションデータベースが記憶するセッション情報のうち、生成した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、判断結果に基づいて音声対話処理の実行内容を決定する。このように構成されているので、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザに対して、個人情報を開示させることなく簡単な操作で行うことができる表示と音声の連携サービスを提供することができる。
【0084】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定するように構成されているので、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【0085】
また、本発明の表示・音声連携方法によれば、WWWサーバが、通信ネットワークに接続された端末装置からのWebページの取得要求に応じて、音声対話サーバとの連携を図るための連携データとして文字列データを決定し、端末装置とWWWサーバとの間で行われた一連の処理の流れを示すセッション情報、及び端末装置についての通信管理情報に、生成した連携データを対応付けしてセッションデータベースに保存するとともに、生成した連携データを発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを端末装置に向けて送信する処理を実行し、音声対話サーバが、端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて当該端末装置との接続を確立するための処理を実行し、接続が確立されている端末装置によって発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、生成した連携データをWWWサーバに送信し、WWWサーバは、さらに、セッションデータベースが記憶するセッション情報のうち、音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、端末装置が要求した音声によるサービスの判断結果を音声対話サーバに送信し、音声対話サーバは、さらに、WWWサーバから受信した判断結果に基づいて音声対話処理の実行内容を決定するので、連携データを用いてWWWサーバと音声対話サーバとの連携を図ることができるようになり、端末装置を使用するユーザに対して、個人情報を開示させることなく簡単な操作で行うことができる表示と音声の連携サービスを提供することができる。
【0086】
音声対話サーバが、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定するように構成されているので、連携データを用いて、音声対話による処理が選択されたWebページによるサービスの内容に合致した音声対話処理を実行することができる。
【図面の簡単な説明】
【図1】 本発明の一実施の形態における表示・音声連携システムの構成の例を示すブロック図である。
【図2】 本発明の一実施の形態における表示・音声連携処理および処理タイミングの一例を示すタイミングチャートである。
【図3】 本発明の一実施の形態における表示・音声連携処理および処理タイミングの一例を示すタイミングチャートである。
【図4】 連携データの一例を示す説明図である。
【図5】 データベースの格納状態の例を示す説明図である。
【図6】 Webページの表示状態の例を示す説明図である。
【図7】 音声対話処理結果が反映されたWebページの表示状態の例を示す説明図である。
【図8】 従来の表示・音声連携システムの構成の例を示すブロック図である。
【符号の説明】
10 表示・音声連携システム
20 WWWサーバ
21 データベース
30 音声対話サーバ
40 ユーザ端末
41 ブラウザ機能
42 通話機能
50 通信ネットワーク
60 一般公衆電話回線
70 音声対話選択領域
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a display / speech cooperation system, a display / speech cooperation server, and a display capable of cooperating with a display service by displaying a web page and a voice service by performing a voice dialogue without using personal information of the user -Concerning voice linkage methods.
[0002]
[Prior art]
Conventionally, a display service using display of a Web page by a WWW (World Wide Web) server connected to a communication network such as the Internet, and a voice dialog by a voice dialog server connected to a communication network such as a public telephone line. A display / speech linkage system linked with a voice service using a function is used.
[0003]
FIG. 8 is a block diagram illustrating a configuration example of a conventional display / voice cooperation system. The display / voice cooperation system 100 includes a WWW server 120 that executes a display service, a voice dialogue server 130 that executes a voice service, and a user terminal 140 such as a mobile phone terminal that includes a browser function 141 and a call function 142. Including. Here, it is assumed that WWW server 120 operates an incoming melody providing site for providing an incoming melody (a melody used as a ringing tone when an incoming call is received). The WWW server 120 and the user terminal 140 are each connected to a communication network 150 such as the Internet. The voice interaction server 130 and the user terminal 140 are connected to the public telephone line network 160. The public telephone line network 160 is connected to the communication network 150.
[0004]
Next, an operation example of the display / voice cooperation system 100 will be described. The user terminal 140 itself includes a web page for accessing an incoming melody providing site provided by the WWW server 120 using the browser function 141 and selecting an incoming melody on the incoming melody providing site in accordance with a user operation. Display on the display device. This Web page includes a title input area for inputting a title of a melody to be acquired as an incoming melody (hereinafter referred to as “title of incoming melody”).
[0005]
Next, when receiving an instruction from the user, the user terminal 140 calls the voice interaction server 130 using the call function 142. When the connection between the user terminal 140 and the voice dialogue server 130 is established, the voice dialogue server 130 executes voice dialogue processing for specifying the title of the incoming melody that the user desires to obtain. When the title of the incoming melody is specified by the voice dialogue processing and the voice dialogue processing is completed, the voice dialogue server 130 sends information indicating the title of the incoming melody specified by the voice dialogue processing via a communication network such as a dedicated line. It is transmitted to the WWW server 120.
[0006]
When the voice interaction process is completed, the user terminal 140 uses the browser function 141 to access the incoming melody providing site provided by the WWW server 120 and requests an update of the Web page. In response to the Web page update request, the WWW server 120 transmits data indicating the Web page reflecting the information indicating the title of the incoming melody acquired from the voice interaction server. Then, a web page for selecting a ringtone is displayed on the display device of the user terminal 140 with the title displayed in the title input area. That is, the title of the incoming melody specified by the voice dialogue executed between the user terminal 140 and the voice dialogue server 130 is input to the title input area of the Web page displayed on the display device of the user terminal 140. It will be.
[0007]
In this way, by using the display / voice cooperation system, for example, information input to the information input area displayed on the display device provided in the user terminal such as a mobile phone terminal is performed by uttering voice. Can do.
[0008]
[Problems to be solved by the invention]
In the display / voice cooperation system as described above, since the communication path is different between the display service by the WWW server and the voice service by the voice server, the WWW server and the voice server are associated with each other so as to link the display service and the voice service. There is a need. Conventionally, the linkage between the display service and the voice service is based on the caller number for voice call in the user terminal using the display / voice linkage system, for example, as in the system disclosed in Japanese Patent Laid-Open No. 2001-268241. It is illustrated.
[0009]
Therefore, in order to use the display / voice cooperation system, it is necessary to register in advance the telephone number of the terminal device to be used by using the display service by the WWW server. As described above, since the display / voice linkage system can be used only after the personal information is disclosed, there is a problem that it is difficult to promote the use of the display / voice linkage system.
[0010]
In addition, when receiving a service provided by the display / speech cooperation system, a login operation is required regardless of whether or not the service is required for providing the service. The login operation is performed by inputting a telephone number, or by inputting a user name determined at the time of user registration for registering a telephone number in the WWW server. As described above, there is a problem that a login operation has to be performed every time the display / voice cooperation system is used, and the user is forced to perform a troublesome operation.
[0011]
SUMMARY OF THE INVENTION It is an object of the present invention to solve the above-described problems, and to receive a display and audio linkage service with a simple operation without disclosing personal information.
[0012]
[Means for Solving the Problems]
  In order to solve the above problem, the display / voice cooperation system (for example, the display / voice cooperation system 10) of the present invention uses a terminal device (for example, the user terminal 40) connected to the communication network and a Web page to provide information. A display / provided with a WWW server (for example, WWW server 20) that provides and collects and a voice dialog server (for example, voice dialog server 30) that executes voice dialog processing by inputting and outputting information by voice via a communication network A voice linkage system comprising a session database that stores session information indicating a flow of a series of processes performed between a terminal device and a WWW server, and Web page data for displaying a Web page is a voice dialog Including call data (for example, telephone number data) for making a call to the server. In response to a Web page acquisition request from the apparatus, character string data to be used as cooperation data (for example, data shown in FIG. 4) for cooperation with the voice interaction server is determined, and communication about session information and terminal apparatus is performed. The association data is associated with management information (for example, a session identifier such as a cookie) and stored in the session database (for example, step S103), and the association data is associated with the call data and set in the web page data (for example, step). S104), a process of transmitting the Web page data in which the cooperation data is set to the terminal device (for example, step S105), and the terminal device displays a Web page based on the received Web page data ( For example, according to browser function 41) and user requests A call function (for example, calling a voice dialogue server using call data included in Web page data and outputting a tone based on character string data as linkage data associated with the call data) The voice dialogue server generates the linkage data by using the tone from the terminal device as the character string data (for example, step S110).The generated cooperation data is transmitted to the WWW server, and the WWW server furtherOf the session information stored in the session database,Receive from spoken dialogue serverIdentifying session information corresponding to the linked data, determining from the identified session information which service the voice service requested by the terminal device is,The voice service requested by the terminal device is transmitted to the voice dialogue server, and the voice dialogue server further receives the result from the WWW server.The execution content of the voice interaction process is determined using the cooperation data generated based on the determination result (for example, step S111).
  When the WWW server specifies session information corresponding to the cooperation data received from the voice interaction server, Web page data in which the same cooperation data as the cooperation data received from the voice interaction server is set from the specified session information. It may be configured to determine which service is the voice service requested by the terminal device from the specified Web page data.
  The session database may be configured to store session information and communication management information in association with linkage data.
  The WWW server may be configured to determine a character string as linkage data by extracting a character string updated by a character string counter that updates a character string composed of numbers or symbols.
[0013]
With the above configuration, the cooperation between the WWW server and the voice conversation server can be achieved using the cooperation data, and the user using the terminal device can perform a simple operation without disclosing personal information. It will be possible to receive display and audio linkage services.
[0014]
The voice conversation server may be configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the Web page based on the Web page data for which the cooperation data has been set is performed.
[0015]
With the above-described configuration, it is possible to execute voice conversation processing that matches the content of the service by the Web page for which processing by voice conversation is selected, using the cooperation data.
[0016]
The WWW server may be configured to generate character string data in response to a Web page acquisition request from the terminal device (for example, step S102) and to determine link data that uses the generated character string data.
[0017]
With the above configuration, it is possible to achieve cooperation between the WWW server and the voice conversation server using the cooperation data generated by the WWW server.
[0018]
The voice dialogue server executes voice dialogue processing, and associates the voice dialogue processing result data indicating the voice dialogue processing result with the communication management information about the terminal device associated with the same linkage data as the generated linkage data. And processing for saving in the system (for example, the WWW server 20 and the database server) (for example, processing for transmitting cooperation data and voice interaction processing result data to the WWW server 20) may be executed. Good.
[0019]
With the above configuration, the result of the voice dialogue processing by the voice dialogue server can be stored in the system in association with the information related to the terminal device that has received the service by the voice dialogue processing. Therefore, the WWW server can acquire information indicating the result of the voice conversation performed by the terminal device by specifying the information related to the terminal device.
[0020]
In response to a Web page acquisition request from the terminal device, the WWW server acquires voice interaction processing result data associated with the communication management information about the terminal device and stored in the system. Web page data reflecting the voice dialogue processing result shown may be transmitted.
[0021]
With the above configuration, the result of the voice interaction process can be reflected on the Web page.
[0022]
Web page data in which the WWW server obtains the voice interaction processing result data stored in the system in association with the communication management information about the terminal device, and reflects the voice interaction processing result indicated by the voice interaction processing result data May be configured to be transmitted to the terminal device.
[0023]
With the above configuration, the result of the voice interaction process can be reflected on the Web page without causing the terminal device to make a Web page acquisition request.
[0024]
The linkage data may be configured to be character string data including a plurality of characters obtained by arbitrarily combining the characters generated by the terminal device with a tone corresponding to the characters.
[0025]
With the above-described configuration, it is possible to transmit / receive cooperative data as character string data via a communication network, and to transmit / receive cooperative data as sound data via a communication network.
[0026]
As the communication management information, terminal management information (for example, Cookie) managed corresponding to the terminal device may be used.
[0027]
With the above configuration, various types of information such as cooperation data can be stored in association with the terminal management information.
[0028]
  In addition, the display / speech cooperation server of the present invention performs a voice interaction process by inputting / outputting information by voice via a communication network and a WWW server (for example, WWW server 20) that provides and collects information using a Web page. A display / voice cooperation server (for example, a server comprising the WWW server 20 and the voice dialogue server 30) having a voice dialogue server (for example, the voice dialogue server 30) to be executed, and a terminal device connected to the communication network and the WWW A session database for storing session information indicating a flow of a series of processes performed with the server is provided, and the Web page data for displaying the Web page is called for calling to the voice interaction server. The WWW server includes data, and in response to a Web page acquisition request from the terminal device, Character string data is determined as cooperation data for cooperation, and the generated cooperation data is stored in the session database in association with the session information and the communication management information about the terminal device, and the generated cooperation data is called data. After the web page data is set in association with the web page data, the web page data in which the generated linkage data is set is transmitted to the terminal device. The voice conversation server includes the terminal device in the web page data. Using outgoing call dataCalled the voice conversation serverDepending on,In response to execution of a process for establishing a connection with the terminal device, and a tone based on the character string data as linkage data associated with the call data is issued by the terminal device with which the connection is established Then, the linkage data is generated using the tone as character string data, the session information corresponding to the generated linkage data is identified from the session information stored in the session database, and the terminal device uses the voice requested by the terminal device from the identified session information. It is determined which service is a service, and the execution content of the voice interaction process is determined based on the determination result.
[0029]
With the above configuration, it becomes possible to link the WWW server and the voice conversation server using the link data, and it is simple without disclosing personal information to the user who uses the terminal device. It is possible to provide a display and audio linkage service that can be performed by operation.
[0030]
The voice conversation server may be configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. .
[0031]
With the above-described configuration, it is possible to execute voice conversation processing that matches the content of the service by the Web page for which processing by voice conversation is selected, using the cooperation data.
[0032]
  In addition, the display / speech cooperation method of the present invention performs a voice interaction process by inputting / outputting information via a communication network and a WWW server (for example, the WWW server 20) that provides and collects information using a Web page. A display / speech cooperation method for coordinating with a voice dialogue server to be executed (voice dialogue server 30), wherein web page data for displaying a web page is for calling to the voice dialogue server The WWW server includes the call data, and in response to a Web page acquisition request from a terminal device (for example, the user terminal 40) connected to the communication network, Session for determining data (for example, step S102) and showing a flow of a series of processes performed between the terminal device and the WWW server Information and the communication management information about the terminal device are associated with the generated cooperation data and stored in the session database (for example, step S103), and the generated cooperation data is associated with the call data and set in the Web page data. (For example, step S104), a process of transmitting the generated web page data set with the cooperation data to the terminal device is executed (for example, step S104), and the voice dialogue server includes the terminal device in the web page data. Using outgoing call dataCalled the voice conversation serverDepending on,In response to execution of a process for establishing a connection with the terminal device, and a tone based on the character string data as linkage data associated with the call data is issued by the terminal device with which the connection is established The linkage data is generated using the tone as character string data (for example, step S110),The generated cooperation data is transmitted to the WWW server, and the WWW server furtherOf the session information stored in the session database,Receive from spoken dialogue serverIdentifying session information corresponding to the linked data, determining from the identified session information which service the voice service requested by the terminal device is,The voice service requested by the terminal device is transmitted to the voice dialogue server, and the voice dialogue server further receives the result from the WWW server.The execution content of the voice interaction process is determined using the cooperation data generated based on the determination result (for example, step S111).
[0033]
With the above configuration, it becomes possible to link the WWW server and the voice conversation server using the link data, and it is simple without disclosing personal information to the user who uses the terminal device. It is possible to provide a display and audio linkage service that can be performed by operation.
[0034]
The voice conversation server may be configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. .
[0035]
With the above-described configuration, it is possible to execute voice conversation processing that matches the content of the service by the Web page for which processing by voice conversation is selected, using the cooperation data.
[0036]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing an example of the configuration of a display / voice cooperation system 10 according to an embodiment of the present invention. The display / voice cooperation system 10 includes a WWW server 20, a voice interaction server 30, and a user terminal 40. The WWW server 20 and the user terminal 40 are each connected to a communication network 50 such as the Internet. The voice interaction server 30 and the user terminal 40 are connected to a public telephone line network 60. The public telephone line network 60 is connected to the communication network 50. In the following description, a network including the public telephone line network 60 may be referred to as a communication network 50.
[0037]
The WWW server 20 is configured by an information processing device such as an Internet server, for example. The WWW server 20 manages Web page data created by a markup language such as HTML (Hypertext Markup Language), for example, and provides and acquires various types of information using Web pages displayed based on the Web page data. It has a function to perform. Web pages include, for example, those for ordering products and those for collecting questionnaires.
[0038]
In this example, the WWW server 20 manages each user who uses this system by using character string information for identifying a user called a cookie. Here, a process when user management is performed using Cookie will be briefly described. First, the WWW server 20 generates a cookie and transmits it to a user terminal (for example, the user terminal 40, specifically, a browser installed in the user terminal 40). When the cookie is acquired, the user terminal stores a file (cookie file) in which the cookie is stored. Thereafter, when accessing the WWW server 20, the user terminal transmits a Cookie file by the function of the browser installed in the user terminal. The WWW server 20 recognizes information about the user from the acquired cookie file. Since the information about the user can be recognized in this way, the WWW server 20 can grasp the latest user information.
[0039]
  In addition to Web page data for displaying a Web page, the WWW server 20 includes session information indicating a session for each user terminal (a flow of a series of processes performed between the user terminal and the WWW server), A session identifier assigned to each user terminal (an example of communication management information used for managing various information related to communication such as a communication history of each user terminal for each user terminal), cooperation data described later, and the like are stored. Database 21 (FIG.reference). In this example, the above-described cookie is used as the session identifier. Each session information is associated with a session identifier for a user terminal involved in the session indicated by the session information. Therefore, the session information associated with the session identifier is information indicating a session between the user terminal indicated by the session identifier and the WWW server 20.
[0040]
The voice dialogue server 30 has a voice recognition function for recognizing voice indicated by voice data input via the general public network 60 and a voice synthesis function for voice synthesis based on character information and outputting voice data. The voice dialogue server 30 executes voice dialogue processing for transmitting information and obtaining information by voice using a voice recognition function and a voice synthesis function. In this example, the voice interaction server 30 provides various services in cooperation with the WWW server 20. For example, a service for acquiring information input in an information input area provided in a Web page operated by the WWW server 20 by voice interaction processing is performed. The speech dialogue server 30 has dictionary data for performing speech recognition and speech synthesis.
[0041]
As shown in FIG. 1, the user terminal 40 has a call function 41 for making a voice call with a connection destination via a general public network 60, and includes, for example, an LCD (Liquid Crystal Display) provided by the user terminal 40. A browser function 42 is provided for displaying a web page on the display device and for inputting characters and selecting information on the web page using an input device provided by itself. The user terminal 40 is configured by a mobile phone terminal such as a digital mobile phone conforming to the PDC (Personal Digital Cellular) standard, for example. The user terminal 40 has an environment (for example, software such as a browser or an environment such as hardware) in which connection to the communication network 50 and transmission / reception of information using the communication network 50 can be performed.
[0042]
Next, the operation of the display / voice cooperation system 10 of this example will be described with reference to the drawings. 2 and 3 are timing charts showing an example of display / voice cooperation processing and processing timing in the display / voice cooperation system 10 of this example.
[0043]
First, the user terminal 40 accesses the WWW server 20 via the communication network 50 in accordance with a user operation (step S101). For example, it is accessed by specifying a URL (Uniform Resource Locator) of a Web page provided by the WWW server 20.
[0044]
When there is an access from the user terminal 40 and there is a request for acquisition of Web page data for displaying a Web page, the WWW server 20 firstly outputs cooperation data for cooperation with the voice interaction server 30. Generate (step S102). For example, as shown in FIG. 4, the linkage data is configured by a character string in which a plurality of numbers and symbols (for example, “#”) that can designate a telephone to emit a specific tone are arbitrarily combined. In this example, the cooperation data is generated to be a character string that does not match any of the other cooperation data that has already been generated and saved.
[0045]
In this example, the web page data includes voice dialogue selection area display data for displaying a voice dialogue selection area for selecting processing by voice dialogue with the voice dialogue server 30 on the web page, and voice dialogue. Phone number data indicating a phone number for making a call to the server 30 is included in a state of being associated with each other. That is, the voice dialog selection area display data and the telephone number data are written in the Web page data in the markup language. In addition, when the voice dialog selection area indicated by the voice dialog selection area display data is selected in the markup language in the Web page data, a description instructing to make a call using the telephone number indicated by the telephone number data Has been made.
[0046]
  Next, the WWW server 20 stores the generated cooperation data in the database 21 in a state associated with the session identifier for the user terminal 30 (step S103).FIG.These are explanatory drawings showing an example of the storage state of the database 21.FIG.As shown in FIG. 4, various information such as session information, linkage data, and voice conversation result information is stored in a state associated with each session identifier. Therefore, by confirming the session information and session identifier corresponding to the cooperation data, it is possible to specify which user terminal has acquired the Web page data in which the cooperation data is set.
[0047]
Further, the WWW server 20 sets the generated cooperation data in the Web page data to be transmitted to the user terminal 40 (Step S104). Specifically, the process of notifying the linkage data at a predetermined location in the Web page data configured in the markup language is performed. In this example, the linkage data is set in a state in which it is associated with telephone number data indicating the telephone number of the voice interaction server 30 included in the Web page data.
[0048]
Next, the WWW server 20 transmits the Web page data set with the cooperation data to the user terminal 40 via the communication network 50 (step S105). The transmitted Web page data includes telephone number data indicating the telephone number of the voice interaction server 30 and the cooperation data generated in step S102.
[0049]
When the user terminal 40 receives the Web page data, the browser function 41 displays the Web page based on the received Web page data on its own display device (step S106).
[0050]
  FIG.These are explanatory drawings showing an example of a display state of a Web page displayed on the user terminal 40. Here, a case will be described as an example where the WWW server 20 provides services such as ticket reservation reception, ticket reservation content change, and ticket reservation cancellation.FIG.Shows an example of a display state of a Web page for changing the reservation contents of a ticket.FIG.As shown in FIG. 5, the Web page is selected to display the reservation contents of the current ticket, the input area for inputting the changed reservation contents, and the input of the changed reservation contents by voice dialogue. A voice dialogue selection area 70 is provided.
[0051]
When the voice dialog selection area 70 is pressed on the Web page, the browser function 41 of the user terminal 40 calls the call function 42 (step S107), and the voice dialog selection area display data for displaying the voice dialog selection area 70 is displayed. It is instructed to make a call using the telephone number indicated by the associated telephone number data. The called call function 42 makes a call to the voice interaction server 30 using the telephone number indicated by the telephone number data set in the web page data in accordance with an instruction from the browser function 41 (step S108). ).
[0052]
When the voice conversation server 30 confirms that the communication line is in a connected state in response to a call from the user terminal 40, the user terminal 40 indicates the link data associated with the telephone number data used for the call. Based on the character string, a process of emitting a tone corresponding to each character of the character string is executed (step S109).
[0053]
When a tone from the user terminal 40 is input, the voice dialogue server 30 generates a character string corresponding to the input tone, thereby generating linkage data based on the character string (step S110).
[0054]
When the cooperation data is generated, the voice interaction server 30 determines the execution contents of the voice interaction process using the generated cooperation data (step S111). Specifically, for example, the voice interaction server 30 first transmits the generated cooperation data to the WWW server 20, and the session associated with the same cooperation data as the cooperation data generated in step S110 is transmitted to the WWW server 20. The database 21 is searched for information (for example, it may be a part of session information such as recently added data of several bytes). Next, the WWW server 20 identifies Web page data in which the same cooperation data as the cooperation data generated in step S110 is set from the searched session information. Based on the specified Web page data, it is possible to confirm through which Web page the user terminal 40 has made a call to the voice interaction server 30. The WWW server 20 confirms what service was intended to be received by voice using the user terminal 40 from the identified Web page data, and transmits the confirmation result to the voice dialogue server 30. Then, the voice dialogue server 30 determines the content of the voice dialogue processing to be executed based on the information indicating the received confirmation result. For example, when it is determined that a call is made to the voice interaction server 30 via the Web page shown in FIG. 6, a voice interaction process for changing the ticket by voice interaction is executed. Decide on. In this way, the execution content of the voice interaction process in step S111 may be determined.
[0055]
Note that the execution content of the voice interaction process in step S111 may be determined in any way. For example, this system is configured to have a database server that manages data stored in the database 21, for example, and any service can be received by voice using the user terminal 40 by the voice interaction server 30 accessing the database server. You may make it confirm whether it was doing.
[0056]
When the execution content of the voice dialogue processing is determined, the voice dialogue server 30 executes the determined voice dialogue processing, notifies the user terminal 40 of information by voice in the voice dialogue processing, and from the user terminal 40. To obtain information (step S112).
[0057]
When the voice dialogue processing is completed, the voice dialogue server 30 transmits the voice dialogue processing result data indicating the result of the voice dialogue processing and the link data of the character string generated in step S110 to the WWW server 20 (step S113). ). The WWW server 20 stores the received voice interaction processing result data in association with the session identifier associated with the same cooperation data as the received cooperation data (step S114).
[0058]
When the voice interaction process is finished, the call function 42 of the user terminal 40 calls the browser function 41 (step S115). The called browser function 41 of the user terminal 40 requests the WWW server 20 to update the display information displayed on the display device of the user terminal 40 (step S116). In response to the update request, the WWW server 20 reads out the voice interaction processing result data associated with the session identifier for the user terminal 40, and creates Web page data reflecting the result of the voice interaction processing (step) S117). Then, the Web page data reflecting the result of the voice interaction process is transmitted (step S118).
[0059]
When the web page data is received, the browser function 41 of the user terminal 40 displays a web page based on the received web page data (step S119). For example, as shown in FIG. 7, the display content of the Web page is in a state in which the content of the information input by the voice dialogue process is reflected. FIG. 7 shows a Web page in which a voice dialog is selected from the Web page shown in FIG. 6 and information indicating the change contents of the ticket reservation is input by voice dialog processing, and then the result of the voice dialog processing is reflected. It is explanatory drawing which shows the example of a display state.
[0060]
As described above, the link data based on the character string generated by the WWW server 20 is transmitted to the voice dialogue server 30 by the tone based on the linkage data, so that the voice dialogue server is used by the linkage data generated by the WWW server 20. 30 can confirm through which Web page the user terminal 40 has been connected, and the service by the Web page by the WWW server 20 and the service by the voice dialog by the voice dialog server 30 can be linked. . As described above, since the display and voice are linked using the linked data, the user who uses the terminal device receives the linked display and voice service without disclosing personal information such as the telephone number of the user terminal. Will be able to. Since the user terminal 40 does not need to notify the caller telephone number when making a call to the voice conversation server 30, it is necessary to disclose personal information not only to the WWW server 20 but also to the voice conversation server 30. Absent.
[0061]
In addition, as described above, since user management (terminal management) is performed using user management information (terminal management information) called a cookie, the user can display and sound with a simple operation that does not require a login operation. It will be possible to receive the cooperation service.
[0062]
In addition, as described above, the cooperation data by the character string generated by the WWW server 20 is stored in association with the session information, and the voice conversation server 30 transmits the voice conversation result data together with the cooperation data. The WWW server 20 can store information indicating the result of the voice conversation in association with the session information about the user terminal 40 that has performed the voice conversation.
[0063]
In the above-described embodiment, the voice dialogue server 30 that executes the voice dialogue processing is used, and the voice dialogue processing is executed by performing voice recognition or voice synthesis. May be performed. In other words, instead of the voice interaction server 30, an operation center may be provided. In this case, in the operation center, processing for generating linked data of character strings from the tone input after the communication line is connected is executed in the same manner as the voice dialogue server 30 described above, but the voice dialogue processing is performed by the operator. Done.
[0064]
In the above-described embodiment, the WWW server 20 is configured to generate cooperative data using an arbitrary character string when receiving a Web page data transmission request. In the case where only one of the links is intended (when the processing up to step S112 in the above-described voice / display cooperation processing is performed), it may be configured to use cooperation data based on a predetermined character string. . In this case, it is only necessary to set predetermined predetermined linkage data (separate linkage data determined for each Web page data) in advance for each Web page data. The database in which the voice dialogue server 30 stores information indicating the contents of a Web page (for example, a content such as a Web page for ticket reservation) based on the Web page data in which each cooperation data is set. Should be provided. The predetermined character string described above and an arbitrary character string generated when the WWW server 20 receives a transmission request for Web page data may be combined and used as linked data. In this case, the voice dialogue server 30 stores information indicating the contents of the Web page (for example, contents such as a Web page for ticket reservation) based on the Web page data in which each cooperation data is set. A database may be provided, and the voice interaction processing result may be associated with an arbitrary character string and stored in the system.
[0065]
In the above-described embodiment, the WWW server 20 generates character string data as cooperation data so as to be a character string that does not match any of the other cooperation data already generated and stored. The character update counter (an example of a character update means) that updates a character string made up of numbers and symbols that can be specified to the phone to emit a specific tone regardless of the contents of other linked data ) May be extracted to generate a character string as linked data. Even if it comprises in this way, if the number of digits of the character string as cooperation data is increased, it can prevent that the cooperation data which matched other cooperation data are produced | generated. In this case, the character update counter may be configured to randomly update a character string having a predetermined number of digits, for example, a combination of symbols such as numbers 0 to 9 and “#”. In step S102, the WWW server 20 may extract a character string from the character update counter and generate character string data as cooperation data. If comprised in this way, the character string data as cooperation data can be determined at random, and even if it is cooperation data given to others before and after self, based on cooperation data given to self It is possible to prevent other people's cooperation data from being predicted. That is, when the configuration is such that character string data is generated in a regular order, the linkage data assigned to a certain user terminal and the linkage data assigned to another user terminal that has accessed next are serial numbers. End up. Therefore, the user of the user terminal to which the cooperation data is given can easily predict the cooperation data given to others from the cooperation data given to the user. However, if it is set as the structure which produces | generates cooperation data using a character update counter, it will become impossible to estimate the cooperation data provided to others. Therefore, the act of transmitting the cooperation data given to another person to the voice conversation server 30 and causing the voice conversation server 30 or the WWW server 20 to apologize is prevented. Therefore, the system 10 can be operated safely.
[0066]
Note that the character update counter is not limited to a character string having the same number of digits as the character string to be generated, but to update a character or character string having other digits such as one digit at random. May be. In this case, the character or character string is extracted from the character update counter several times until the WWW server 20 extracts the characters of the number of digits of the character string to be generated, and the extracted characters or character strings are combined to generate characters as linkage data. A sequence may be generated.
[0067]
In the above-described embodiment, the cookie is used as the session identifier. However, when the system is used by a user terminal that does not have a function for handling the cookie in the browser function 41, the WWW server 20 A parameter for identifying a session may be added to Web page data (for example, URL) transmitted to the user terminal, and the session at each user terminal may be managed based on the parameter.
[0068]
In the above-described embodiment, the user terminal 40 is described as a mobile phone terminal. However, a PDA (Personal Digital Assistants), a personal computer, or the like may be used as long as the user terminal 40 has both a browser function and a call function. Other terminal devices may be used.
[0069]
In the above-described embodiment, the voice dialogue server 30 transmits the voice dialogue processing result data and the character string linkage data to the WWW server 20 in step S113. It is good also as a structure which has a database server which manages stored data, and transmits to the database server. In this case, the database server stores the received voice dialogue processing result data in association with the session identifier associated with the same linkage data as the received linkage data, and stores the voice dialogue from the WWW server 20. The voice interaction processing result data stored in response to the processing result inquiry may be transmitted to the WWW server 20. In other words, the storage information of the database 21 may not be managed by the WWW server 20, and may be managed by other servers (for example, the voice interaction server 30 and the database server) included in the system, but may be managed by a plurality of servers. It may be managed in common. That is, as long as the storage information of the database 21 is stored in a state that can be managed by the present system, the storage information may be stored anywhere and in any state.
[0070]
In the above-described embodiment, the WWW server 20 acquires the voice interaction processing result data in response to the Web page acquisition request from the user terminal 40 (display information update request in step S116) (step S117). The configuration is such that the web page data reflecting the voice dialogue processing result indicated by the voice dialogue processing result data is transmitted (step S118), but after the voice dialogue processing result data is saved (step S114), Regardless of whether or not there is a web page acquisition request, the web page data reflecting the voice dialogue processing result indicated by the voice dialogue processing result data may be transmitted to the user terminal 40. If comprised in this way, the result of a voice interaction process can be reflected on a web page, without making the user terminal 40 make a web page acquisition request.
[0071]
In the above-described embodiment, the user terminal 40 makes a call to the voice interaction server 30 in step S108, and after the connection is established, the user terminal 40 emits a tone in step S109. The terminal 40 simultaneously outputs a telephone number and a tone based on the character string of the linkage data. After the exchange connected to the public telephone network 60 establishes a connection between the user terminal 40 and the voice dialogue server 30, the tone is output. It is good also as a structure output toward the voice dialogue server 30. FIG.
[0072]
In each of the above-described embodiments, HTML is used as an example of a display language for generating Web page data. However, it is widely used for displaying a Web page on a browser of a mobile phone terminal. A markup language for mobile phone terminals such as C-HTML (Compact HTML), or other markup languages such as HDML (Handheld Device Markup Language) and WML (Wireless Markup Language) may be used.
[0073]
Furthermore, in each of the embodiments described above, both the voice server and the user terminal are connected to the public telephone line network 60, but may be connected to an IP network such as VoIP (Voice over Internet Protocol).
[0074]
【The invention's effect】
  As described above, according to the display / voice cooperation system of the present invention, the WWW server includes a session database that stores session information indicating a flow of a series of processes performed between the terminal device and the WWW server. In response to a Web page acquisition request from the terminal device, character string data to be used as linkage data for linking with the voice interaction server is determined, and the linkage data is associated with the session information and the communication management information for the terminal device. At the same time, the data is stored in the session database, and the link data is associated with the call data and set as Web page data, and then processing for transmitting the Web page data set with the link data to the terminal device is executed. In addition, the terminal device uses the browser function for displaying the Web page based on the received Web page data, and the call data included in the Web page data in response to a request from the user, toward the voice conversation server. A call function for making a call and outputting a tone based on character string data as linked data associated with the call data. Furthermore, the voice dialogue server generates linkage data by using the tone from the terminal device as character string data,The generated cooperation data is transmitted to the WWW server. The WWW serverOf the session information stored in the session database,Receive from spoken dialogue serverIdentifying session information corresponding to the linked data, determining from the identified session information which service the voice service requested by the terminal device is,The determination result of the voice service requested by the terminal device is transmitted to the voice conversation server. The voice dialogue server further received from the WWW serverBased on the determination result, the execution content of the voice interaction process is determined. With this configuration, the WWW server and the voice interaction server can be linked using the linked data, and the user using the terminal device can perform simple operations without disclosing personal information. It will be possible to receive display and audio linkage services.
[0075]
Since the voice conversation server is configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. Using the data, it is possible to execute a voice dialogue process that matches the content of the service by the Web page for which the voice dialogue process is selected.
[0076]
Since the WWW server is configured to generate character string data in response to a Web page acquisition request from the terminal device and determine the link data using the generated character string data, the link data generated by the WWW server Can be used to link the WWW server and the voice dialogue server.
[0077]
The voice dialogue server executes voice dialogue processing, and associates the voice dialogue processing result data indicating the voice dialogue processing result with the communication management information about the terminal device associated with the same linkage data as the generated linkage data. In this system, the result of the voice dialogue processing by the voice dialogue server is associated with the information about the terminal device that received the service by the voice dialogue processing. Can be stored in
[0078]
In response to a Web page acquisition request from the terminal device, the WWW server acquires voice interaction processing result data associated with the communication management information about the terminal device and stored in the system. Since the web page data reflecting the voice dialogue processing result shown is transmitted, the result of the voice dialogue processing can be reflected on the web page.
[0079]
Web page data in which the WWW server obtains the voice interaction processing result data stored in the system in association with the communication management information about the terminal device, and reflects the voice interaction processing result indicated by the voice interaction processing result data Is transmitted to the terminal device, the result of the voice interaction process can be reflected on the Web page without causing the terminal device to make a Web page acquisition request.
[0080]
Since the linkage data is configured to be character string data composed of a plurality of characters in which a tone corresponding to the character is emitted in the terminal device, the character string data is transmitted via the communication network. The cooperative data can be transmitted and received, and the cooperative data can be transmitted and received as sound data via the communication network.
[0081]
Since the WWW server includes character update means for updating at least one character and is configured to determine character string data as linkage data based on characters extracted from the character update means, character string data as linkage data Can be determined at random, even if it is linked data given to others before and after self, it cannot be predicted based on the linked data given to itself, so the linked data given to others Is prevented from being sent to the voice interaction server and executed, and the system can be operated safely.
[0082]
Since the terminal management information managed corresponding to the terminal device is used as the communication management information, it is possible to store various information such as cooperation data in association with the terminal management information. it can.
[0083]
  In addition, according to the display / voice cooperation server of the present invention, the WWW server includes a session database that stores session information indicating a flow of a series of processing performed between the terminal device connected to the communication network and the WWW server. In response to a Web page acquisition request from the terminal device, the server determines character string data as cooperation data for cooperation with the voice interaction server, and generates the session information and communication management information for the terminal device. The data is stored in the session database in association with each other, and the generated cooperative data is associated with the call data and set as Web page data, and then the Web page data in which the generated cooperative data is set is directed to the terminal device. Execute the process to send. Further, the voice conversation server uses the call data included in the Web page data by the terminal device.Called the voice conversation serverDepending on,In response to execution of a process for establishing a connection with the terminal device, and a tone based on the character string data as linkage data associated with the call data is issued by the terminal device with which the connection is established Then, the linkage data is generated using the tone as character string data, the session information corresponding to the generated linkage data is identified from the session information stored in the session database, and the terminal device uses the voice requested by the terminal device from the identified session information. It is determined which service is the service, and the execution content of the voice interaction process is determined based on the determination result. Since it is configured in this way, it becomes possible to achieve cooperation between the WWW server and the voice conversation server using the cooperation data, and it is easy without disclosing personal information to the user who uses the terminal device. It is possible to provide a display and audio linkage service that can be performed with simple operations.
[0084]
Since the voice conversation server is configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the linkage data has been set is performed. Using the cooperation data, it is possible to execute a voice dialogue process that matches the content of the service by the Web page for which the voice dialogue process is selected.
[0085]
  In addition, according to the display / voice cooperation method of the present invention, the WWW server responds to a web page acquisition request from a terminal device connected to the communication network as cooperation data for cooperation with the voice conversation server. A session database that determines character string data and associates the generated linkage data with session information indicating a flow of a series of processes performed between the terminal device and the WWW server, and communication management information about the terminal device. And storing the generated linkage data in association with the call data and setting it as Web page data, and then executing a process of transmitting the Web page data in which the generated linkage data has been set to the terminal device. The dialog server uses the call data included in the Web page data by the terminal device.Called the voice conversation serverDepending on,In response to execution of a process for establishing a connection with the terminal device, and a tone based on the character string data as linkage data associated with the call data is issued by the terminal device with which the connection is established To generate linkage data using the tone as character string data,The generated cooperation data is transmitted to the WWW server, and the WWW server furtherOf the session information stored in the session database,Receive from spoken dialogue serverIdentifying session information corresponding to the linked data, determining from the identified session information which service the voice service requested by the terminal device is,The voice service requested by the terminal device is transmitted to the voice dialogue server, and the voice dialogue server further receives the result from the WWW server.Since the execution content of the voice interaction processing is determined based on the determination result, the cooperation between the WWW server and the voice interaction server can be achieved using the cooperation data. It is possible to provide a display and audio link service that can be performed with a simple operation without disclosing information.
[0086]
Since the voice conversation server is configured to determine the execution contents of the voice conversation processing so that the voice conversation matching the display contents of the web page based on the web page data for which the linkage data has been set is performed. Using the cooperation data, it is possible to execute a voice dialogue process that matches the content of the service by the Web page for which the voice dialogue process is selected.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an example of a configuration of a display / voice cooperation system according to an embodiment of the present invention.
FIG. 2 is a timing chart showing an example of display / voice cooperation processing and processing timing in an embodiment of the present invention.
FIG. 3 is a timing chart showing an example of display / audio cooperation processing and processing timing in an embodiment of the present invention.
FIG. 4 is an explanatory diagram showing an example of cooperation data.
FIG. 5 is an explanatory diagram showing an example of a database storage state;
FIG. 6 is an explanatory diagram illustrating an example of a display state of a Web page.
FIG. 7 is an explanatory diagram illustrating an example of a display state of a Web page in which a voice conversation processing result is reflected.
FIG. 8 is a block diagram showing an example of the configuration of a conventional display / voice cooperation system.
[Explanation of symbols]
10 Display / Voice Cooperation System
20 WWW server
21 Database
30 Spoken Dialogue Server
40 User terminal
41 Browser function
42 Call function
50 Communication network
60 Public telephone line
70 Voice dialogue selection area

Claims (16)

通信ネットワークに接続される端末装置と、Webページを用いて情報の提供や収集を行うWWWサーバと、通信ネットワークを介して音声による情報の入出力によって音声対話処理を実行する音声対話サーバとを備えた表示・音声連携システムであって、
前記端末装置と前記WWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、
Webページを表示するためのWebページデータは、前記音声対話サーバに向けて発呼するための発呼データを含み、
前記WWWサーバは、前記端末装置からのWebページの取得要求に応じて、前記音声対話サーバとの連携を図るための連携データとして使用する文字列データを決定し、前記セッション情報及び前記端末装置についての通信管理情報に前記連携データを対応付けして前記セッションデータベースに保存するとともに、連携データを前記発呼データに関連付けしてWebページデータに設定したあと、連携データが設定されたWebページデータを前記端末装置に向けて送信する処理を実行し、
前記端末装置は、受信したWebページデータにもとづいてWebページを表示するブラウザ機能と、ユーザからの要求に応じてWebページデータに含まれている発呼データを用いて前記音声対話サーバに向けて発呼し、当該発呼データに関連付けされている連携データとしての文字列データにもとづくトーンを出力する通話機能とを有し、
前記音声対話サーバは、端末装置からのトーンを文字列データとすることで連携データを生成し、生成した連携データを前記WWWサーバに送信し、
前記WWWサーバは、さらに、前記セッションデータベースが記憶するセッション情報のうち、前記音声対話サーバから受信した連携データに対応するセッション情報を特定し、特定したセッション情報から前記端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、前記端末装置が要求した音声によるサービスの判断結果を前記音声対話サーバに送信し、
前記音声対話サーバは、さらに、前記WWWサーバから受信した前記判断結果に基づいて音声対話処理の実行内容を決定する
ことを特徴とする表示・音声連携システム。
A terminal device connected to a communication network; a WWW server that provides and collects information using a Web page; and a voice dialog server that executes voice dialog processing by inputting and outputting voice information via the communication network. Display / voice linkage system,
A session database for storing session information indicating a flow of a series of processing performed between the terminal device and the WWW server;
Web page data for displaying the Web page includes a call data for a call toward the voice interaction server,
The WWW server in response to said request for acquisition of a Web page from the terminal device, the determined character string data to be used as the link data for realizing cooperation with the audio interactive server for the session information and the terminal device The link data is associated with the communication management information and stored in the session database, and the link data is set in the Web page data in association with the call data, and then the Web page data in which the link data is set is displayed. Execute a process of transmitting to the terminal device;
The terminal device includes a browser function of displaying a Web page based on the Web page data received, toward the audio interactive server using the call data contained in the Web page data in response to a request from a user A call function for making a call and outputting a tone based on character string data as linked data associated with the call data;
The voice interaction server generates linkage data by using a tone from a terminal device as character string data, and transmits the generated linkage data to the WWW server.
The WWW server further specifies session information corresponding to the cooperation data received from the voice dialogue server from the session information stored in the session database, and a voice service requested by the terminal device from the specified session information. Is transmitted to the voice dialogue server, the result of the voice service requested by the terminal device is determined,
The voice dialogue server further determines execution contents of voice dialogue processing based on the determination result received from the WWW server .
WWWサーバは、音声対話サーバから受信した連携データに対応するセッション情報を特定すると、特定したセッション情報の中から、前記音声対話サーバから受信した連携データと同一の連携データが設定されているWebページデータを特定し、特定したWebページデータから端末装置が要求した音声によるサービスがいずれのサービスであるかを判断する請求項1記載の表示・音声連携システム。When the WWW server specifies the session information corresponding to the cooperation data received from the voice interaction server, the Web page in which the same cooperation data as the cooperation data received from the voice interaction server is set from the specified session information The display / speech cooperation system according to claim 1, wherein data is specified and a service by voice requested by the terminal device is determined from the specified Web page data. セッションデータベースは、セッション情報及び通信管理情報を連携データに対応付けて記憶する請求項1又は請求項2記載の表示・音声連携システム。 3. The display / voice cooperation system according to claim 1, wherein the session database stores session information and communication management information in association with the cooperation data. WWWサーバは、数字又は記号からなる文字列を更新する文字列カウンタが更新した文字列を抽出することによって、連携データとして文字列を決定する請求項1から請求項3のうちのいずれか1項に記載の表示・音声連携システム。WWW server, by extracting the character string string counter is updated to update a string of numbers or symbols, any one of the claims 1 to 3 for determining a string as the link data display and sound cooperation system according to. 音声対話サーバは、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定する
請求項1から請求項のうちのいずれか1項に記載の表示・音声連携システム。
Voice interaction server, as spoken dialogue that matches the display contents of a Web page based on the Web page data link data is set is made, from the claims 1 to determine the execution content of the voice interaction process of claim 4 The display / voice cooperation system according to any one of the above.
WWWサーバは、端末装置からのWebページの取得要求に応じて文字列データを生成し、生成した文字列データを使用する連携データに決定する
請求項1から請求項のうちのいずれか1項に記載の表示・音声連携システム。
WWW server generates character string data in response to the acquisition request for the Web page from the terminal apparatus, any one of claims 5 the generated character string data from claim 1 to determine the link data to be used Display / speech linkage system described in 1.
音声対話サーバは、音声対話処理を実行し、音声対話処理結果を示す音声対話処理結果データを、生成した連携データと同一の連携データが対応付けされている端末装置についての通信管理情報に対応付けしてシステム内に保存するための処理を実行する
請求項記載の表示・音声連携システム。
The voice dialogue server executes voice dialogue processing, and associates the voice dialogue processing result data indicating the voice dialogue processing result with the communication management information about the terminal device associated with the same linkage data as the generated linkage data. The display / speech cooperation system according to claim 6, wherein the processing for storing in the system is executed.
WWWサーバは、端末装置からのWebページ取得要求に応じて、前記端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、前記音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを送信する
請求項記載の表示・音声連携システム。
In response to a Web page acquisition request from the terminal device, the WWW server acquires voice interaction processing result data associated with communication management information about the terminal device and stored in the system, and the voice interaction processing result The display / voice cooperation system according to claim 7, wherein the Web page data reflecting the voice dialogue processing result indicated by the data is transmitted.
WWWサーバは、端末装置についての通信管理情報に対応付けされてシステム内に保存されている音声対話処理結果データを取得し、前記音声対話処理結果データが示す音声対話処理結果を反映させたWebページデータを前記端末装置に送信する
請求項記載の表示・音声連携システム。
A WWW server acquires voice dialogue processing result data associated with communication management information about a terminal device and stored in the system, and reflects a voice dialogue processing result indicated by the voice dialogue processing result data The display / voice cooperation system according to claim 7 , wherein data is transmitted to the terminal device.
連携データは、文字に対応したトーンが端末装置にて発せられる当該文字を任意に組合せた複数の文字からなる文字列データである
請求項1から請求項のうちいずれかに記載の表示・音声連携システム。
The display / sound according to any one of claims 1 to 9 , wherein the linkage data is character string data composed of a plurality of characters in which a tone corresponding to the character is emitted from the terminal device. Cooperation system.
WWWサーバは、少なくとも1つの文字を更新する文字更新手段を備え、前記文字更新手段から抽出した文字によって連携データとしての文字列データを決定する
請求項10記載の表示・音声連携システム。
The display / speech cooperation system according to claim 10 , wherein the WWW server includes character update means for updating at least one character, and determines character string data as cooperation data based on the character extracted from the character update means.
通信管理情報として、端末装置に対応して管理されている端末管理情報が用いられる
請求項1から請求項11のうちいずれかに記載の表示・音声連携システム。
The display / speech cooperation system according to any one of claims 1 to 11 , wherein terminal management information managed corresponding to a terminal device is used as the communication management information.
Webページを用いて情報の提供や収集を行うWWWサーバと、通信ネットワークを介して音声による情報の入出力によって音声対話処理を実行する音声対話サーバとを備えた表示・音声連携サーバであって、
通信ネットワークに接続される端末装置と前記WWWサーバとの間で行われた一連の処理の流れを示すセッション情報を記憶するセッションデータベースを備え、
Webページを表示するためのWebページデータは、前記音声対話サーバに向けて発呼するための発呼データを含み、
前記WWWサーバは、前記端末装置からのWebページの取得要求に応じて、前記音声対話サーバとの連携を図るための連携データとして文字列データを決定し、前記セッション情報及び前記端末装置についての通信管理情報に生成した連携データを対応付けして前記セッションデータベースに保存するとともに、生成した連携データを前記発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを前記端末装置に向けて送信する処理を実行し、
前記音声対話サーバは、前記端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて当該端末装置との接続を確立するための処理を実行し、接続が確立されている前記端末装置によって前記発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、前記セッションデータベースが記憶するセッション情報のうち、生成した連携データに対応するセッション情報を特定し、特定したセッション情報から前記端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、前記判断結果に基づいて音声対話処理の実行内容を決定する
ことを特徴とする表示・音声連携サーバ。
A display / voice cooperation server comprising a WWW server that provides and collects information using a web page and a voice dialogue server that executes voice dialogue processing by inputting and outputting information by voice via a communication network,
A session database for storing session information indicating a flow of a series of processing performed between a terminal device connected to a communication network and the WWW server;
Web page data for displaying the Web page includes a call data for a call toward the voice interaction server,
The WWW server in response to said request for acquisition of a Web page from the terminal device, wherein the character string data is determined as the link data for realizing cooperation with the audio interactive server, communication for the session information and the terminal device The association data generated in association with the management information is stored in the session database, and the generated association data is associated with the call data and set in the Web page data, and then the generated association data is set in the Web. Executing a process of transmitting page data to the terminal device;
The voice conversation server performs processing for establishing a connection with the terminal device in response to the terminal device calling the voice conversation server using the call data included in the web page data. In response to a tone based on the character string data as the cooperation data associated with the call data being executed by the terminal device that has been established and connected, the tone is used as the character string data. Among the session information stored in the session database, the session information corresponding to the generated linkage data is identified, and the voice service requested by the terminal device is identified from the identified session information. A display / speech characterized by determining and determining the execution content of the voice dialogue processing based on the determination result Linked server.
音声対話サーバは、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定する
請求項13記載の表示・音声連携サーバ。
The display / voice according to claim 13 , wherein the voice dialogue server determines the execution contents of the voice dialogue processing so that the voice dialogue matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. Linked server.
Webページを用いて情報の提供や収集を行うWWWサーバと、通信ネットワークを介して音声による情報の入出力によって音声対話処理を実行する音声対話サーバとの連携を図るための表示・音声連携方法であって、
Webページを表示するためのWebページデータは、前記音声対話サーバに向けて発呼するための発呼データを含み、
前記WWWサーバは、
通信ネットワークに接続された端末装置からのWebページの取得要求に応じて、前記音声対話サーバとの連携を図るための連携データとして文字列データを決定し、
前記端末装置と前記WWWサーバとの間で行われた一連の処理の流れを示すセッション情報、及び前記端末装置についての通信管理情報に、生成した連携データを対応付けしてセッションデータベースに保存するとともに、生成した連携データを前記発呼データに関連付けしてWebページデータに設定したあと、生成した連携データが設定されたWebページデータを前記端末装置に向けて送信する処理を実行し、
前記音声対話サーバは、
前記端末装置がWebページデータに含まれている発呼データを用いて当該音声対話サーバに発呼したことに応じて当該端末装置との接続を確立するための処理を実行し、
接続が確立されている前記端末装置によって前記発呼データに関連付けされている連携データとしての文字列データにもとづくトーンが発せられたことに応じて、当該トーンを文字列データとして連携データを生成し、
生成した連携データを前記WWWサーバに送信し、
前記WWWサーバは、さらに、
前記セッションデータベースが記憶するセッション情報のうち、前記音声対話サーバから受信した連携データに対応するセッション情報を特定し、
特定したセッション情報から前記端末装置が要求した音声によるサービスがいずれのサービスであるかを判断し、
前記端末装置が要求した音声によるサービスの判断結果を前記音声対話サーバに送信し、
前記音声対話サーバは、さらに、前記WWWサーバから受信した前記判断結果に基づいて音声対話処理の実行内容を決定する
ことを特徴とする表示・音声連携方法。
A display / voice linkage method for linking a WWW server that provides and collects information using a Web page and a voice dialogue server that executes voice dialogue processing by inputting and outputting voice information via a communication network. There,
Web page data for displaying the Web page includes a call data for a call toward the voice interaction server,
The WWW server
In response to an acquisition request for a Web page from a terminal device connected to the communication network, determines the character string data as the link data for realizing cooperation with said audio interactive server,
The session information indicating a flow of a series of processes performed between the terminal device and the WWW server, and the communication management information about the terminal device are associated with the generated linkage data and stored in the session database. , After associating the generated linkage data with the call data and setting it as Web page data, executing processing for transmitting the Web page data set with the generated linkage data to the terminal device,
The voice dialogue server
In response to the terminal device calling the voice conversation server using the call data included in the web page data, a process for establishing a connection with the terminal device is executed.
In response to the tone based on the character string data as the cooperation data associated with the call data by the terminal device that has been established, the cooperation data is generated using the tone as the character string data. ,
Send the generated cooperation data to the WWW server,
The WWW server further includes:
Among the session information stored in the session database, identify the session information corresponding to the cooperation data received from the voice dialogue server ,
Determine which service is the voice service requested by the terminal device from the identified session information,
Transmitting the result of the service determination by voice requested by the terminal device to the voice dialogue server;
The voice dialogue server further determines the execution contents of voice dialogue processing based on the determination result received from the WWW server .
音声対話サーバは、連携データが設定されていたWebページデータにもとづくWebページの表示内容に合致した音声対話が行われるように、音声対話処理の実行内容を決定する
請求項15記載の表示・音声連携方法。
The display / voice according to claim 15 , wherein the voice dialogue server determines the execution contents of the voice dialogue processing so that the voice dialogue matching the display contents of the web page based on the web page data for which the cooperation data has been set is performed. Cooperation method.
JP2002166294A 2002-06-06 2002-06-06 Display / voice linkage system, server and method Expired - Fee Related JP4003544B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002166294A JP4003544B2 (en) 2002-06-06 2002-06-06 Display / voice linkage system, server and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002166294A JP4003544B2 (en) 2002-06-06 2002-06-06 Display / voice linkage system, server and method

Publications (2)

Publication Number Publication Date
JP2004015443A JP2004015443A (en) 2004-01-15
JP4003544B2 true JP4003544B2 (en) 2007-11-07

Family

ID=30433914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002166294A Expired - Fee Related JP4003544B2 (en) 2002-06-06 2002-06-06 Display / voice linkage system, server and method

Country Status (1)

Country Link
JP (1) JP4003544B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11048995B2 (en) 2017-05-16 2021-06-29 Google Llc Delayed responses by computational assistant
CN111524516A (en) * 2020-04-30 2020-08-11 青岛海信网络科技股份有限公司 Control method based on voice interaction, server and display device

Also Published As

Publication number Publication date
JP2004015443A (en) 2004-01-15

Similar Documents

Publication Publication Date Title
US8155280B1 (en) Systems and methods for visual presentation and selection of IVR menu
US8903073B2 (en) Systems and methods for visual presentation and selection of IVR menu
US8929517B1 (en) Systems and methods for visual presentation and selection of IVR menu
US20190082043A1 (en) Systems and methods for visual presentation and selection of ivr menu
US20090117884A1 (en) Method and telephone for use of telephone book data stored in a telephone book data bank of a server
US7277733B2 (en) System and method for providing web content provision service using subscriber terminal in exchange system
US7653381B2 (en) Method for inputting and searching information about an object in a remote database
JP3322262B2 (en) Wireless mobile terminal communication system
KR100393048B1 (en) A method for connecting on the wireless site by the phone number
JP2004015763A (en) Call center support device and program
JP4003544B2 (en) Display / voice linkage system, server and method
JP2013042374A (en) Registration support system, registration support server and registration support program
US20120192083A1 (en) Method and system for enhanced online searching
JP2004221902A (en) Information providing system and information providing method
JP3925326B2 (en) Terminal communication system, linkage server, voice dialogue server, voice dialogue processing method, and voice dialogue processing program
JP3781000B2 (en) Display / sound linkage system, display / sound linkage server, display / sound linkage method, and display / sound linkage program
US7894834B1 (en) Method and system to facilitate multiple media content providers to inter-work with media serving system
KR100688877B1 (en) Mobile phone number provision method, server and system thereof
US20090180467A1 (en) System and Method for Connecting Remote Callers with PBX Extensions Using Internet Telephony
JP2007096570A (en) Phone connection method
JP4196534B2 (en) Information providing system and information providing method related to printing apparatus
JP2004110687A (en) Personal identification information management system for communication terminals
KR100964389B1 (en) Apparatus and Method for Providing Customized Guidance in Intelligent Network
KR100920074B1 (en) How to Provide Specific (Voice) Service Based on Outgoing Client
KR100592933B1 (en) National representative number service method of VoIP environment

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20051116

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060518

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070731

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070813

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110831

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110831

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120831

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130831

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees