JP4141782B2 - Image display device, image display method, and program - Google Patents
Image display device, image display method, and program Download PDFInfo
- Publication number
- JP4141782B2 JP4141782B2 JP2002287473A JP2002287473A JP4141782B2 JP 4141782 B2 JP4141782 B2 JP 4141782B2 JP 2002287473 A JP2002287473 A JP 2002287473A JP 2002287473 A JP2002287473 A JP 2002287473A JP 4141782 B2 JP4141782 B2 JP 4141782B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- position information
- speaker
- information
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Controls And Circuits For Display Device (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- User Interface Of Digital Computer (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、話者の居る位置に基づいて特定の画像を画面上に表示させる画像表示装置、画像表示方法及びプログラムに関する。
【0002】
【従来の技術】
従来から、コンピュータが特定の話者に話し掛ける音声システムがある(例えば、特許文献1参照。)。これにより、遊技場等の人が多く出入りするような場所に音声システムを構築すれば、その音声を発するコンピュータは、一種の広告塔としての機能を果たすことができる。また、特に一人暮らしの者が、自宅に音声システムを配備すれば、音声を発するコンピュータが、その者からの音声に応じて所定の回答文を出力するので、かかる者は、少しでも一人暮らしの寂しさを紛らわすことができる。
【0003】
【特許文献1】
特開2002−169804(第5−13、第15図)
【0004】
【発明が解決しようとする課題】
しかしながら、話者が上記コンピュータに対して発話したとしても、コンピュータが単にその発話に対して所定の回答文を出力していただけであるので、その話者は何か物足りなさを感じていた。このため、従来からは、話者に飽きさせることのないキャラクタの動作を見せることで、話者をより楽しませ、話者がそのキャラクタとの間でコミュニケーションを取っているかのような感覚を味わせることのできるシステムの開発が望まれていた。
【0005】
そこで、本発明は以上の点に鑑みてなされたものであり、話者が居る位置に応じて画面に表示された画像を変化させることで、その話者が、その変化された画像を見て恰も他の話者との間でコミュニケーションを取っているかのような感覚を味わうことのできる画像表示装置、画像表示方法及びプログラムを提供することを課題とする。
【0006】
【課題を解決するための手段】
本発明は、上記課題を解決すべくなされたものであり、画面中のいずれかの領域に表示される複数の画像のそれぞれには、各領域にそれぞれ相応する配置関係の位置情報のうち、話者が居るであろうと予想される位置情報が対応付けられ、その各画像を予め記憶し、話者から発せられた音声に基づいて話者の位置を推定し、推定された位置に基づいて、その位置と予め記憶された各位置情報とを照合し、その各位置情報の中から、上記位置に応じた位置情報を検索し、検索された位置情報に基づいて、位置情報に対応付けられた画像を取得し、取得された画像を、画面の、位置推定手段で推定された位置に応じた位置情報に相応する配置関係の領域に表示することを特徴とする。
【0007】
このような本願に係る発明によれば、画像表示装置が、推定した話者の位置に基づいて、その位置と一致する位置情報に対応付けられた画像を画面に表示することができる。即ち、画像表示装置は、話者が居る位置に応じて特定の画像を画面に表示することができる。
【0008】
上記構成においては、各画像のそれぞれには、所定のキャラクタが含まれ、各画像のそれぞれに対応付けられた位置情報には、キャラクタを特定の領域に表示させるための領域情報が対応付けられ、検索された位置情報に対応付けられた領域情報に基づいて、その領域情報に対応する領域に、検索された位置情報に対応付けられた画像に含まれるキャラクタを表示することが好ましい。尚、この各領域は、キャラクタが移動する方向に設けることが好ましい。
【0009】
これにより、キャラクタが移動する方向に各領域が設けられている場合には、画像表示装置は、例えば、話者の移動に伴なって画面上のキャラクタを同方向に移動させることができる。この場合、話者が特定の方向に移動すると、画面上のキャラクタが同方向に移動するので、その話者は、そのキャラクタとの間で恰もコミュニケーションを取っているかのような感覚を味わうことができる。
【0010】
尚、画像表示装置は、所定のキーワードを予め複数記憶し、話者から発せられた音声に対応する文字列を認識し、認識された文字列に基づいて文字列と一致するキーワードを検索することができた場合には、検索された位置情報に対応付けられた画像を取得することが好ましい。
【0011】
この場合には、画像表示装置は、話者から発せられた音声に対応する文字列に基づいて、その文字列と一致するキーワードを検索することができたときは、検索された位置情報に対応付けられた画像を表示することができる。この結果、話者は、自己の特定の言葉に反応して画面上の画像が移動するので、恰もその画像との間でコミュニケーションを取っているかのような感覚を味わうことができる。
【0012】
尚、各キーワードの内容としては、各話者との間で最初又は最後に交わされる挨拶文等が挙げられる。この場合には、話者は、特定の挨拶文を発すれば、その挨拶文に反応して画面上の画像が移動するので、話者は、画面上の画像との間で親密な関係を有するかのような感覚を味わうことができる。この結果、話者は、画面上の画像との間でより多くの出来事を話そうとする動機付けが高まり、退屈な時間をより楽しく過ごすことができる。
【0013】
【発明の実施の形態】
[実施形態]
(画像表示装置の基本構成)
本発明に係る画像表示装置について図面を参照しながら説明する。図1は、本実施形態に係る画像表示装置100の内部構造を示す図である。同図に示すように、画像表示装置100は、話者の居る位置に応じた画像を画面に表示させるものである。画像表示装置100は、本実施形態では、音声入力部110と、位置推定部120と、画像検索部130と、画像記憶部140と、出力部150とを有する。
【0014】
前記音声入力部110は、話者から発せられた音声を取得するものである。この音声入力部110は、本実施形態では、複数のマイクロホンで構成することができる。具体的に、話者から発せられた音声を取得した音声入力部110は、取得した音声を音声信号として位置推定部120に出力する。
【0015】
位置推定部120は、話者から発せられた音声に基づいて話者の位置を推定するものである。ここで、話者の位置は、図2に示すように、座標系で示すことができる。この座標系は、話者が居るであろう位置を示す仮想的なものである。これら各座標は、本実施形態では、(xi、yj){i=1、2、・・・n;j=1、2、・・・m}で示すものとする。尚、位置推定部120は、本実施形態では、推定した位置を座標系で特定しているが、極座標系で特定してもよい。
【0016】
具体的に、音声入力部110から音声信号が入力された位置推定部120は、先ず入力された複数の音声信号に基づいて、それら音声信号の相互相関関数を、全てのマイクロホンの組み合わせについて計算する。この相互相関関数を計算した位置推定部120は、計算した相互相関関数に基づいて、予め決められた一の基準マイクロホンと他のマイクロホンとの間の最大値を与える時間差を求める。
【0017】
この位置推定部120は、求めた時間差に基づいて話者(音源)の位置を推定する(参考文献:特開平11−304906)。話者の位置を推定した位置推定部120は、推定した位置を位置信号として画像検索部130に出力する。尚、その他の複数のマイクロホンから得られる音声信号を処理して話者の位置を推定する方法は、文献「音響システムと信号処理」、大賀他、電子情報通信学会の7章に詳述されている。
【0018】
画像検索部130は、位置推定部120で推定された位置に基づいて、その位置と予め記憶された各位置情報とを照合し、各位置情報の中から、その位置と一致する位置情報を検索するものである。また、画像検索部130は、検索した位置情報に基づいて、その位置情報に対応付けられた画像を取得するものでもある。
【0019】
ここで、複数の画像のそれぞれには、話者が位置するであろうと予測される位置情報が対応付けられている。この各画像(画像パターン1−1、画像パターン1−2・・・)は、本実施形態では、図4に示すように、予め画像記憶部140に記憶されている。
【0020】
具体的に、位置推定部120から位置信号が入力された画像検索部130は、入力された位置信号に対応する話者の位置と、予め記憶された各位置情報とを照合し、各位置情報の中から、その話者の位置と一致する位置情報を検索する。画像検索部130は、その検索した位置情報に対応付けられた画像パターンを取得する。画像検索部130は、その取得した画像パターンを画像信号として出力部150に出力する。
【0021】
出力部150は、画像検索部130で検索された画像パターンを画面に表示するものである。出力部150は、本実施形態では、液晶ディスプレイ等が挙げられる。具体的に、画像検索部130から画像信号が入力された出力部150は、入力された画像信号に基づいて、画像信号に対する画像パターンを画面に表示する。
【0022】
尚、各画像のそれぞれには、所定のキャラクタを含めてもよい。また、その各画像のそれぞれに対応付けられた位置情報には、上記キャラクタを特定の領域に表示させるための領域情報を対応付けてもよい。この特定の領域は、図5に示すように、本実施形態では、キャラクタが移動する方向、例えば水平方向に設けられるものとする。ここで、キャラクタは、本実施形態では、現存の人物、架空の人物又は動物等を意味するものである。
【0023】
具体的に、キャラクタは、本実施形態では、図5及び図6に示すように、話者が居る位置に応じて、基準領域、A領域〜D領域のいずれかの領域に移動する。この基準領域は、本実施形態では、キャラクタが最初に位置する領域を意味する。キャラクタは、その基準領域を中心として、A領域〜D領域のいずれかの領域へと移動する。
【0024】
即ち、出力部150は、画像検索部130で検索された位置情報に対応付けられた領域情報に基づいて、その領域情報に対応する領域に、検索された位置情報に対応付けられた画像に含まれるキャラクタを表示する。これにより、出力部150は、話者が居る位置に応じてキャラクタを移動させることができる。
【0025】
尚、各領域は、図6に示すように、話者が居る(位置する)であろうと予測される上記位置情報と相応する配置関係に設けることが好ましい。即ち、各領域は、各位置情報に対応する各位置の関係と相対的に釣り合いが取れた配置関係に設けることが好ましい。
【0026】
例えば、各位置情報に対応する各位置が、図6に示すように、音声入力部110の中央部分(同図中の”基準領域”)である場合には、上記基準領域は、その各位置と相対的に釣り合いが取れた部分、即ち画面の中央部分(図5中の”基準領域”)に設ける。これと同様にして、A〜D領域も各位置情報に対応する各位置と相応する部分に設けることができる。これにより、話者が特定の方向に移動したときは、画面上のキャラクタは、その方向と同一の方向に移動することができる。
【0027】
(画像表示装置を用いた画像表示方法)
上記構成を有する画像表示装置による画像表示方法は、以下の手順により実施することができる。図7は、本実施形態に係る画像表示方法の手順を示すフロー図である。
【0028】
先ず、音声入力部110が、話者から発せられた音声を取得するステップを行う(S101)。この音声入力部110は、本実施形態では、複数のマイクロホンで構成することができる。具体的に、話者から発せられた音声を取得した音声入力部110は、取得した音声を音声信号として位置推定部120に出力する。
【0029】
そして、位置推定部120が、話者から発せられた音声に基づいて話者の位置を推定するステップを行う(S102)。具体的に、音声入力部110から音声信号が入力された位置推定部120は、先ず入力された複数の音声信号に基づいて、それら音声信号の相互相関関数を、全てのマイクロホンの組み合わせについて計算する。
【0030】
この相互相関関数を計算した位置推定部120は、計算した相互相関関数に基づいて、予め決められた一の基準マイクロホンと他のマイクロホンとの間の最大値を与える時間差を求める。位置推定部120は、求めた時間差に基づいて話者(音源)の位置を推定する(参考文献:特開平11−304906)。話者の位置を推定した位置推定部120は、推定した位置を位置信号として画像検索部130に出力する。
【0031】
次いで、出力部150が、画像検索部130で検索された画像を画面に表示するステップを行う(S103)。具体的に、位置推定部120から位置信号が入力された画像検索部130は、入力された位置信号に対応する話者の位置と、予め記憶された各位置情報とを照合し、各位置情報の中から、その話者の位置と一致する位置情報を検索する。
【0032】
その画像検索部130は、その検索した位置情報に対応付けられた画像パターンを取得する。画像検索部130は、その取得した画像パターンを画像信号として出力部150に出力する。画像検索部130から画像信号が入力された出力部150は、入力された画像信号に基づいて、画像信号に対する画像パターンを画面に表示する。
【0033】
(画像表示装置及び画像表示方法による作用及び効果)
このような本願に係る発明によれば、出力部150が、位置推定部120で推定された話者の位置に基づいて、その位置と一致する位置情報に対応付けられた画像を画面に表示することができる。即ち、出力部150は、話者が居る位置に応じて特定の画像を画面に表示することができる。
【0034】
また、出力部150は、画像検索部130で検索された位置情報に対応付けられた領域情報に基づいて、その領域情報に対応する領域に、検索された位置情報に対応付けられた画像に含まれるキャラクタを表示することができる。これにより、キャラクタが移動する方向に各領域が設けられている場合には、出力部150は、例えば、話者の移動に伴なって画面上のキャラクタを同方向に移動させることができるので、その話者は、そのキャラクタとの間で恰もコミュニケーションを取っているかのような感覚を味わうことができる。
【0035】
[変更例]
尚、本発明は、上記実施形態に限定されるものではなく、以下に示す変更を加えることができる。
【0036】
(第一変更例)
図8に示すように、音声入力部110を構成する各マイクロホン111a〜111cは、特定の方向に配備してもよい。本変更例では、各マイクロホン111a〜111cは、一列に並べるものとする。また、位置推定部120は、各マイクロホンで取得された音声に基づいて、話者が各マイクロホンに向かって音声を発した方向と各マイクロホンが配備されている方向との間でなす角度を算出するものであってもよい。
【0037】
ここで、図8は、二つのマイクロホン111b、111cに平面波が入力する様子を示すものである。この二つのマイクロホン111b、111cに平面波が入力された時間差が幾何学的に何を示しているのかを説明するものである。同図中の破線は平面波の等位相面を示す。同図は、これらの平面波が、先ずマイクロホン111bに到達し、遅れてマイクロホン111cに到達する様子を描いている。
【0038】
同図に示すように、各平面波が各マイクロホン111b、111cに到達する時間差(到達時間差)は、各マイクロホンの間隔と入射角度θの余角との積を正規化音速cで除したものである。すなわち、到達時間差は、マイクロホン間隔cosθ/cとして表現することができる。この入射角度θは、本変更例では、話者が各マイクロホン111a〜111cに向かって音声を発した方向と各マイクロホン111a〜111cが配備されている方向との間でなす角度を意味する。
【0039】
上記式を変形すると、入射角度θは、arccos(c到達時間差/マイクロホン間隔)となる。従って、入射角度θは、到達時間差とマイクロホン間隔が分かれば特定することができる。
【0040】
具体的に、各マイクロホンから音声信号が入力された位置推定部120は、入力された各音声信号に基づいて、少なくとも二つの音声信号が入力された時間差を算出する。この時間差は上記到達時間差とすることができる。この到達時間差を算出した位置推定部120は、上式に従って、算出した到達時間差と、上記各音声信号を取得した各マイクロホンの間隔とに基づいて平面波の入射角度θを算出する。位置推定部120は、その算出した入射角度θを角度信号として画像検索部130に出力する。
【0041】
画像検索部130は、位置推定部120で算出された入射角度θに基づいて、この入射角度θと予め設定された各符号とを照合し、各符号の中から、入射角度θと一致する符号を検索するものであってもよい。この符号は、本変更例では角度情報として表現する。
【0042】
ここで、本変更例では、各画像のそれぞれには、所定のキャラクタの顔が含まれ、その各画像を順次切り替えることにより顔は、所定の回転角をもって回転するように表示されるものとなっている。また、画像に対応付けられた角度情報の大きさは、本変更例では、画像に含まれる顔の回転角の大きさと一致するものとする。
【0043】
すなわち、図10に示すように、正面を向いている顔は、回転角を有しないので、例えば、正面を向いた顔の画像2−0には、角度情報0を対応付ける。同様にして、図11に示すように、斜め30°の方向を向いている顔は、回転角30°を有するので、例えば、斜め30°の方向を向いている顔の画像2−30には、角度情報30を対応付ける。
【0044】
具体的に、位置推定部120から角度信号が入力された画像検索部130は、入力された角度信号に対応する入射角度θに基づいて、各角度情報の中から、入射角度θ(例えば、3)と一致する角度情報3を検索する。この角度情報3を検索した画像検索部130は、検索した角度情報3に基づいて、角度情報3に対応付けられた画像2−3を取得する。出力部150は、画像検索部130で検索された画像2−3を画面に表示する。
【0045】
このような本変更例に係る発明によれば、画像検索部130は、位置推定部120で算出された入射角度θに基づいて、その入射角度θと一致する角度情報に対応付けられた画像を画面に表示させることができる。また、画像検索部130は、画面上の画像を一義的に動作させるのではなく、話者の位置に応じて画像を動作させることができるので、その話者は、画面上に表示された画像との間でコミュニケーションを取っているかのような感覚を味わうことができる。
【0046】
更に、画像検索部130は、話者から発せられた音声の入射角度に応じて、画面に表示された顔の画像の回転角を変えることができる。これにより、話者が所定の音声を発すれば、画面に表示された顔の画像が話者の方向を向くので、その話者は、恰もその顔画像との間でコミュニケーションを取っているかのような感覚を味わうことができる。
【0047】
(第二変更例)
尚、画像記憶部140は、所定のキーワードを予め複数記憶するものであってもよい。また、音声入力部110は、話者から発せられた音声に対応する文字列を認識するものであってもよい。更に、画像検索部130は、音声入力部110で認識された文字列に基づいて文字列と一致するキーワードを検索することができた場合には、自部で検索した位置情報に対応付けられた画像を取得することが好ましい。
【0048】
この場合には、画像検索部130は、話者から発せられた音声に対応する文字列に基づいて、その文字列と一致するキーワードを検索することができたときは、検索した位置情報に対応付けられた画像を出力部150で表示させることができる。この結果、話者は、自己の特定の言葉に反応して画面上の画像が移動するので、恰もその画像との間でコミュニケーションを取っているかのような感覚を味わうことができる。
【0049】
尚、各キーワードの内容としては、各話者との間で最初又は最後に交わされる挨拶文等が挙げられる。この場合には、話者は、特定の挨拶文を発すれば、その挨拶文に反応して画面上の画像が移動するので、話者は、画面上の画像との間で親密な関係を有するかのような感覚を味わうことができる。この結果、話者は、画面上の画像との間でより多くの出来事を話そうとする動機付けが高まり、退屈な時間をより楽しく過ごすことができる。
【0050】
[プログラム]
上記画像表示装置及び画像表示方法で説明した内容は、パーソナルコンピュータ等の汎用コンピュータで、所定のプログラム言語で記述された専用プログラムを実行することにより実現することができる。
【0051】
このような本実施形態に係るプログラムによれば、話者が居る位置に応じて画面に表示させる画像を変化させることで、その話者が、その変化された画像を見て恰も他の話者との間でコミュニケーションを取っているような感覚を味わうことができるという作用効果を奏する画像表示装置及び画像表示方法を一般的な汎用コンピュータで容易に実現することができる。
【0052】
尚、プログラムは、記録媒体に記録することができる。この記録媒体は、図12に示すように、例えば、ハードディスク200、フレキシブルディスク300、コンパクトディスク400、ICチップ500、カセットテープ600などが挙げられる。このようなプログラムを記録した記録媒体によれば、プログラムの保存、運搬、販売などを容易に行うことができる。
【0053】
【発明の効果】
以上説明したように本発明によれば、話者が居る位置に応じて画面に表示された画像を変化させることで、その話者は、その変化された画像を見て恰も他の話者との間でコミュニケーションを取っているかのような感覚を味わうことができる。
【図面の簡単な説明】
【図1】本実施形態に係る画像表示装置の内部構成を示すブロック図である。
【図2】本実施形態における音声入力部の前で話者が行動するであろうと予想される仮想的な範囲を示す図である。
【図3】本実施形態における位置推定部で推定された話者の位置を示す図である。
【図4】本実施形態における画像記憶部で記憶される各位置情報及び各画像の内容を示す図である。
【図5】本実施形態における画面で所定のキャラクタが移動する様子を示す図である。
【図6】本実施形態における出力部が話者の位置に応じてキャラクタを画面上に表示させる各領域を示す図である。
【図7】本実施形態に係る画像表示方法の手順を示すフロー図である。
【図8】本変更例における位置推定部が平面波の入射角度を特定する様子を示す図である。
【図9】本変更例における画像記憶部で記憶する各角度情報及び各画像の内容を示す図である。
【図10】変更例における出力部で表示する人物のキャラクタを示す図である(その1)。
【図11】変更例における出力部で表示する人物のキャラクタを示す図である(その2)。
【図12】本実施形態におけるプログラムを記録する記録媒体を示す図である。
【符号の説明】
100…画像表示装置、110…音声入力部、111…マイクロホン、120…位置推定部、130…画像検索部、140…画像記憶部、150…出力部、160…画像検索部、200…ハードディスク、300…フレキシブルディスク、400…コンパクトディスク、500…ICチップ、600…カセットテープ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image display device, an image display method, and a program for displaying a specific image on a screen based on a position where a speaker is present.
[0002]
[Prior art]
Conventionally, there is an audio system in which a computer talks to a specific speaker (see, for example, Patent Document 1). Thus, if a sound system is constructed in a place where many people such as a game hall enter and leave, the computer that emits the sound can function as a kind of advertising tower. Also, especially if a person living alone deploys a voice system at home, the computer that emits the sound outputs a predetermined answer sentence according to the voice from the person, so that person is lonely living alone. Can be confused.
[0003]
[Patent Document 1]
JP 2002-169804 (FIGS. 5-13 and 15)
[0004]
[Problems to be solved by the invention]
However, even if the speaker utters to the computer, the computer simply outputs a predetermined answer to the utterance, and the speaker felt something unsatisfactory. For this reason, traditionally, the behavior of a character that does not bore the speaker is shown to make the speaker more enjoyable and feel as if the speaker is communicating with the character. The development of a system that can be adjusted is desired.
[0005]
Therefore, the present invention has been made in view of the above points, and by changing the image displayed on the screen according to the position where the speaker is, the speaker can see the changed image. It is an object of the present invention to provide an image display device, an image display method, and a program that allow the user to enjoy a feeling as if the user is communicating with another speaker.
[0006]
[Means for Solving the Problems]
The present invention has been made to solve the above problems, each of multiple images displayed on one area of the screen, among the position information of the positional relationship corresponding to each area, The location information where the speaker is expected to be located is associated, each image is stored in advance, the location of the speaker is estimated based on the speech uttered from the speaker, and based on the estimated location The position is compared with each position information stored in advance, the position information corresponding to the position is searched from the position information, and the position information is associated with the position information based on the searched position information. The acquired image is acquired, and the acquired image is displayed in an area of the layout relation corresponding to the position information corresponding to the position estimated by the position estimating means on the screen .
[0007]
According to the invention according to the present application, the image display device can display an image associated with position information that matches the position on the screen based on the estimated position of the speaker. In other words, the image display device can display a specific image on the screen according to the position where the speaker is present.
[0008]
In the above configuration, each image includes a predetermined character, and the position information associated with each image is associated with region information for displaying the character in a specific region, Based on the area information associated with the retrieved position information, it is preferable to display a character included in the image associated with the retrieved position information in the area corresponding to the area information. Each area is preferably provided in the direction in which the character moves.
[0009]
Thereby, when each area | region is provided in the direction to which a character moves, the image display apparatus can move the character on a screen to the same direction with the movement of a speaker, for example. In this case, when the speaker moves in a specific direction, the character on the screen moves in the same direction, so that the speaker may feel as if he or she is communicating with the character. it can.
[0010]
The image display device stores a plurality of predetermined keywords in advance, recognizes a character string corresponding to a voice uttered by a speaker, and searches for a keyword that matches the character string based on the recognized character string. If it is possible, it is preferable to acquire an image associated with the searched position information.
[0011]
In this case, when the image display device can search for a keyword that matches the character string based on the character string corresponding to the voice uttered by the speaker, the image display device corresponds to the searched position information. The attached image can be displayed. As a result, the speaker moves the image on the screen in response to his / her specific words, so that the speaker can feel as if he / she is communicating with the image.
[0012]
Note that the content of each keyword includes a greeting sentence exchanged with each speaker first or last. In this case, if the speaker utters a specific greeting, the image on the screen moves in response to the greeting, so the speaker has an intimate relationship with the image on the screen. You can enjoy the feeling of having it. As a result, the speaker is more motivated to talk more events with the image on the screen, and can have a more enjoyable boring time.
[0013]
DETAILED DESCRIPTION OF THE INVENTION
[Embodiment]
(Basic configuration of image display device)
An image display apparatus according to the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing an internal structure of the
[0014]
The
[0015]
The
[0016]
Specifically, the
[0017]
The
[0018]
Based on the position estimated by the
[0019]
Here, each of the plurality of images is associated with position information where it is predicted that the speaker will be located. In the present embodiment, each image (image pattern 1-1, image pattern 1-2,...) Is stored in advance in the
[0020]
Specifically, the
[0021]
The
[0022]
Each image may include a predetermined character. Further, the position information associated with each of the images may be associated with area information for displaying the character in a specific area. As shown in FIG. 5, this specific area is provided in the direction in which the character moves, for example, in the horizontal direction in this embodiment. Here, in the present embodiment, the character means an existing person, a fictional person, an animal, or the like.
[0023]
Specifically, in this embodiment, as shown in FIGS. 5 and 6, the character moves to one of the reference area and the areas A to D according to the position where the speaker is present. In the present embodiment, this reference area means an area where the character is first positioned. The character moves from the A area to the D area around the reference area.
[0024]
That is, the
[0025]
As shown in FIG. 6, each region is preferably provided in an arrangement relationship corresponding to the position information predicted that a speaker is present (positioned). That is, it is preferable to provide each region in an arrangement relationship that is relatively balanced with the relationship between the positions corresponding to the position information.
[0026]
For example, when each position corresponding to each position information is the central portion ("reference area" in the figure) of the
[0027]
(Image display method using image display device)
The image display method by the image display apparatus having the above configuration can be implemented by the following procedure. FIG. 7 is a flowchart showing the procedure of the image display method according to the present embodiment.
[0028]
First, the
[0029]
And the
[0030]
The
[0031]
Next, the
[0032]
The
[0033]
(Operation and effect of image display device and image display method)
According to the invention according to this application, the
[0034]
Further, the
[0035]
[Example of change]
In addition, this invention is not limited to the said embodiment, The change shown below can be added.
[0036]
(First change example)
As shown in FIG. 8, each of the
[0037]
Here, FIG. 8 shows a state in which plane waves are input to the two
[0038]
As shown in the figure, the time difference (arrival time difference) at which each plane wave reaches each of the
[0039]
When the above equation is modified, the incident angle θ becomes arccos (c arrival time difference / microphone interval). Therefore, the incident angle θ can be specified if the arrival time difference and the microphone interval are known.
[0040]
Specifically, the
[0041]
Based on the incident angle θ calculated by the
[0042]
Here, in this modified example, each image includes a face of a predetermined character, and the face is displayed so as to rotate at a predetermined rotation angle by sequentially switching each image. ing. In the present modification, the size of the angle information associated with the image is assumed to match the size of the face rotation angle included in the image.
[0043]
That is, as shown in FIG. 10, since the face facing the front does not have a rotation angle, for example, the angle information 0 is associated with the image 2-0 of the face facing the front. Similarly, as shown in FIG. 11, a face that faces 30 ° obliquely has a rotation angle of 30 °. Therefore, for example, an image 2-30 of a face that faces 30 ° obliquely has a rotation angle of 30 °. The
[0044]
Specifically, the
[0045]
According to the invention according to the present modification example, the
[0046]
Furthermore, the
[0047]
(Second modified example)
Note that the
[0048]
In this case, when the
[0049]
Note that the content of each keyword includes a greeting sentence exchanged with each speaker first or last. In this case, if the speaker utters a specific greeting, the image on the screen moves in response to the greeting, so the speaker has an intimate relationship with the image on the screen. You can enjoy the feeling of having it. As a result, the speaker is more motivated to talk more events with the image on the screen, and can have a more enjoyable boring time.
[0050]
[program]
The contents described in the image display apparatus and the image display method can be realized by executing a dedicated program written in a predetermined program language on a general-purpose computer such as a personal computer.
[0051]
According to such a program according to the present embodiment, by changing the image to be displayed on the screen according to the position where the speaker is, the speaker sees the changed image and the other speaker An image display device and an image display method that have an effect of being able to taste a sense of communicating with a general-purpose computer can be easily realized.
[0052]
The program can be recorded on a recording medium. Examples of the recording medium include a
[0053]
【The invention's effect】
As described above, according to the present invention, by changing the image displayed on the screen according to the position where the speaker is, the speaker can see the changed image from the other speaker. You can feel as if you are communicating with each other.
[Brief description of the drawings]
FIG. 1 is a block diagram showing an internal configuration of an image display apparatus according to an embodiment.
FIG. 2 is a diagram illustrating a virtual range in which a speaker is expected to act in front of a voice input unit according to the present embodiment.
FIG. 3 is a diagram illustrating a speaker position estimated by a position estimation unit according to the present embodiment.
FIG. 4 is a diagram showing position information and contents of each image stored in an image storage unit in the present embodiment.
FIG. 5 is a diagram illustrating a state in which a predetermined character moves on the screen according to the present embodiment.
FIG. 6 is a diagram illustrating each region where an output unit according to the present embodiment displays a character on the screen according to the position of a speaker.
FIG. 7 is a flowchart showing a procedure of an image display method according to the present embodiment.
FIG. 8 is a diagram illustrating a state in which a position estimation unit according to the present modification specifies an incident angle of a plane wave.
FIG. 9 is a diagram illustrating each angle information stored in an image storage unit and contents of each image in the present modification example.
FIG. 10 is a diagram showing a human character displayed on the output unit in the modified example (No. 1);
FIG. 11 is a diagram showing a character of a person displayed on the output unit in the modified example (No. 2).
FIG. 12 is a diagram showing a recording medium for recording a program in the present embodiment.
[Explanation of symbols]
DESCRIPTION OF
Claims (12)
前記話者から発せられた音声に基づいて該話者の位置を推定する位置推定手段と、
前記位置推定手段で推定された前記位置に基づいて、該位置と予め記憶された前記各位置情報とを照合し、該各位置情報の中から、該位置に応じた前記位置情報を検索し、検索された該位置情報に対応付けられた前記画像を取得する画像取得手段と、
前記画像取得手段で取得された前記画像を、前記画面の、前記位置推定手段で推定された前記位置に応じた位置情報に相応する配置関係の領域に表示する表示手段と
を有することを特徴とする画像表示装置。 Each multiple images displayed on one area of the screen, the one of the position information of the positional relationship corresponding to each area, position corresponding to a position that will be expected that it would talker is present Image storage means associated with position information and storing each of the images in advance;
Position estimation means for estimating the position of the speaker based on the voice emitted from the speaker;
Based on the position estimated by the position estimating means, the position is compared with each position information stored in advance, and the position information corresponding to the position is searched from the position information, Image acquisition means for acquiring the image associated with the searched position information;
Display means for displaying the image acquired by the image acquisition means in an area of the screen corresponding to the position information corresponding to the position estimated by the position estimation means. An image display device.
所定のキーワードを予め複数記憶するキーワード記憶手段と、
前記話者から発せられた音声に対応する文字列を認識する文字認識手段とを有し、
前記画像取得手段は、前記文字認識手段で認識された前記文字列に基づいて、該文字列と一致する前記キーワードを検索することができた場合には、検索された前記位置情報に対応付けられた前記画像を取得する
ことを特徴とする画像表示装置。The image display device according to claim 1,
Keyword storage means for storing a plurality of predetermined keywords in advance;
Character recognition means for recognizing a character string corresponding to a voice emitted from the speaker;
When the image acquisition unit can search for the keyword that matches the character string based on the character string recognized by the character recognition unit, the image acquisition unit is associated with the searched position information. An image display device that acquires the image.
前記各画像のそれぞれには、所定のキャラクタが含まれ、該各画像のそれぞれに対応付けられた前記位置情報には、該キャラクタを特定の領域に表示させるための領域情報が対応付けられ、
前記表示手段は、前記画像取得手段で検索された前記位置情報に対応付けられた前記領域情報に基づいて、該領域情報に対応する前記領域に、検索された該位置情報に対応付けられた前記画像に含まれる前記キャラクタを表示する
ことを特徴とする画像表示装置。The image display device according to claim 1, wherein:
Each of the images includes a predetermined character, and the position information associated with each of the images is associated with region information for displaying the character in a specific region.
Based on the region information associated with the position information retrieved by the image acquisition unit, the display unit associates the region associated with the region information with the retrieved location information. An image display device that displays the character included in an image.
前記各領域は、前記キャラクタが移動する方向に設けられることを特徴とする画像表示装置。The image display device according to claim 3,
Each area is provided in a direction in which the character moves.
前記話者から発せられた音声に基づいて該話者の位置を推定するステップと、
推定された前記位置に基づいて、該位置と予め記憶された前記各位置情報とを照合し、該各位置情報の中から、該位置に応じた前記位置情報を検索し、検索された該位置情報に対応付けられた前記画像を取得するステップと、
取得された前記画像を、前記画面の、推定された前記位置に応じた位置情報に相応する配置関係の領域に表示するステップと
を有することを特徴とする画像表示方法。A plurality of images are stored in advance , which are associated with position information where the speaker is expected to be present, and are displayed in an arrangement-related area corresponding to the position information on the screen ,
Estimating the position of the speaker based on speech emitted from the speaker;
Based on the estimated position, the position is compared with each position information stored in advance, the position information corresponding to the position is searched from the position information, and the searched position Obtaining the image associated with the information;
And displaying the acquired image in an area of the layout corresponding to the position information corresponding to the estimated position on the screen .
所定のキーワードは予め複数記憶され、
前記話者から発せられた音声に対応する文字列を認識するステップと、
認識された前記文字列に基づいて、該文字列と一致する前記キーワードを検索することができた場合には、検索された前記位置情報に対応付けられた前記画像を取得するステップと
を有することを特徴とする画像表示方法。The image display method according to claim 5,
A plurality of predetermined keywords are stored in advance,
Recognizing a character string corresponding to speech uttered by the speaker;
Obtaining the image associated with the searched position information when the keyword matching the character string can be searched based on the recognized character string. An image display method characterized by the above.
前記各画像のそれぞれには、所定のキャラクタが含まれ、該各画像のそれぞれに対応付けられた前記位置情報には、該キャラクタを特定の領域に表示させるための領域情報が対応付けられ、
検索された前記位置情報に対応付けられた前記領域情報に基づいて、該領域情報に対応する前記領域に、検索された該位置情報に対応付けられた前記画像に含まれる前記キャラクタを表示することを特徴とする画像表示方法。The image display method according to claim 5, wherein:
Each of the images includes a predetermined character, and the position information associated with each of the images is associated with region information for displaying the character in a specific region.
Based on the area information associated with the retrieved position information, the character included in the image associated with the retrieved position information is displayed in the area corresponding to the area information. An image display method characterized by the above.
前記各領域は、前記キャラクタが移動する方向に設けられることを特徴とする画像表示方法。The image display method according to claim 7,
The image display method according to claim 1, wherein each of the regions is provided in a direction in which the character moves.
コンピュータに、
前記話者から発せられた音声に基づいて該話者の位置を推定するステップと、
推定された前記位置に基づいて、該位置と予め記憶された前記各位置情報とを照合し、該各位置情報の中から、該位置に応じた前記位置情報を検索し、検索された該位置情報に対応付けられた前記画像を取得するステップと、
取得された前記画像を、前記画面の、推定された前記位置に応じた位置情報に相応する配置関係の領域に表示するステップと
を有する処理を実行させるプログラム。 Each multiple images displayed on one area of the screen, among the position information of the positional relationship corresponding to each region, correlated position information is expected would talker is present Each image is stored in advance,
On the computer,
Estimating the position of the speaker based on speech emitted from the speaker;
Based on the estimated position, the position is compared with each position information stored in advance, the position information corresponding to the position is searched from the position information, and the searched position Obtaining the image associated with the information;
And displaying the acquired image in an area of the layout corresponding to the position information corresponding to the estimated position of the screen .
所定のキーワードは予め複数記憶され、
前記話者から発せられた音声に対応する文字列を認識するステップと、
認識された前記文字列に基づいて、該文字列と一致する前記キーワードを検索することができた場合には、検索された前記位置情報に対応付けられた前記画像を取得するステップと
を有する処理を実行させるプログラム。The program according to claim 9, wherein
A plurality of predetermined keywords are stored in advance,
Recognizing a character string corresponding to speech uttered by the speaker;
A step of acquiring the image associated with the searched position information when the keyword matching the character string can be searched based on the recognized character string. A program that executes
前記各画像のそれぞれには、所定のキャラクタが含まれ、該各画像のそれぞれに対応付けられた前記位置情報には、該キャラクタを特定の領域に表示させるための領域情報が対応付けられ、
検索された前記位置情報に対応付けられた前記領域情報に基づいて、該領域情報に対応する前記領域に、検索された該位置情報に対応付けられた前記画像に含まれる前記キャラクタを表示する処理を実行させるプログラム。A program according to any one of claims 9 and 10,
Each of the images includes a predetermined character, and the position information associated with each of the images is associated with region information for displaying the character in a specific region.
Processing for displaying the character included in the image associated with the retrieved position information in the area corresponding to the area information based on the area information associated with the retrieved position information A program that executes
前記各領域は、前記キャラクタが移動する方向に設けられることを特徴とするプログラム。The program according to claim 11,
The area is provided in a direction in which the character moves.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002287473A JP4141782B2 (en) | 2002-09-30 | 2002-09-30 | Image display device, image display method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002287473A JP4141782B2 (en) | 2002-09-30 | 2002-09-30 | Image display device, image display method, and program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2004126784A JP2004126784A (en) | 2004-04-22 |
| JP4141782B2 true JP4141782B2 (en) | 2008-08-27 |
Family
ID=32280267
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002287473A Expired - Fee Related JP4141782B2 (en) | 2002-09-30 | 2002-09-30 | Image display device, image display method, and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4141782B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6534926B2 (en) * | 2013-06-10 | 2019-06-26 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Speaker identification method, speaker identification device and speaker identification system |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3667615B2 (en) * | 1991-11-18 | 2005-07-06 | 株式会社東芝 | Spoken dialogue method and system |
| JPH1141577A (en) * | 1997-07-18 | 1999-02-12 | Fujitsu Ltd | Speaker position detection device |
| JPH11304906A (en) * | 1998-04-20 | 1999-11-05 | Nippon Telegr & Teleph Corp <Ntt> | Sound source position estimation method and recording medium recording the program |
| WO2000053281A1 (en) * | 1999-03-05 | 2000-09-14 | Namco, Ltd. | Virtual pet device and medium on which its control program is recorded |
| JP2002112287A (en) * | 2000-09-28 | 2002-04-12 | Takenaka Komuten Co Ltd | Virtual reality exhibition system |
| JP2002245490A (en) * | 2001-02-16 | 2002-08-30 | Sony Corp | Image reproducing apparatus and image reproducing method |
-
2002
- 2002-09-30 JP JP2002287473A patent/JP4141782B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2004126784A (en) | 2004-04-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12190900B2 (en) | Personalized, real-time audio processing | |
| US12069470B2 (en) | System and method for assisting selective hearing | |
| US20230164509A1 (en) | System and method for headphone equalization and room adjustment for binaural playback in augmented reality | |
| US10409547B2 (en) | Apparatus for recording audio information and method for controlling same | |
| US20150154957A1 (en) | Conversation support apparatus, control method of conversation support apparatus, and program for conversation support apparatus | |
| CN111524501B (en) | Voice playback method, device, computer equipment and computer-readable storage medium | |
| JP2012220959A (en) | Apparatus and method for determining relevance of input speech | |
| Reyes et al. | Whoosh: non-voice acoustics for low-cost, hands-free, and rapid input on smartwatches | |
| US9807497B2 (en) | Sound source localization device, sound processing system, and control method of sound source localization device | |
| US20180108356A1 (en) | Voice processing apparatus, wearable apparatus, mobile terminal, and voice processing method | |
| WO2006070044A1 (en) | A method and a device for localizing a sound source and performing a related action | |
| JP2007221300A (en) | Robot and robot control method | |
| CN115394285B (en) | Voice cloning method, device, equipment and storage medium | |
| JP4191452B2 (en) | Image display device, image display method, and program | |
| JP5383056B2 (en) | Sound data recording / reproducing apparatus and sound data recording / reproducing method | |
| WO2018190099A1 (en) | Voice providing device, voice providing method, and program | |
| JP4141782B2 (en) | Image display device, image display method, and program | |
| WO2024124495A1 (en) | Audio processing method and apparatus, terminal, and storage medium | |
| CN115862586B (en) | Method and device for training timbre feature extraction model and audio synthesis | |
| JP2022182625A (en) | Sound auralization apparatus and sound auralization program | |
| JP2018167073A (en) | Exercise support apparatus and exercise support method | |
| WO2023084933A1 (en) | Information processing device, information processing method, and program | |
| WO2025142347A1 (en) | Audio processing device, audio processing system, audio processing method, and audio processing program | |
| WO2015200556A2 (en) | Presenting and creating audiolinks | |
| CN119360889A (en) | Song identification method, server, program product and storage medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050818 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071120 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071127 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071227 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080520 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080611 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4141782 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120620 Year of fee payment: 4 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120620 Year of fee payment: 4 |
|
| S631 | Written request for registration of reclamation of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313631 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120620 Year of fee payment: 4 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120620 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120620 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130620 Year of fee payment: 5 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
| R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
| R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
| R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |