JP6127792B2 - Sound reproduction apparatus and sound reproduction program - Google Patents
Sound reproduction apparatus and sound reproduction program Download PDFInfo
- Publication number
- JP6127792B2 JP6127792B2 JP2013148746A JP2013148746A JP6127792B2 JP 6127792 B2 JP6127792 B2 JP 6127792B2 JP 2013148746 A JP2013148746 A JP 2013148746A JP 2013148746 A JP2013148746 A JP 2013148746A JP 6127792 B2 JP6127792 B2 JP 6127792B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- person
- sound source
- unit
- timing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
本件開示は、音響再生装置及び音響再生プログラムに関する。 The present disclosure relates to a sound reproduction device and a sound reproduction program.
ヘッドホンなどで音響を再生する際に、人物の左右の耳に対応する頭部伝達関数(HRTF:Head Related Transfer Function)を用いた音像定位処理を施すことで、音源が人物に対して所定の方向にあることを知覚させる技術がある。 When sound is reproduced with headphones or the like, sound source localization processing using a head related transfer function (HRTF) corresponding to the left and right ears of the person is performed, so that the sound source has a predetermined direction with respect to the person. There is a technology that makes you feel that
音像定位処理は、例えば、3次元空間を表現する映像に含まれる物体の動きとともに、動きに伴う音を、人物と物体との間の仮想的な距離に応じた遅延で聴取させることで臨場感の高い映像を与える技術などへの適用が提案されている(例えば、特許文献1参照)。 The sound image localization processing is, for example, by listening to the sound accompanying the movement with a delay corresponding to the virtual distance between the person and the object together with the movement of the object included in the video representing the three-dimensional space. Application to a technique for providing a high-quality video has been proposed (see, for example, Patent Document 1).
ところで、特許文献1の技術は、写実的な画像で表される物体の動きを人物に見せるタイミングと当該物体の動きに伴う音響を人物に聴かせるタイミングとのズレによって、物体までの距離感を人物に知覚させている。このため、例えば、人物に提示している映像によって表現された3次元空間の外側にある物体が音源である場合、つまり、人物の視界に音源またはその画像が含まれていない場合に、特許文献1の技術により人物に音源までの距離感を知覚させることは困難である。 By the way, the technique of Patent Document 1 gives a sense of distance to an object by a difference between a timing at which a person sees the movement of an object represented by a realistic image and a timing at which a person hears the sound accompanying the movement of the object. Let people perceive. For this reason, for example, when an object outside the three-dimensional space represented by a video presented to a person is a sound source, that is, when a sound source or an image thereof is not included in the person's field of view, It is difficult for a person to perceive a sense of distance to a sound source by the technique 1.
本件開示の音響再生装置及び音響再生プログラムは、人物の視界に音源が含まれているか否かにかかわらず、音源までの距離を人物に直感的に認識させる技術を提供することを目的とする。 It is an object of the present disclosure to provide a sound reproduction device and a sound reproduction program that allow a person to intuitively recognize the distance to a sound source regardless of whether the sound field is included in the person's field of view.
一つの観点によれば、音響再生装置は、音源から発せられる音を示す音響信号を受け、受けた音響信号から再生した音を人物の聴覚に与える再生部と、音響信号で示される音の強さの変化に応じて変化する強度を持つ刺激を人物の視覚に与える提示部と、音源の位置を示す情報と人物の位置を示す情報とに基づいて、音源と人物との距離を算出する第1算出部と、再生部によって人物の聴覚に音を与える第1タイミングと提示部によって人物の視覚に刺激を与える第2タイミングとの間の時間差を、第1算出部で算出された距離に応じて変更する制御を行う制御部とを有する。 According to one aspect, the sound reproducing device receives an acoustic signal indicating a sound emitted from a sound source, and gives a sound reproduced from the received acoustic signal to a person's hearing, and a sound intensity indicated by the acoustic signal. The distance between the sound source and the person is calculated based on the presentation unit that gives the person's vision a stimulus having a strength that changes according to the change of the height, the information indicating the position of the sound source, and the information indicating the position of the person. The time difference between the first calculation unit and the first timing at which the sound is given to the person's hearing by the reproduction unit and the second timing at which the presentation unit gives the stimulus to the person's vision depends on the distance calculated by the first calculation unit And a control unit that performs control to be changed.
別の観点によれば、音響再生プログラムは、音源から発せられる音を示す音響信号を受け、音響信号で示される音の強さに基づいて、人物の視覚に提示する刺激の強度を決定し、音源の位置を示す情報と人物の位置を示す情報とに基づいて、音源と人物との距離を算出し、音響信号から再生される音を人物の聴覚に与える第1タイミングと決定された強度を持つ刺激を人物の視覚に与える第2タイミングとの間の時間差を、算出された距離に応じて変更する制御を行う、処理をコンピュータに実行させる。 According to another aspect, the sound reproduction program receives an acoustic signal indicating the sound emitted from the sound source, determines the intensity of the stimulus to be presented to the human vision based on the intensity of the sound indicated by the acoustic signal, Based on the information indicating the position of the sound source and the information indicating the position of the person, the distance between the sound source and the person is calculated, and the first timing for giving the sound reproduced from the acoustic signal to the person's hearing is determined as the first timing. The computer is caused to execute a process of performing control to change the time difference from the second timing for giving the stimulus to the person's vision according to the calculated distance.
本件開示の音響再生装置及び音響再生プログラムは、人物の視界に音源が含まれているか否かにかかわらず、音源までの距離を人物に直感的に認識させることができる。 The sound reproduction device and the sound reproduction program of the present disclosure can make a person intuitively recognize the distance to a sound source regardless of whether or not the sound field is included in the person's field of view.
以下、図面に基づいて、実施形態を説明する。 Hereinafter, embodiments will be described with reference to the drawings.
図1は、音響再生装置の一実施形態を示す。 FIG. 1 shows an embodiment of a sound reproducing device.
図1に示した音響再生装置10は、例えば、眼鏡型の表示画面111a,111bを有する提示部11と、ヘッドホンなどの再生部12と、第1算出部13と、制御部14とを含んでいる。
The
提示部11は、人物P1の頭部に装着され、表示画面111a,111bに表示させた画像を人物P1の視覚に与える。提示部11は、左右の目に対応する表示画面111a,111bを有する眼鏡型に限らず、両眼を覆う形状の一つの表示画面を有していてもよい。なお、表示画面111a,111bは、表示画面111a,111bを通して外部の環境が観察可能な程度の透明度を持っていることが望ましい。また、提示部11は、表示画面111a,111bの代わりに、人物P1の視野内に配置された少なくとも一つの発光素子を含んでいてもよい。なお、発光素子を含む提示部11の例については、図8を用いて後述する。
The
また、再生部12は、人物P1の頭部に装着された状態で、人物P1の左右の耳にそれぞれ対向するスピーカを内蔵しており、内蔵したスピーカによって出力される音響を人物P1の聴覚に与える。
In addition, the
図1に示した音源Sは、例えば、壁WLなどにより、人物P1から隔てられた場所、あるいは、音源Sから発せられる音を人物P1が聞き取れる距離よりも人物P1から離れた場所に設置されている。 The sound source S shown in FIG. 1 is installed in a place separated from the person P1 by a wall WL or the like, or in a place further away from the person P1 than the distance at which the person P1 can hear the sound emitted from the sound source S. Yes.
音源Sから発せられた音は、例えば、音源Sに近接した位置に配置されたマイクロホンMCにより、音響信号に変換される。また、マイクロホンMCによる変換で得られた音響信号は、例えば、サーバ装置SVに搭載された無線通信機能を用いて音響信号を示す情報を送信することで、音源Sから離れた場所にいる人物P1に装着された音響再生装置10の制御部14に渡される。つまり、音響再生装置10は、人物P1から離れた場所にある音源Sによって発せされる音を、マイクロホンMCで得られた音響信号に基づいて再生し、再生部12により、人物P1の聴覚に与える。なお、サーバ装置SVは、人物P1によって携帯されているスマートホンやタブレット型端末などの携帯端末UEに搭載された無線通信機能を利用することで、音響信号を携帯端末UEに渡し、携帯端末UE経由で音響信号を音響再生装置10に渡してもよい。
The sound emitted from the sound source S is converted into an acoustic signal by, for example, the microphone MC disposed at a position close to the sound source S. The acoustic signal obtained by the conversion by the microphone MC is, for example, a person P1 who is away from the sound source S by transmitting information indicating the acoustic signal using a wireless communication function installed in the server device SV. To the
また、第1算出部13は、例えば、人物P1によって携帯されているスマートホンやタブレット型端末などの携帯端末UEから、携帯端末UEに含まれているGPS(Global Positioning System)センサGpなどで得られた人物P1の位置を示す位置情報Pdpを受ける。人物P1の位置を示す位置情報Pdpは、携帯端末UEに搭載されたGPSセンサGpで得られた位置情報に限られない。例えば、人物P1の位置を示す位置情報Pdpは、携帯端末UEに内蔵された加速度センサとジャイロセンサとで得られた情報に基づいて人物P1の動きを追跡することで得られる位置情報でもよい。また、人物P1の位置を示す位置情報Pdpは、複数の電波源から携帯端末UEが受信した信号の強さに基づいて人物P1の位置を測定することで得られる位置情報でもよい。なお、第1算出部13は、携帯端末UEに搭載されたGPSセンサGpから位置情報Pdpを受ける代わりに、例えば、提示部11あるいは再生部12とともに人物P1の頭部に装着された別のGPSセンサなどで得られた位置情報を受けてもよい。
Further, the
また、第1算出部13は、例えば、サーバ装置SVから、サーバ装置SVに搭載された無線通信機能などを用いて送信された情報を受信することで、音源Sについて予め登録された位置を示す位置情報Pdsを受ける。なお、位置情報Pdsは、第1算出部13の内部に設けられたメモリに予め保持されていてもよい。
Moreover, the
第1算出部13は、受けた位置情報Pdp,Pdsに基づいて、人物P1と音源Sとの間の距離L1を算出し、算出した距離L1を示す情報を制御部14に渡す。
The
制御部14は、サーバ装置SVから受けた音響信号に基づいて、音源Sから発せられる音の強さを示す音圧を算出する。制御部14は、例えば、マイクロホンMCから受けた音響信号の振幅をサンプリングすることで得られた電圧値から、数ミリ秒〜十数ミリ秒に設定された期間毎に、音圧の大きさを示す振幅の実効値を算出する。例えば、制御部14で算出される実効値Vは、平均化を行う期間内のサンプリングで得られたN個(Nは正の整数)の電圧値V(j)(jはサンプル数N以下の正の整数)を用いて、式(1)で示される。
The
制御部14は、例えば、円や矩形、矢印などの図形や文字列あるいは文字列と図形とを組み合わせたマークを表す画像データの輝度値を実効値Vに応じて変化させることで、提示部11によって与える視覚刺激の強度を変化させる。また、制御部14は、提示部11によって視覚刺激として人物P1に与える図形などの色の濃度や大きさを実効値Vに応じて変化させることで、人物P1に与える視覚刺激の強度を変化させてもよい。以下では、提示部11によって人物P1の視覚に与える刺激の強度を制御する手法の一例として、視覚刺激として表示画面111a,111bに表示する図形などの明るさを制御部14によって制御する場合が説明される。
For example, the
図2(A),(B),(C)は、図1に示した提示部11によって人物P1の視覚に与える刺激の例を示す。なお、図2に示した構成要素のうち、図1に示した構成要素と同等のものについては、同一の符号を付して示し、その説明は省略する。図2(A),(B),(C)は、提示部11を装着した人物P1から見た表示画面111a,111bの例を示す。
2A, 2B, and 2C show examples of stimuli given to the vision of the person P1 by the
図2(A)は、提示部11に含まれる2つの表示画面111a,111bの一方(この例では表示画面111b)に、図1に示した音源Sに対応する視覚刺激として、図形(例えば、円形112c)を図1に示した制御部14により表示させる例を示す。
FIG. 2A shows a graphic (for example, a visual stimulus corresponding to the sound source S shown in FIG. 1 on one of the two
制御部14は、例えば、図2(A)に示した円形112cの輝度を、式(1)で求めた実効値Vの変化に応じて変化させる。円形112cの輝度は、円形112cを表示させる画像データの輝度値を変化させることで変化する。これにより、制御部14は、音源Sから発せられる音の強さの変化を、視覚刺激として人物P1に与える円形112cの輝度の変化に反映させる。
For example, the
図2(B)は、提示部11に含まれる2つの表示画面111a,111bの一方(この例では表示画面111b)に、図1に示した音源Sに対応する視覚刺激として、文字列「Fj」を示すテキスト112tを制御部14により表示させる例を示す。
2B shows a character string “Fj” as a visual stimulus corresponding to the sound source S shown in FIG. 1 on one of the two
制御部14は、例えば、図2(B)に示したテキスト112tの輝度を、式(1)で求めた実効値Vの変化に応じて変化させる。テキスト112tの輝度は、テキスト112tを表示させる画像データの輝度値を変化させることで変化する。これにより、制御部14は、音源Sから発せられる音の強さの変化を、視覚刺激として人物P1に与えるテキスト112tの輝度の変化に反映させる。
For example, the
図2(C)は、提示部11に含まれる2つの表示画面111a,111bの一方(この例では表示画面111b)に、図1に示した音源Sに対応する視覚刺激として、文字列と図形とを組み合わせたマーク112mを制御部14により表示させる例を示す。
FIG. 2C shows a character string and a graphic as a visual stimulus corresponding to the sound source S shown in FIG. 1 on one of the two
図2(C)に示したマーク112mは、文字列「Fj」を表すテキスト112tと、テキスト112tの背景112bと、テキスト112t及び背景112bを囲む枠112fとを含んでいる。
The
図1に示した制御部14は、図2(C)に示したテキスト112t、背景112b、枠112fのいずれかの輝度を、式(1)で求めた実効値Vの変化に応じて変化させることで、音源Sから発せられる音の強さの変化をマーク112mの明るさに反映させる。また、制御部14は、図2(C)に示した視覚刺激であるマーク112mに含まれる要素から選んだ2つ以上の要素の輝度を、式(1)で求めた実効値Vに応じて変化させることで、音源Sから発せられる音の強さの変化を視覚刺激の明るさに反映させてもよい。マーク112mの要素であるテキスト112t、背景112b、枠112fのそれぞれの輝度は、テキスト112t、背景112b、枠112fのそれぞれを表示させる画像データの輝度値を変化させることで変化する。例えば、制御部14は、式(1)で求めた実効値Vに応じて変化する輝度値を用いて、テキスト112tと枠112fとをそれぞれ表す画像データを生成してもよい。
The
なお、制御部14は、式(1)で求められる実効値Vの変化に応じて、提示部11によって表示が可能な範囲で音源Sに対応する視覚刺激の明るさを変化させることが望ましい。例えば、制御部14は、音源Sから発せられる音の音圧として想定される最大の音圧に対応する実効値Vmと、提示部11によって表示が可能な最大の輝度Bmとを用いて、式(2)により、実効値Vに対応する輝度値Bを求めてもよい。
B=Bm×V/Vm ・・・(2)
また、制御部14は、2つの表示画面111a,111bのどちらに音源Sに対応する視覚刺激を表示させる場合でも、人物P1の視界を妨げない位置に表示させることが望ましい。
Note that the
B = Bm × V / Vm (2)
Moreover, it is desirable that the
また、制御部14は、第1算出部13から受けた距離L1を示す情報に基づいて、距離L1を音が伝搬する時間を求める。また、制御部14は、サーバ装置SVから受けた音響信号に、求めた時間に相当する遅延を与え、遅延を与えた音響信号を再生部12に渡す。これにより、制御部14は、提示部11によって人物P1に与えられる視覚刺激の強度が音響信号で示される音の強さに応じて変化するタイミングから、距離L1を音が伝播する時間を遅れさせたタイミングで、再生部12に音響信号で示される音を再生させる。即ち、制御部14は、距離L1が大きいほど大きい遅延時間を再生部12に渡す音響信号に与えることで、再生部12により人物P1に音を与える第1タイミングと、提示部11により人物P1に視覚刺激を与える第2タイミングとの間の時間差を大きく設定する。音響信号を遅延させて再生部12に渡す制御は、再生部12で再生される音の強さが変化する第1タイミングと提示部11により人物P1に与える視覚刺激の明るさが音の強さの変化に応じて変化する第2タイミングとに時間差を設定する制御の一例である。
Further, the
ここで、図1に示した提示部11により人物P1の視覚に与える刺激は、音源Sとなる物体を表す画像ではなく、音源Sから発せられる音の強さに応じた強度を持つ刺激である。また、提示部11により人物P1の視覚に与える刺激の強度は、再生部12によって人物P1の聴覚に与えられる音の強さの変化とともに、音源Sから発せられる同一の音の強さの変化に応じて変化する。このため、提示部11から与えられる視覚への刺激と、再生部12によって再生される音とは、人物P1により、対応付けて認識される。そして、例えば、人物P1の視覚に与える刺激が変化する第2タイミングと、人物P1の聴覚に与える音が変化する第1タイミングとの間の時間差を大きくするほど、再生された音を発した音源Sまでの距離が大きい印象を人物P1に与えることができる。すなわち、図1に示した音響再生装置10は、人物P1の視覚への刺激と聴覚への刺激とを時間差を持たせて与えることにより、音源Sとなる物体を表す画像を表示する機能を用いずに、人物P1に、音源Sまでの距離L1を認識させることができる。つまり、図1に示した音響再生装置10は、人物P1の視界に音源Sとなる物体を表す画像が含まれていない場合であっても、人物P1による音源Sまでの距離L1の認識を支援することができる。
Here, the stimulus given to the vision of the person P1 by the
なお、制御部14により、第1タイミングと第2タイミングとの間に時間差を設定する手法は、音響信号を遅延させて再生部12に渡すことで、第1タイミングを第2タイミングに対して遅れさせる制御に限られない。例えば、制御部14は、再生部12によって音響信号から音を再生する第1タイミングに対して、提示部11により、音響信号で示される音の強さに応じた強度を持つ刺激を人物P1の視覚に与える第2タイミングを遅れさせてもよい。
Note that the method of setting the time difference between the first timing and the second timing by the
また、人物P1の移動に伴って、図1に示した音響再生装置10は、音響信号で示される音源Sからの音とともに、人物P1と音源Sとの距離の変化に応じて調整された時間差で、音響信号から生成された視覚刺激を人物P1に与える。したがって、図1に示した再生部12及び提示部11を装着した状態で移動する人物P1は、再生部12で再生される音響と提示部11によって人物P1の視覚に与えられる刺激との時間差の変化に基づいて、音源Sまでの距離の変化を認識することが可能である。
In addition to the movement of the person P1, the
図3は、図1に示した音源Sと人物P1との位置関係の例を示す。なお、図3は、展示会場EH内を移動中の人物P1に装着された音響再生装置10により、展示物EX1及び人物P2,P3,P4を含む音源Sから発せられる音(例えば、音声)を聴取させる例を示す。
FIG. 3 shows an example of the positional relationship between the sound source S and the person P1 shown in FIG. FIG. 3 shows a sound (for example, sound) emitted from the sound source S including the exhibit EX1 and the persons P2, P3, and P4 by the
図3に示した音源Sは、人物P1とは壁WLによって隔てられた位置にある。すなわち、図3に示した人物P1と音源Sとの位置関係は、人物P1が音源Sを直接に視認することが困難な位置関係の一例である。 The sound source S shown in FIG. 3 is located at a position separated from the person P1 by the wall WL. That is, the positional relationship between the person P1 and the sound source S shown in FIG. 3 is an example of a positional relationship in which it is difficult for the person P1 to visually recognize the sound source S directly.
また、図3の例において、音源Sからの音を示す音響信号は、展示物EX1に近接して配置されたマイクロホンMCからサーバ装置SVに送られ、更に、サーバ装置SVからアクセスポイントAP及び携帯端末UEを介して音響再生装置10に渡される。サーバ装置SVは、マイクロホンMCから受けた音響信号を符号化することで、音源Sから発せられる音を示す符号化された音情報を生成し、生成した音情報を、アクセスポイントAPを介して携帯端末UEに渡してもよい。また、携帯端末UEは、符号化された音情報を受けた場合に、受けた音情報を復号することで音源Sからの音を示す音響信号を復元し、復元した音響信号を音響再生装置10に含まれる図1に示した制御部14に渡す。
In the example of FIG. 3, the acoustic signal indicating the sound from the sound source S is sent to the server device SV from the microphone MC disposed close to the exhibit EX1, and the server device SV further accesses the access point AP and the mobile phone. It is passed to the
制御部14は、音源Sからの音を示す音響信号に基づいて、図1に示した提示部11に音源Sに対応して明るさが変化する図形などの視覚刺激を表示させるとともに、距離L1に応じた時間差で図1に示した再生部12に音源Sからの音を再生させる。
Based on the acoustic signal indicating the sound from the sound source S, the
図4は、図3に示した音源Sから発せられた音の強さの変化と視覚刺激として表示される図形などの輝度の変化及び再生される音の強さの変化との関係を示す。図4において、横軸tは時間の経過を示す。 FIG. 4 shows the relationship between the change in the intensity of the sound emitted from the sound source S shown in FIG. 3, the change in the luminance of the graphic displayed as a visual stimulus, and the change in the intensity of the reproduced sound. In FIG. 4, the horizontal axis t indicates the passage of time.
図4(A)は、音源Sから発せされる音の音圧の変化の例を示す。図4(A)の縦軸SPは、音圧を示す。 FIG. 4A shows an example of a change in sound pressure of sound emitted from the sound source S. The vertical axis SP in FIG. 4A indicates sound pressure.
図4(B)は、音源Sに対応する視覚刺激として、図1に示した提示部11の表示画面111a,111bの少なくとも一方に表示された図形などの画像の輝度の変化の例を示す。図4(B)の縦軸Brは、音源Sに対応する視覚刺激として表示された画像の輝度値を示す。
FIG. 4B shows an example of a change in luminance of an image such as a graphic displayed on at least one of the
図4(C)は、図1に示した再生部12によって再生される音の音圧の変化の例を示す。図4(C)の縦軸SPは、音圧を示す。なお、図4(C)は、図1に示した制御部14により、音源Sからの音を示す音響信号に対して、人物P1と音源Sとの距離に応じた遅延が付加された後に再生部12に渡された音響信号から再生された音の音圧の変化を示している。
FIG. 4C shows an example of a change in sound pressure of the sound reproduced by the reproducing
例えば、図4(A),(B),(C)に示した時刻T0において、図3に示した人物P1が音源Sから距離L1だけ離れている場合に、時刻T0における音源Sからの音の音圧の変化は、図4(C)に示すように、距離L1に対応する時間DL1だけ遅れて再生される。一方、図4(A),(B)の比較から分かるように、提示部11により、音源Sに対応する視覚刺激として表示される画像の輝度は、音源Sからの音の音圧の変化とほぼ同期して変化する。
For example, when the person P1 shown in FIG. 3 is separated from the sound source S by the distance L1 at the time T0 shown in FIGS. 4A, 4B, and 4C, the sound from the sound source S at the time T0. The change in sound pressure is reproduced with a delay of time DL1 corresponding to the distance L1, as shown in FIG. On the other hand, as can be seen from the comparison between FIGS. 4A and 4B, the luminance of the image displayed as the visual stimulus corresponding to the sound source S by the
その後、図3に示した人物P1が展示会場EH内で移動し、図4(A),(B),(C)に示した時刻T1において、人物P1の位置が図3に破線で示した位置P1’に変化した場合に、図1に示した再生部12で再生される音のタイミングは、次のように変化する。位置P1’と音源Sとの距離L1’が距離L1よりも短い場合に、時刻T1における音源Sからの音の音圧の変化は、図4(C)に示すように、時間DL1よりも短い時間DL1’だけ遅れて再生される。
Thereafter, the person P1 shown in FIG. 3 moves in the exhibition hall EH, and the position of the person P1 is indicated by a broken line in FIG. 3 at time T1 shown in FIGS. 4 (A), (B), and (C). When it changes to position P1 ', the timing of the sound reproduced | regenerated by the reproducing
図1に示した制御部14は、例えば、音源Sから人物P1までの距離L1と、空気中の音速とを用いて、式(3)により、第1タイミングと第2タイミングとの間に設定する時間差を求めてもよい。なお、式(3)において、符号DLは、第1タイミングと第2タイミングとの間の時間差を示し、符号γsは空気中の音速を示す。また、式(3)において、符号αは、例えば、1以上の実数に設定される係数を示す。
DL=α×L1/γs ・・・(3)
例えば、制御部14は、係数αを含む式(3)を用いて算出した時間差DLを遅延させた音響信号を再生部12に渡す。これにより、聴覚へ刺激を与える第1タイミングと視覚へ刺激を与える第2タイミングとの間の時間差を、距離L1と距離L1’との差以上に強調することができる。例えば、人物P1と音源Sとの距離L1から距離L1’への変化に応じて、制御部14によって第1タイミングと第2タイミングとの間に設定される時間差DLは、距離L1、L1’の変化分を音が伝播する時間よりも大きく変化させられる。これにより、式(3)において係数αの値を数値「1」として時間差DLを求める場合に比べて、人物P1は、視覚への刺激と聴覚への刺激との間の時間差DLの変化に基づいて、音源Sまでの距離の変化を認識しやすくなる。なお、式(3)に含まれる係数αは、例えば、音源Sから人物P1までの距離L1が想定される最大値となった場合に、時間差DLの値が数秒程度となる値に設定されることが望ましい。例えば、人物P1が図3に示した展示会場EHの内部を移動する場合に、係数αは、展示会場EHを示す矩形の対角線の長さで音速γsを除算した値に、時間差の上限を示す時間(例えば、2秒)を乗じた値に設定される。
The
DL = α × L1 / γs (3)
For example, the
図5は、図1に示した音響再生装置10の動作を示す。図5に示したステップS301〜ステップS305の処理は、図1に示した音響再生装置10の動作を示すとともに、音響再生プログラムの例を示す。例えば、図5に示す処理は、音響再生装置10に搭載されたプロセッサが音響再生プログラムを実行することで実現される。なお、図5に示す処理は、音響再生装置10に搭載されるハードウェアによって実行されてもよい。すなわち、図5は、音響再生プログラムの一実施形態を示す。
FIG. 5 shows the operation of the
ステップS301において、図1に示した制御部14は、図1に示した音源Sから発せされる音を示す音響信号を受ける。制御部14は、図1に示したマイクロホンMCにより生成された音響信号をサーバ装置SVから受けてもよいし、図3に示したように、サーバ装置SV及び携帯端末UEを介して受けてもよい。また、マイクロホンMCに無線通信機能が搭載されている場合は、マイクロホンMCの無線通信機能により音響信号を音響再生装置10に送信することで、音響再生装置10に音響信号を渡してもよい。
In step S301, the
ステップS302において、制御部14は、受けた音響信号に基づいて、音響信号で示される音の強さに応じて、人物P1に与える視覚刺激の強度を決定する。制御部14は、例えば、図2(A),(B),(C)を用いて説明したように、図形や文字あるいは図形と文字とを組み合わせたマークを表す画像の少なくとも一部の明るさを示す輝度値を、音響信号で示される音の強さに応じて設定する。
In step S302, the
ステップS303において、図1に示した第1算出部13は、人物P1の位置を示す位置情報Pdpと音源Sの位置を示す位置情報Pdsとを受け、受けた位置情報Pds,Pdpに基づいて、人物P1と音源Sとの間の距離を算出する。
In step S303, the
ステップS304において、制御部14は、算出された距離に基づいて、例えば、距離に比例する大きさの時間差で、再生部12によって音響信号で示される音を再生させるとともに、提示部11によって音響信号で示される音に対応する視覚刺激を与える。
In step S304, based on the calculated distance, the
ステップS305において、制御部14は、例えば、人物P1の操作などにより、音源Sから発せられた音を示す音響信号に基づいて、音響信号で示される音を再生する処理である音響再生処理の終了が指示されたか否かを判定する。
In step S305, the
音響再生処理の終了が指示されていない場合に(ステップS305の否定判定(NO))、制御部14はステップS301の処理に戻り、音源Sから発せられる音から新たに生成される音響信号について、ステップS301〜ステップS305の処理を繰り返す。
When the end of the sound reproduction process is not instructed (No determination in step S305 (NO)), the
一方、音響再生処理の終了が指示された場合に(ステップS305の肯定判定(YES))、制御部14は、音声を再生する処理を終了する。
On the other hand, when the end of the sound reproduction process is instructed (Yes determination in step S305 (YES)), the
図1に示した音響再生装置10は、例えば、数ミリ秒〜十数ミリ秒毎に、図5に示したステップS301〜ステップS305の処理を繰り返し実行することが望ましい。これにより、音響再生装置10は、人物P1の移動に伴う音源Sまでの距離の変化を、聴覚へ刺激を与える第1タイミングと視覚へ刺激を与える第2タイミングとの間の時間差の変化に反映させ、人物P1による音源Sまでの距離の把握を支援することができる。
The
なお、図5に示したステップS301及びステップS302の処理とステップS303の処理とは、図5に示したフローチャートとは逆の順序で実行されてもよい。また、ステップS301及びステップS302の処理とステップS303の処理とは、並行して実行されてもよい。 Note that the processing in steps S301 and S302 and the processing in step S303 shown in FIG. 5 may be executed in the reverse order of the flowchart shown in FIG. Moreover, the process of step S301 and step S302 and the process of step S303 may be performed in parallel.
図6は、音声再生装置10の別実施形態を示す。なお、図6に示した構成要素のうち、図1に示した構成要素と同等のものは、同一の符号で示され、その説明が省略される場合がある。
FIG. 6 shows another embodiment of the
図6に示した音響再生装置10は、図1に示した提示部11、再生部12、第1算出部13及び制御部14に加えて、メモリ131と第2算出部15とを含んでいる。
The
メモリ131は、例えば、音響再生装置10の外部にあるサーバ装置SVから、サーバ装置SVに音源Sについて予め登録された位置を示す位置情報Pdsを受け、受けた位置情報Pdsを保持する。また、メモリ131は、保持した位置情報Pdsを第1算出部13と第2算出部15との双方に渡す。
For example, the
第2算出部15は、人物P1が携帯している携帯端末UEなどから、人物P1の位置を示す位置情報Pdpを受けるとともに、例えば、人物P1の頭部に装着されたジャイロセンサGyrから、人物P1の頭部の姿勢を示す角度情報Pdaを受ける。また、第2算出部15は、受けた位置情報Pds、位置情報Pdp及び角度情報Pdaに基づいて、人物P1の頭部の向きを基準とした音源Sの方向を算出する。例えば、第2算出部15は、位置情報Pdsで示される音源Sの位置と位置情報Pdpで示される人物P1の位置とを結ぶ線分と、角度情報Pdaで示される人物P1の頭部の向きとがなす角を、音源Sの方向として算出する。
The
なお、第2算出部15に渡される角度情報Pdaは、ジャイロセンサGyrによって検知された情報に限らず、人物P1の頭部の姿勢を示す情報であればよい。例えば、第2算出部15は、人物P1の頭部の向きの変化を示す角速度を受けてもよい。角度情報Pdaとして人物P1の頭部の向きの変化を示す角速度を受けた場合に、第2算出部15は、受けた角速度から人物P1の頭部の向きを算出する処理を行い、算出した頭部の向きに基づいて、人物P1の頭部の向きを基準とした音源Sの方向を算出する。
The angle information Pda passed to the
また、図6に示した制御部14は、生成部141と、遅延部142と、変換部143と、判定部144と、調整部145とを含んでいる。マイクロホンMCにより、音源Sから発せられる音から生成された音響信号は、サーバ装置SVに搭載された無線通信機能を介して、生成部141と遅延部142との双方に渡されている。また、第1算出部13によって算出された人物P1と音源Sとの距離は、調整部145に渡される。また、第2算出部15によって算出された音源Sの方向は、生成部141と判定部144と変換部143とに渡される。
The
生成部141は、マイクロホンMCから受けた音響信号をサンプリングすることで得られた電圧値に対して式(1)を用いることにより、数ミリ秒〜十数ミリ秒に設定される所定の期間ごとに、音響信号で示される音の強さを示す実効値を求める。また、生成部141は、求めた実効値に基づいて、例えば、式(2)により、人物P1の視覚に与える刺激の強さを示す輝度値を算出する。また、生成部141は、視覚刺激として、提示部11により、人物P1の視覚に与える視覚刺激として、表示画面111a,111bに図2(A),(B),(C)に示した図形などを表示するための画像データの輝度値として、算出した輝度値を設定する。
The
また、生成部141は、第2算出部15から渡された音源Sの方向を示す情報に基づいて、例えば、音源Sが人物P1の右側にあるか左側にあるかを判断し、判断結果に応じて、表示画面111a,111bのいずれかに視覚刺激となる図形等を表示させてもよい。例えば、生成部141は、音源Sが人物P1の右側にあると判断した場合に、表示画面111aに視覚刺激となる図形等を表示する画像データを生成する。一方、音源Sが人物P1の左側にあると判断した場合に、生成部141は、表示画面111bに視覚刺激となる図形等を表示する画像データを生成する。
In addition, the
また、生成部141は、音源Sの方向を示す情報に基づいて、音源Sの方向を示す角度に対応する表示画面111a,111bにおける位置に、視覚刺激を示す図形などを表示させてもよい。例えば、生成部141は、人物P1の頭部の正面から反時計回りに測った所定の角度の範囲を表示画面111aの左右方向の長さとを対応付け、時計回りに図った所定の角度の範囲を表示画面111bの左右方向の長さとを対応付けてもよい。そして、生成部141は、第2算出部15で算出された角度に対応する表示画面111a、111bのいずれかの位置に、視覚刺激となる図形等を表示する画像データを生成する。
Further, the
生成部141によって生成された画像データは、提示部11に渡され、提示部11に含まれる表示画面111a,111bによる図形やマークなどの表示に用いられる。そして、表示画面111a,111bに表示された図形やマークなどは、図形やマークなどが表示された位置に対応する方向からの刺激として人物P1の視覚に与えられる。したがって、人物P1は、視野内に表示された図形やマークなどの位置に基づいて、音源Sのおおよその方向を認識することができる。
The image data generated by the
判定部144は、例えば、第2算出部15によって算出された音源Sの方向が、所定の期間以上にわたって人物P1の頭部の正面を示す方向を示す場合に、人物P1が音源Sに注目していると判定する。ここで、第2算出部15で得られる音源Sの方向は、人物P1の頭部の向きの変化を反映する情報であり、人物P1の動きを示す情報の一例である。すなわち、判定部144は、人物P1の動きを示す情報に基づいて、人物P1が音源Sに注目しているか否かを判定する。
For example, the
調整部145は、判定部144により、人物P1が音源Sに注目していると判定された場合に、第1算出部13によって算出された音源Sと人物P1との距離を短縮する調整を行い、調整後の距離を遅延部142に渡す。
The
調整部145は、例えば、音源Sと人物P1との距離と、人物P1が音源Sに注目していることを示す判定結果が判定部144から得られている時間とに基づいて、式(4)により、調整された距離を算出する。なお、式(4)において、符号L1aは、音源Sと人物P1との間の調整された距離を示し、符号L1は、第1算出部13によって算出された距離を示す。また、式(4)において、符号tfは、判定部144により、人物P1が音源Sに注目しているとされた期間の長さ、即ち注目時間を示す。また、式(4)において、符号R1は、注目時間tfに応じて、調整された距離L1aの短縮される傾向の大きさを示す係数である。また、式(4)において、関数max(A,B)は、数Aと数Bとのうち大きい方を選択する関数である。
L1a=max(0,L1−tf×R1) ・・・(4)
また、調整部145は、調整された距離L1aの算出に、式(4)に代えて、式(5)を用いてもよい。なお、式(5)において、式(4)と同等の要素は式(4)と同じ符号で示される。また、式(5)において、符号R2は、調整された距離L1aが値0となるまでの時間を示す係数である。
L1a=max(0,L1(1−tf/R2)) ・・・(5)
一方、調整部145は、判定部144により、人物P1が音源Sに注目していないと判定された場合に、第1算出部13によって算出された音源Sと人物P1との距離をそのまま遅延部142に渡す。
For example, the
L1a = max (0, L1-tf × R1) (4)
Further, the
L1a = max (0, L1 (1-tf / R2)) (5)
On the other hand, when the
遅延部142は、調整部145から渡された調整前あるいは調整後の音源Sと人物P1との距離に基づいて、例えば、式(3)を用いることで、音響信号に基づき、音源Sからの音を再生する第1タイミングと視覚刺激を与える第2タイミングとの時間差を算出する。また、遅延部142は、サーバ装置SVから渡される音響信号に、算出した時間差に相当する遅延を与え、遅延させた音響信号を変換部143に渡す。
The
変換部143は、例えば、第2算出部15によって求められた音源Sの方向に対応する頭部伝達関数を用いた変換処理を、遅延部142から受けた遅延させられた音響信号に対して実行する。すなわち、変換部143は、人物P1の頭部の向きを基準とした音源Sの方向に対応する頭部伝達関数を、遅延させられた音響信号に畳み込むことで、人物P1から見た音源Sの方向への音像定位処理を行う。
For example, the
また、変換部143は、音像定位処理後の音響信号を再生部12に渡し、再生部12に音像定位処理後の音響信号から音響を再生させることで、人物P1から見た音源Sの方向に音像定位された音響を人物P1に聴取させる。
In addition, the
図6に示した制御部14は、生成部141により、人物P1の頭部の向きを基準とした音源Sの方向に応じた位置に視覚刺激となる図形やマークなどを表示する画像データを生成し、変換部143により、人物P1から見た音源Sの方向への音像定位処理を行う。そして、制御部14は、再生部12により、音像定位された音響を人物P1に聴かせるとともに、提示部11により、音源Sの方向に応じた位置に視覚刺激となる図形やマークを表示させる。すなわち、生成部141及び変換部143を有する制御部14は、音像定位させた音響と視覚刺激となる図形等を表示させる位置によって音源Sの方向を示すとともに、視覚への刺激と音響の再生との間の時間差で音源Sまでの距離を示す。これにより、図6に示した制御部14を含む音響再生装置10は、音源Sの実際の位置が人物P1の視界に含まれるか否かにかかわらず、人物P1による音源Sの位置の直感的な把握を支援することができる。
The
また、図6に示した制御部14において、調整部145は、判定部144にて人物P1が音源Sに注目しているとされた場合に、音源Sと人物P1との間の距離を第1算出部13で算出された距離よりも短くすることで、遅延部142で設定される遅延を短縮する。
In the
図7は、図6に示した遅延部142で設定される遅延時間の例を示す。図7(A)は、調整部145において、調整後の距離の算出に式(4)が用いられた場合に遅延部142で設定される遅延時間の変化の例を示す。また、図7(B)は、調整部145において、調整後の距離の算出に式(5)が用いられた場合に遅延部142で設定される遅延時間の変化の例を示す。なお、図7(A),(B)において、横軸tは時間を示し、縦軸DLは、遅延時間の大きさを示す。
FIG. 7 shows an example of the delay time set by the
図7(A)に示した遅延時間DL、即ち、調整部145において、調整後の距離の算出に式(4)が用いられた場合の遅延時間DLは、人物P1が音源Sに注目していることが検出された時刻Taから単調に減少する。そして、時刻Taから、第1算出部13で算出された距離L1を式(4)に示した係数R1で除算した値で示される時間L1/R1が経過した時刻Ta+L1/R1以降において、遅延時間DLの値は数値0となる。
The delay time DL shown in FIG. 7A, that is, the delay time DL when the
同様に、図7(B)に示した遅延時間DL、即ち、調整部145において、調整後の距離の算出に式(5)が用いられた場合の遅延時間DLは、人物P1が音源Sに注目していることが検出された時刻Taから単調に減少する。一方、図7(B)に示した遅延時間DLは、第1算出部13で算出された距離L1にかかわらず、式(5)に示した係数R2で示される時間が経過した時刻Ta+R2以降において数値0となる。
Similarly, the delay time DL shown in FIG. 7B, that is, the delay time DL when the
遅延部143によって設定される遅延時間は、提示部11によって音響信号で示される音に対応する強さを持つ刺激が人物P1の視覚に与えられる第2タイミングと再生部12により音響信号で示される音が再生される第1タイミングとの時間差に相当する。すなわち、図6に示した制御部14は、人物P1が音源Sに注目している場合に、第2タイミングと第1タイミングとの時間差を、注目していない場合に比べて短縮することで、人物P1が音響信号によって示される音源Sからの音に集中しやすくすることができる。
The delay time set by the
なお、調整部145により調整後の距離を算出する手法は、式(4)あるいは式(5)を用いる手法に限らず、判定部144により、人物P1が音源Sに注目しているとされた場合に、第1算出部13で算出された距離を短く調整する手法であればよい。例えば、調整部145は、注目時間が所定値だけ増大する毎に、調整後の距離を段階的に短縮してもよいし、また、人物P1が音源Sに注目していることが検出された場合に、注目時間の長さにかかわらず、調整後の距離を数値0としてもよい。
The method for calculating the adjusted distance by the
図8は、図6に示した提示部11の別実施形態を示す。図8(A)は、人物P1の頭部に装着された提示部11を示す。また、図8(B)は、人物P1の頭部の向きを基準とする方向と提示部11に含まれる発光素子との対応関係を示す。
FIG. 8 shows another embodiment of the
図8(A)に示した提示部11において、発光ダイオードなどの複数の発光素子113−1,113−2,…,113−k(kは2以上の整数)は、板状の部材114上に例えばほぼ等間隔で配置されている。また、発光素子113−1,…,113−kが配置された板状の部材114は、例えば、再生部12から伸びる蔓状の部材115により、人物P1の顔の正面に保持される。
In the
図8(B)に示した提示部11は、7個の発光素子113−1,113−2,113−3,113−4,113−5,113−6,113−7を含んでいる。すなわち、図8(B)は、図8(A)に示した提示部11において、k=7である場合を示す。7個の発光素子113−1〜113−7のそれぞれは、人物P1の頭部の正面を基準とする所定の角度の範囲を例えば7等分することで得られる7つの範囲φ1,φ2,φ3,φ4,φ5,φ6,φ7のそれぞれに対応付けられている。以下の説明において、k個の発光素子113−1〜113−kは、単に、発光素子113と総称される場合がある。
The
図8(B)の例において、範囲φ1は、人物P1の頭部の正面を角度0とし、時計回り方向の角度を正の値で示す角度座標にて、マイナス70度からマイナス50度の範囲である。同様に、図8(B)の例において、範囲φ2は、マイナス50度からマイナス30度の範囲であり、範囲φ3は、マイナス30度からマイナス10度の範囲である。また、図8(B)の例において、範囲φ4は、マイナス10度からプラス10度の範囲であり、範囲φ5は、プラス10度からプラス30度の範囲である。そして、図8(B)の例において、範囲φ6は、プラス30度からプラス50度の範囲であり、範囲φ7は、プラス50度からプラス70度の範囲である。 In the example of FIG. 8B, the range φ1 is a range from minus 70 degrees to minus 50 degrees in an angle coordinate in which the front of the head of the person P1 is an angle 0 and the clockwise angle is a positive value. It is. Similarly, in the example of FIG. 8B, the range φ2 is a range from −50 degrees to −30 degrees, and the range φ3 is a range from −30 degrees to −10 degrees. In the example of FIG. 8B, the range φ4 is a range from minus 10 degrees to plus 10 degrees, and the range φ5 is a range from plus 10 degrees to plus 30 degrees. In the example of FIG. 8B, the range φ6 is a range from plus 30 degrees to plus 50 degrees, and the range φ7 is a range from plus 50 degrees to plus 70 degrees.
なお、提示部11に含まれる発光素子113のそれぞれと、人物P1の頭部の正面を基準とする角度の範囲との対応関係は、図8(B)の例に限られない。例えば、各発光素子113に対応付けられる角度の範囲は、範囲φ1〜φ7のそれぞれで示した角度の範囲よりも大きい範囲でもよいし、逆に、範囲φ1〜φ7のそれぞれで示した角度の範囲よりも小さい範囲でもよい。
Note that the correspondence relationship between each of the
図8(B)に示した提示部11を用いる場合に、図6に示した制御部14の生成部141は、第2算出部15によって算出された音源Sの方向に基づいて、図8(B)に示した範囲φ1〜φ7の中から、算出された音源Sの方向を含む範囲を判別する。また、生成部141は、式(2)を用いて算出した輝度値で示される光量を発光素子113に放出させるための駆動信号を生成し、判別した範囲に対応付けられた発光素子113に対して、生成した駆動信号を供給する。例えば、生成部141は、図8に示した発光素子113−5を音響信号で示される音の強さに応じた輝度で選択的に発光させることで、人物P1に対して、音源Sの方向が人物P1の頭部の向きを基準として10度〜30度の方向であることを示すことができる。
When the
以上に説明した音響再生装置10は、例えば、展示会場などにおいて、予め指定された展示の位置を利用者に案内する案内システムなどにおいて有用である。
The
図9は、図6に示した音響再生装置10を適用した案内システムの例を示す。図9に示した案内システムGSは、展示会場EHにおいて、利用者である人物P1に対して、人物P1によって予め指定された複数の展示の位置を案内するために、音響再生装置10の機能を利用する。
FIG. 9 shows an example of a guidance system to which the
案内システムGSは、例えば、音響再生装置10と、人物P1が携帯する携帯端末UEと、サーバ装置SVと、展示会場EHに展示されている各展示の位置を示す位置情報及び展示内容を示す情報を蓄積する展示データベースDBとを含んでいる。サーバ装置SVは、展示データベースDBに接続されており、展示データベースDBに蓄積された情報を参照可能である。また、サーバ装置SVと携帯端末UEとは、例えば、ネットワークNW及び展示会場EHに設けられたアクセスポイントAPを介して接続されており、互いに情報の授受が可能である。また、携帯端末UEは、サーバ装置SVから受けた情報を音響再生装置10に渡す機能を有している。
The guidance system GS includes, for example, the position information indicating the position of each exhibit displayed at the exhibition hall EH, and the information indicating the contents of the exhibition, the
展示会場EHにおいて、展示Ex1−1,Ex1−2,Ex1−3,Ex1−4は、壁WL1に沿って配置されている。また、展示会場EHにおいて、展示Ex2−1,Ex2−2,Ex2−3,Ex2−4は、壁WL2に沿って配置されている。 In the exhibition hall EH, the exhibitions Ex1-1, Ex1-2, Ex1-3, and Ex1-4 are arranged along the wall WL1. In the exhibition hall EH, the exhibits Ex2-1, Ex2-2, Ex2-3, and Ex2-4 are arranged along the wall WL2.
展示データベースDBは、展示Ex1−1〜Ex1−4及び展示Ex2−1〜Ex2−4のそれぞれの位置を示す情報とともに、それぞれの展示内容を示す情報の一部として、展示内容を説明する音声を表す音声情報を蓄積している。 The exhibition database DB includes information indicating the positions of the exhibitions Ex1-1 to Ex1-4 and the exhibitions Ex2-1 to Ex2-4, as well as a sound for explaining the exhibition contents as part of the information indicating the exhibition contents. The voice information that represents is stored.
図9に示した案内システムGSは、各展示から発せられる音を表す音響信号の代わりに、展示データベースDBに蓄積された音声情報に基づいて生成した音響信号を音響再生装置10に渡す。そして、音響再生装置10は、受け取った音響信号から再生される音響を人物P1の聴覚に与えるとともに、音響信号で示される音の強さに対応する強度を持つ刺激を人物P1の視覚に与える。
The guidance system GS shown in FIG. 9 passes the acoustic signal generated based on the audio information stored in the exhibition database DB to the
例えば、人物P1によって予め展示Ex1−3と展示Ex2−4とが案内の対象として指定された場合に、音響再生装置10は、展示データベースDBに展示Ex1−3及び展示Ex2−4に対応して蓄積された音声情報及び位置情報をサーバ装置SVから受ける。
For example, when the exhibition Ex1-3 and the exhibition Ex2-4 are designated in advance by the person P1 as guidance targets, the
例えば、音響再生装置10は、展示Ex1−3の位置情報に基づいて、サーバ装置SVから受けた音声情報から再生される音響に対する音像定位処理を制御するとともに、音声情報から再生される音に対応する視覚刺激を示す図形などを表示する位置を制御する。これにより、音響再生装置10は、サーバ装置SVから受けた音声情報から再生される音に対応する音像が定位された方向及び人物P1の視覚への刺激として光を放出させる発光素子113の位置により、人物P1に展示Ex1−3の方向を示すことができる。また、サーバ装置SVから受けた音声情報から音を再生するタイミングと当該音に対応する視覚刺激を与えるタイミングとに時間差を設けることで、人物P1に展示Ex1−3までの距離L1を示すことができる。
For example, the
同様に、音響再生装置10は、展示Ex2−4の位置情報に基づいて、サーバ装置SVから受けた音声情報から再生される音響に対する音像定位処理を制御するとともに、音響情報から再生される音に対応する視覚刺激を示す図形などを表示する位置を制御する。これにより、音響再生装置10は、サーバ装置SVから受けた音声情報から再生される音に対応する音像が定位された方向及び人物P1の視覚への刺激として発光させられる発光素子113の位置により、人物P1に展示Ex2−4の方向を示すことができる。また、サーバ装置SVから受けた音声情報から音を再生するタイミングと当該音に対応する視覚刺激を与えるタイミングとに時間差を設けることで、人物P1に展示Ex2−4までの距離L2を示すことができる。
Similarly, the
つまり、音響再生装置10により展示Ex1−3及び展示Ex2−4のそれぞれに対応して再生される音響及び視覚に与えられる刺激に基づいて、人物P1は、展示Ex1−3及び展示Ex2−4のそれぞれの位置を直感的に把握することができる。すなわち、人物P1は、展示Ex1−3と展示Ex2−4との双方が、人物P1から別の展示Ex1−4や壁WL2によって隔てられていても、各展示Ex1−3、Ex2−4のおおよその方向と各展示Ex1−3、Ex2−4までのおおよその距離を把握できる。例えば、人物P1は、展示Ex2−4の方向を示す視覚刺激の明るさが変化するタイミングと対応する音声の強さが変化するタイミングとのズレが、展示Ex1−3に対応するズレよりも小さいことから、展示Ex2−4の方が近傍にあることを知ることができる。
That is, based on the sound and the stimuli given to the vision that are reproduced by the
なお、図8(B)に示した提示部11は、例えば、複数の発光素子を用いて実現可能であり、音源となる展示Ex1−3,Ex2−4の高精細な画像を表示する機能を有するヘッドマウントディスプレイ装置などに比べて、ハードウェアが小規模である。また、図2に示した図形やマークなどを表す画像を視覚刺激として人物P1に与える場合でも、音源となる物体の高精細な画像を表示する機能を有するヘッドマウントディスプレイ装置に比べて、低解像度の表示画面111a,111bを用いて実現可能である。すなわち、図9に示した音響再生装置10を適用した案内システムは、指定された展示(例えば、展示Ex1−3,Ex2−4)の写実的な画像を人物P1に提示するための表示装置を用いる場合に比べて、低コストで実現可能である。
Note that the
以上に説明した本件開示の音響再生装置10は、例えば、スマートホンやタブレット型端末などの携帯端末を含むコンピュータ装置を用いて実現することができる。
The
図10は、音響再生装置10のハードウェア構成の一例を示す。なお、図10に示した構成要素のうち、図1、図6及び図9に示した構成要素と同等のものは、同一の符号で示され、その説明は省略される場合がある。
FIG. 10 shows an example of a hardware configuration of the
図10に示した携帯端末UEは、人物P1に所持されているスマートホンやタブレット型端末などである。携帯端末UEは、プロセッサ21と、メモリ22と、GPSセンサGpと、汎用インタフェース24と、音声処理部25と、ネットワークインタフェース26と、表示制御部27と、タッチパネル28と、入力制御部29とを含んでいる。図10に示したプロセッサ21と、メモリ22と、GPSセンサGpと、汎用インタフェース24と、音声処理部25と、ネットワークインタフェース26と、表示制御部27と、タッチパネル28と、入力制御部29とは、バスを介して互いに接続されている。
The mobile terminal UE shown in FIG. 10 is a smart phone or a tablet-type terminal possessed by the person P1. The mobile terminal UE includes a
携帯端末UEは、ネットワークインタフェース26を介して、ネットワークNWに接続されており、更に、ネットワークNWを介してサーバ装置SVに接続されている。また、携帯端末UEは、汎用インタフェース24を介して、例えば、図8(B)に示した発光素子113−1〜113−7を含む提示部11に接続されている。また、携帯端末UEに含まれる音声処理部25は、例えば、携帯端末UEの利用者である人物P1の頭部に装着されたヘッドホン型の再生部12に接続されている。また、図10に示した提示部11は、再生部12に含まれる耳当て部に蔓状の部材で固定されている。また、ジャイロセンサGyrは、再生部12に含まれる耳当て部に固定されている。ジャイロセンサGyrによって検知される角度情報Pdaは、汎用インタフェース24を介してプロセッサ21に渡される。
The mobile terminal UE is connected to the network NW via the
携帯端末UEに含まれるプロセッサ21と、メモリ22と、GPSセンサGpと、汎用インタフェース24と、音声処理部25と、ネットワークインタフェース26とは、音響再生装置10に含まれる。
The
また、携帯端末UEに含まれる表示制御部27は、プロセッサ21からの指示に従って、タッチパネル28に含まれる表示画面に画像を表示するための制御を行う。また、入力制御部29は、人物P1がタッチパネル28を操作することで入力した指示をプロセッサ21に渡す機能を持っている。したがって、人物P1は、タッチパネル28を操作することで、音響再生装置10に対して、例えば、提示の対象となる音源を指定する指示や、指定した音源に対応する音響及び視覚刺激を与える処理の開始あるいは終了させる指示などを入力することができる。例えば、人物P1は、図9に示した展示会場EH内の見取り図などをタッチパネル28の表示画面に表示させ、見取り図に含まれる所望の展示を示すアイコン等をタッチすることで、音響再生装置10によって音響を再生させる音源として指定する。
In addition, the
図10に示したメモリ22は、携帯端末UEのオペレーティングシステムとともに、プロセッサ21が、指定された音源から発せされる音を再生する処理である音響再生処理を実行するためのアプリケーションプログラムを格納している。なお、音響再生処理を実行するためのアプリケーションプログラムは、例えば、ネットワークインタフェース26及びネットワークNWを介して、サーバ装置SVなどからダウンロードすることで、メモリ22に読み込ませてもよい。
The
プロセッサ21は、音響再生処理のためのアプリケーションプログラムを実行することにより、例えば、図6に示した第1算出部13と、第2算出部15と、制御部14とのそれぞれの機能を果たす。また、図6に示したメモリ131の機能は、図10に示したメモリ22の記憶領域の一部を用いて実現される。
The
また、図10に示した展示データベースDBは、図9に示した展示会場EH内に配置された展示Ex1−1〜Ex1−4及び展示Ex2−1〜Ex2−4に対応して、それぞれの位置を示す位置情報と展示内容を示す音声情報を蓄積している。また、図10に示した音響再生装置10は、例えば、ネットワークNW及びサーバ装置SVを介して、展示データベースDBから所望の展示に対応付けられた音声情報を取得することができる。 The exhibition database DB shown in FIG. 10 corresponds to the exhibition Ex1-1 to Ex1-4 and the exhibition Ex2-1 to Ex2-4 arranged in the exhibition hall EH shown in FIG. The position information indicating the voice information indicating the contents of the exhibition is stored. 10 can acquire audio information associated with a desired exhibition from the exhibition database DB via the network NW and the server apparatus SV, for example.
図11は、図10に示した音響再生装置10の動作を示す。図11に示したステップS301〜ステップS305及びステップS311〜ステップS316の処理は、図10に示した音響再生装置10の動作を示すとともに音響再生プログラムの別実施形態を示す。図11に示したステップS301〜ステップS305及びステップS311〜ステップS316の処理は、音響再生処理のためのアプリケーションプログラムに含まれる処理の一例である。また、ステップS301〜ステップS305及びステップS311〜ステップS316の処理は、図10に示したプロセッサ21によって実行される。
FIG. 11 shows the operation of the
ステップS311において、プロセッサ21は、例えば、図10に示した入力制御部29から、利用者によるタッチパネル28への操作で指定された音源を示す情報を受ける。例えば、プロセッサ21は、表示制御部27により、図9に示した展示会場EH内の見取り図などをタッチパネル28の表示画面に表示させ、利用者に対して、所望の展示を示すアイコン等をタッチする操作を促す。また、プロセッサ21は、入力制御部29から利用者がタッチしたアイコン等を示す情報を受けた場合に、受けた情報で示されるアイコン等に対応付けられた展示を、音響再生装置10によって音響を再生する対象となる音源とする。
In step S311, the
また、ステップS311において、プロセッサ21は、ステップS314の処理で用いる変数である静止時間、注目時間及び注目フラグに、それぞれ初期値「0」を設定する。
In step S311, the
ステップS312において、プロセッサ21は、音響再生装置10によって音響を再生する対象となる音源として指定された展示の位置を示す位置情報を音源の位置を示す位置情報として受ける。例えば、プロセッサ21は、図10に示したネットワークインタフェース26を介して、サーバ装置SVに対して、指定された展示に対応して展示データベースDBに蓄積された位置情報を照会する。また、プロセッサ21は、サーバ装置SVへの照会で得られた位置情報を、音源として指定された展示に対応してメモリ22に格納する。なお、ステップS311の処理で、提示の対象となる音源として複数の展示が指定された場合に、プロセッサ21は、各展示についてそれぞれ位置情報をサーバ装置SVに照会し、照会で得られた位置情報を各展示に対応してメモリ22に格納する。例えば、図9に示した展示Ex1−3と展示Ex2−4とが人物P1によって指定された場合に、プロセッサ21は、指定された音源の位置情報として、展示Ex1−3,Ex2−4のそれぞれについて展示データベースDBに保持された位置情報を取得する。
In step S312, the
図11の例では、プロセッサ21は、ステップS301の処理に先立って、ステップS303、ステップS313〜ステップS316の処理を実行する。また、プロセッサ21は、図11に示したステップS303、ステップS313〜ステップS316、ステップS301、ステップS302及びステップS304を含むループの処理を、数ミリ秒〜十数ミリ秒に設定された所定の時間間隔で実行することが望ましい。
In the example of FIG. 11, the
ステップS303において、プロセッサ21は、ステップS312の処理で受けた各音源の位置情報に基づいて、音源である展示のそれぞれと人物P1との間の距離を算出する。例えば、プロセッサ21は、まず、人物P1の位置を示す位置情報として、図10に示したGPSセンサGpから携帯端末UEの位置を示す情報を受ける。また、プロセッサ21は、GPSセンサGpから受けた人物P1の位置情報とステップS312の処理で各音源の位置情報として受けた展示Ex1−3,Ex2−4の位置情報とに基づいて、人物と展示Ex1−3,Ex2−4のそれぞれとの間の距離を算出する。
In step S303, the
ステップS313において、プロセッサ21は、図10に示したジャイロセンサGyrから人物P1の頭部の向きを示す角度情報Pdaを取得し、取得した角度情報Pdaに基づいて、人物P1の頭部の向きを基準として、各音源の方向を算出する。プロセッサ21は、例えば、ジャイロセンサGyrから取得した角度情報と、各音源に対応する位置情報と、人物P1の位置を示す位置情報とに基づいて、人物P1の頭部の正面方向から測った各音源の方向を示す角度を算出する。
In step S313, the
ステップS314において、プロセッサ21は、図10に示した人物P1の動きを示す情報に基づいて、指定された音源のうち、人物P1によって注目されている音源を判別する。プロセッサ21は、人物P1によって注目されている音源を判別する処理に、例えば、ステップS313の処理で取得した角度情報Pdaを人物P1の動きを示す情報として用いる。また、プロセッサ21は、角度情報Pdaで示される人物P1の頭部の向きが所定の期間以上にわたって維持され、かつ、指定された音源のいずれかが人物P1の正面にある場合に、人物P1の正面方向にある音源を注目されている音源として判別する。プロセッサ21は、例えば、図12に示すステップS321〜ステップS330の処理を実行することで、注目されている音源を判別してもよい。
In step S <b> 314, the
図12は、図11にステップS314で示した注目されている音源を判別する処理の例を示す。図12に示したステップS321〜ステップS330の処理は、音響再生処理のためのアプリケーションプログラムに含まれる注目されている音源を判別する処理の一例である。また、ステップS321〜ステップS330の処理は、図10に示したプロセッサ21によって実行される。
FIG. 12 shows an example of the process of determining the focused sound source shown in step S314 in FIG. The process of step S321 to step S330 illustrated in FIG. 12 is an example of a process of determining a focused sound source included in an application program for sound reproduction processing. Further, the processing in steps S321 to S330 is executed by the
ステップS321において、プロセッサ21は、図10に示したジャイロセンサGyrによって過去τ秒間に得られた角度情報Pdaを取得する。プロセッサ21は、例えば、汎用インタフェース24を介してジャイロセンサGyrから受けた角度情報Pdaを、1秒程度に設定される時間τにわたってメモリ22に保持させ、メモリ22に保持させた角度情報Pdaを取得する。
In step S321, the
ステップS322において、プロセッサ21は、ステップS321の処理で取得した角度情報Pdaを互いに比較することで、角度情報Pdaで示される人物P1の頭部の向きが所定の閾値で示される範囲に収まっているか否かを判定する。プロセッサ21は、ステップS322の処理として、例えば、過去τ秒間の角度情報Pdaで示される人物P1の頭部の向きが、図8(B)に示した範囲φ1〜φ7のそれぞれに対応する角度の範囲(例えば20度)に収まっているか否かを判定してもよい。
In step S322, the
人物P1の頭部の向きの変化が、例えば20度程度に設定された範囲内に収まっていた場合に(ステップS322の肯定判定(YES))、プロセッサ21は、人物P1の頭部の向きはほぼ一定であると判断し、ステップS323の処理に進む。
If the change in the orientation of the head of the person P1 is within a range set to about 20 degrees, for example (Yes in step S322 (YES)), the
ステップS323において、プロセッサ21は、人物P1の頭部の向きが一定している時間の長さを示す変数である静止時間に、図11に示したステップS303からステップS305までのループの処理が繰り返される間隔に相当する所定値τ1を加算する。
In step S323, the
ステップS324において、プロセッサ21は、それまでの処理により、注目フラグに、人物P1が音源のいずれかに注目している可能性があることを示す値「1」が設定されているか否かを判定する。
In step S324, the
まだ、注目フラグに値「1」が設定されていない場合に(ステップS324の否定判定(NO))、プロセッサ21は、ステップS325の処理に進む。
If the value “1” has not yet been set for the attention flag (No at Step S324), the
ステップS325において、プロセッサ21は、プロセッサ21は、静止時間の値が、例えば、数秒程度に設定される所定の閾値以上であるか否かを判定する。
In step S325, the
まだ、静止時間が閾値未満である場合に(ステップS325の否定判定(NO))、プロセッサ21は、ステップS327の処理に進む。
If the still time is still less than the threshold value (No determination in step S325 (NO)), the
ステップS327において、プロセッサ21は、人物P1によって注目されている音源はないことを示す情報を出力する。その後、プロセッサ21は、注目されている音源を判別する処理を終了し、図11に示したステップ315の処理に進む。
In step S327, the
ここで、プロセッサ21は、ステップS303〜ステップS305のループに含まれるステップS314の処理として、図12に示したステップS321〜ステップS329の処理を、例えば、数ミリ秒〜十数ミリ秒毎に実行する。これに伴って、静止時間は、ステップS314の処理が繰り返される過程で、ステップS322において、人物P1の頭部の向きはほぼ一定であると判断されるごとに、ステップS323の処理で所定値τ1ずつ加算される。
Here, the
そして、ステップS323の処理において、所定値τ1が加算された静止時間が、静止時間について設定された閾値以上となった場合に(ステップS325の肯定判定(YES))、プロセッサ21は、ステップS326の処理に進む。
Then, in the process of step S323, when the stationary time to which the predetermined value τ1 is added becomes equal to or greater than the threshold set for the stationary time (Yes determination in step S325) (YES in step S325), the
ステップS326において、プロセッサ21は、注目フラグに値「1」を設定することで、人物P1が音源のいずれかに注目している可能性があることを示す。ステップS326の処理の終了後に、プロセッサ21は、ステップS327の処理に進み、人物P1によって注目されている音源はないことを示す情報を出力する。その後、プロセッサ21は、注目されている音源を判別する処理を終了し、図11に示したステップ315の処理に進む。
In step S326, the
ステップS326の処理により、注目フラグに値「1」が設定された後に、再び、ステップS314の処理を行う過程で、プロセッサ21は、ステップS324の肯定判定ルート(YES)に従って、ステップS328の処理に進む。
After the value “1” is set in the attention flag by the process of step S326, the
ステップS328において、プロセッサ21は、図11に示したステップS313の処理により、指定された音源のいずれかについて、人物P1の頭部の正面を示す方向が算出されたか否かを判定する。例えば、プロセッサ21は、図11に示したステップS313の処理で算出された各音源の方向のいずれかが、図8(B)に示した範囲φ4に含まれるか否かによって、ステップS325の判定処理を行ってもよい。ここで、図8(B)に示した範囲φ4は、人物P1の頭部の正面に相当している。
In step S328, the
指定された音源のそれぞれについて算出された方向が、いずれも人物P1の頭部の正面を示す方向ではない場合に(ステップS328の否定判定(NO))、プロセッサ21は、ステップS327の処理に進む。そして、プロセッサ21は、ステップS327において、人物P1によって注目されている音源はないことを示す情報を出力した後に、注目されている音源を判別する処理を終了し、図11に示したステップ315の処理に進む。
When none of the directions calculated for each of the designated sound sources is a direction indicating the front of the head of the person P1 (No determination in step S328 (NO)), the
一方、例えば、図9に示した展示Ex1−3についてステップS313の処理で算出した方向が、人物P1の頭部の正面を示す場合に(ステップS328の肯定判定(YES))、プロセッサ21は、ステップS329の処理に進む。
On the other hand, for example, when the direction calculated in the process of step S313 for the exhibition Ex1-3 illustrated in FIG. 9 indicates the front of the head of the person P1 (Yes determination in step S328 (YES)), the
ステップS329において、プロセッサ21は、ステップS328の処理で、人物P1の頭部の正面に当たる方向にあるとされた音源(例えば、展示Ex1−3)を、人物P1によって注目されている音源として判別する。また、プロセッサ21は、人物P1が音源のいずれかに注目している時間を示す変数である注目時間に、ステップS323において静止時間に加算された所定値τ1と同じ所定値τ1を加算する。その後、プロセッサ21は、注目されている音源を判別する処理を終了し、図11に示したステップS315の処理に進む。
In step S329, the
ところで、人物P1の頭部の向きが、例えば20度程度に設定された範囲よりも大きく変化した場合に(ステップS322の否定判定(NO))、プロセッサ21は、ステップS330の処理に進む。
By the way, when the head direction of the person P1 changes more than a range set to, for example, about 20 degrees (No determination in step S322 (NO)), the
ステップS330において、プロセッサ21は、静止時間及び注目時間に初期値「0」を設定するとともに、注目フラグをクリアする。その後、プロセッサ21は、ステップS327において、人物P1によって注目されている音源はないことを示す情報を出力した後に、注目されている音源を判別する処理を終了し、図11に示したステップ315の処理に進む。
In step S330, the
以上に説明したステップS321〜ステップS330の処理を実行することにより、プロセッサ21は、静止時間についての閾値以上にわたって、人物P1の頭部の向きが一定しており、かつ、頭部の正面に音源がある場合に、当該音源が注目されていると判断する。すなわち、プロセッサ21は、以上に説明したステップS321〜ステップS330の処理を実行することにより、図6に示した判定部144の機能を果たしている。
By executing the processing of steps S321 to S330 described above, the
図11に示したステップS315において、プロセッサ21は、ステップS314の処理の過程で、人物P1によって注目されている音源が判別されたか否かを判定する。
In step S315 illustrated in FIG. 11, the
例えば、図12に示したステップS329において、展示Ex1−3が人物P1によって注目されている音源として判別された場合に、プロセッサ21は、ステップS315の肯定判定ルート(YES)に従ってステップS316に進む。
For example, in step S329 shown in FIG. 12, when the exhibition Ex1-3 is determined as a sound source attracting attention by the person P1, the
ステップS316において、プロセッサ21は、式(4)あるいは式(5)を用いて、人物P1によって注目されている音源までの距離を調整する。例えば、注目されている音源として、図9に示した展示Ex1−3が判別された場合に、プロセッサ21は、ステップS313の処理で展示Ex1−3と人物P1との間の距離は、式(4)または式(5)を用いた調整により、元の距離L1よりも短縮される。その後、プロセッサ21は、ステップS301の処理に進む。即ち、プロセッサ21は、ステップS316の処理を実行することで、図6に示した調整部145の機能を果たす。
In step S316, the
一方、ステップS314の処理により、人物P1によって注目されている音源が判別されなかった場合に(ステップS315の否定判定(NO))、プロセッサ21は、ステップS316の処理を行うことなくステップS301の処理に進む。
On the other hand, if the sound source focused by the person P1 is not determined by the process of step S314 (No determination of step S315 (NO)), the
ステップS301において、プロセッサ21は、指定された音源のそれぞれから発せられる音を示す音響信号として、サーバ装置SVから、音源として指定された展示のそれぞれに対応して展示データベースDBに蓄積された音声情報の一部を受ける。例えば、プロセッサ21は、展示データベースDBに蓄積された音声情報を数ミリ秒〜十数ミリ秒で再生可能な長さで区切り、ステップS301の処理を実行する毎に、区切られた音声情報を順次に受ける。なお、展示データベースDBに蓄積された音声情報が符号化された音声情報である場合に、プロセッサ21は、例えば、受けた音声情報から、符号化される前の音声を示す音響信号あるいは音響信号の振幅の変化を示す情報を取得する。プロセッサ21は、符号化される前の音声を示す音響信号あるいは音響信号の振幅の変化を示す情報を取得する際に、図10に示した音声処理部25の機能を用いてもよい。また、プロセッサ21は、取得した音響信号あるいは音響信号の振幅の変化を示す情報を、ステップS302以下の処理において用いる。
In step S301, the
ステップS302において、プロセッサ21は、ステップS301の処理で受けた音響信号のそれぞれに基づいて、図10に示した提示部11によって人物P1の視覚に与える刺激の強度を決定する。例えば、プロセッサ21は、各音響信号の振幅の変化を示す情報と式(1)及び式(2)とを用いて、音響信号で示される音の強さに応じた輝度値を算出し、算出した輝度値を視覚刺激の強度とする。即ち、プロセッサ21は、ステップS302の処理を実行することで、図6に示した生成部141の機能を果たす。
In step S302, the
ステップS304において、プロセッサ21は、人物P1と各音源との間の距離に応じた時間差で、ステップS301の処理で各音源に対応して取得した音響信号から再生した音響と、音響信号で示される音の強さに対応する強度を持つ刺激とを人物P1に与える。プロセッサ21は、指定された音源のうち、ステップS314の処理で人物P1によって注目されていることが示された音源については、ステップS316の処理で調整された距離に応じた時間差を適用する。一方、人物P1によって注目されていることが示された音源以外の他の音源について、プロセッサ21は、ステップS303の処理で算出された距離に応じた時間差を適用する。プロセッサ21は、例えば、図13に示すステップS331〜ステップS335の各処理を実行することにより、図10に示した提示部11による視覚刺激の提示と再生部12による音の再生とを制御する。
In step S304, the
図13は、図11にステップS304で示した音及び視覚刺激を与える処理の例を示す。図13に示したステップS331〜ステップS335の処理は、音響再生処理のためのアプリケーションプログラムに含まれる音及び視覚刺激を与える処理の一例である。また、ステップS331〜ステップS335の処理は、図10に示したプロセッサ21によって実行される。
FIG. 13 shows an example of the process for giving the sound and visual stimulus shown in step S304 in FIG. The process of step S331 to step S335 shown in FIG. 13 is an example of a process for providing sound and visual stimulus included in the application program for the sound reproduction process. Further, the processing in steps S331 to S335 is executed by the
ステップS331において、プロセッサ21は、例えば、式(3)を用いて、図11に示したステップS303の処理で算出された距離、あるいは、図11に示したステップS316の処理で調整された距離から、距離に応じた時間差を算出する。例えば、図9に示した展示Ex1−3に人物P1が注目しているとされた場合に、プロセッサ21は、ステップS316の処理で調整された距離に基づいて、式(3)で示される時間差を求める。このため、展示Ex1−3に対応して取得した音響信号を再生する第1タイミングと、当該音響信号に対応する視覚刺激を与える第2タイミングとの間の時間差は、図9に示した距離L1に対応する時間差に比べて短い値となる。一方、プロセッサ21は、展示Ex2−4についてステップS303の処理で得られた距離を用いて、展示Ex2−4に対応して取得した音響信号を再生する第1タイミングと、当該音響信号に対応する視覚刺激を与える第2タイミングとの間の時間差を求める。
In step S331, the
ステップS332において、プロセッサ21は、ステップS331の処理で算出した時間差に基づき、ステップS301で取得した各音声情報に対応する音響を再生する第1タイミングと、当該音響に対応する視覚刺激を与える第2タイミングとを設定する。例えば、プロセッサ21は、図9に示した展示Ex1−3に対応して取得した音声情報と、展示Ex2−4に対応して取得した音声情報とについて、それぞれ第1タイミングと第2タイミングとを設定する。プロセッサ21は、例えば、ステップS302の処理により、音響の強さに応じて強度が決定された視覚刺激を与える第2タイミングに対して、ステップS323の処理で算出した時間差だけ遅れさせたタイミングを、音響を再生する第1タイミングとして設定する。
In step S332, based on the time difference calculated in step S331, the
即ち、プロセッサ21は、ステップS331及びステップS332の処理を実行することで、図6に示した遅延部142の機能を果たす。
That is, the
ステップS333において、プロセッサ21は、図11のステップS313で求めた各音源の方向に基づいて、それぞれ音像定位処理を実行することで、人物P1の頭部の向きを基準とした音源の方向に音像定位された音響を表す音響信号を生成する。つまり、プロセッサ21は、展示Ex1−3に対応して取得した音声情報から生成された音響信号に対して、ステップS313で算出された展示Ex1−3の方向への音像定位処理を行う。同様に、プロセッサ21は、展示Ex2−4に対応して取得した音声情報から生成された音響信号に対して、ステップS313で算出された展示Ex2−4の方向への音像定位処理を行う。なお、プロセッサ21は、音像定位処理を実行する際に、図10に示した音声処理部25に搭載された機能を利用してもよい。
In step S333, the
即ち、プロセッサ21は、ステップS333の処理を実行することで、図6に示した変換部143の機能を果たす。
That is, the
ステップS334において、プロセッサ21は、図11のステップS313の処理で求めた音源のそれぞれの方向に基づいて、図8(B)に示した発光素子113−1〜113−7の中から、音源に対応する視覚刺激として発光させる発光素子113を選択する。プロセッサ21は、図8を用いて説明したように、ステップS313の処理で求めた音源の方向を含む範囲に対応付けられた発光素子113を選択する。例えば、プロセッサ21は、図9に示した展示Ex1−3の方向として、人物P1の頭部のほぼ正面を示す角度を得た場合に、図8(B)に示した範囲φ4に対応する発光素子113−4を展示Ex1−3に対応して選択する。一方、プロセッサ21は、図9に示した展示Ex2−4の方向として、例えば、人物P1の頭部の正面を基準として、図8(B)に示した範囲φ2に含まれる角度を得た場合に、範囲φ2に対応する発光素子113−2を展示Ex2−4に対応して選択する。
In step S334, the
ステップS335において、プロセッサ21は、ステップS332の処理で音源毎に設定された第1タイミングで、図10に示した再生部12に音響を再生させるとともに、音源毎に設定された第2タイミングで提示部11に人物P1の視覚への刺激を出力させる。プロセッサ21は、例えば、内部のクロックで示される時刻が、展示Ex1−3につき設定した第1タイミングを示したときに、展示Ex1−3に対応して取得した音声情報から生成した音響信号の再生部12による再生を開始させる。また、プロセッサ21は、展示Ex1−3につき設定した第2タイミングにおいて、展示Ex1−3に対応して選択した発光素子113に、展示Ex1−3に対応して決定した輝度の光を放出させる駆動信号を供給することで、人物P1の視覚に刺激を与える。同様に、プロセッサ21は、例えば、時刻が、展示Ex2−4につき設定した第1タイミングを示したときに、展示Ex2−4に対応して取得した音声情報から生成した音響信号の再生部12による再生を開始させる。また、プロセッサ21は、展示Ex2−4につき設定した第2タイミングにおいて、展示Ex2−4に対応して選択した発光素子113に、展示Ex2−4に対応して決定した輝度の光を放出させる駆動信号を供給することで、人物P1の視覚に刺激を与える。
In step S335, the
また、プロセッサ21は、ステップS331〜ステップS335の処理の終了後に、図11に示したステップS305の処理に進む。
The
ステップS305において、プロセッサ21は、音響の再生及び音響に対応する視覚刺激の提示を終了するか否かを判定する。
In step S305, the
まだ、音響の再生及び音響に対応する視覚刺激の提示を終了することを示す指示を受けていない場合に(ステップS305の否定判定(NO))、プロセッサ21は、ステップS303の処理に戻り、各音源に対応して新たに受ける音響信号についての処理を開始する。プロセッサ21は、例えば、ステップS301の処理で取得する音声情報の一つの区切りを再生する時間(例えば、数ミリ秒〜十数ミリ秒)ごとに、ステップS303〜ステップS305の処理を繰り返すことが望ましい。
When the instruction indicating that the reproduction of the sound and the presentation of the visual stimulus corresponding to the sound are not yet received has been received (No determination in step S305 (NO)), the
一方、図10に示した入力制御部29から、音響の再生及び音響に対応する視覚刺激の提示を終了することを示す指示を受けた場合に(ステップS305の肯定判定(YES))、プロセッサ21は、音響再生処理のためのアプリケーションプログラムの処理を終了する。
On the other hand, when receiving an instruction from the
図9から図13を用いて説明したように、図10に示した音響再生装置10は、例えば、展示Ex1−3,Ex2−4に対応する説明音声の再生と説明音声に対応する視覚刺激の提示とに時間差を設定することで、人物P1に距離の違いを直感的に知覚させる。また、図10に示した音響再生装置10は、再生部12に再生させる音響に音像定位処理を適用し、また、音源の方向に応じて選択された発光素子を点灯させることで、人物P1に対して音源として指定された展示Ex1−3,Ex2−4の方向を示すことができる。すなわち、図10に示した音響再生装置10は、展示会場EHなどにおける複数の展示Ex1−3,Ex2−4の位置を、人物P1に直感的に把握させることができる。
As described with reference to FIGS. 9 to 13, for example, the
ここで、図10に示した音響再生装置10は、音響が再生されるタイミングと視覚刺激の強度が音響の強さに応じて変化するタイミングとの時間差により、人物P1に音源までの距離を示す。したがって、図10に示した音響再生装置10は、人物P1の視界に、音源となる展示Ex1−3、Ex2−4が含まれているか否かにかかわらず、音源となる展示Ex1−3、Ex2−4までの距離の人物P1による直感的な把握を支援することができる。図10に示した音響再生装置10が有するこの特徴は、広い展示会場などで、人物P1に、所望の展示の位置を案内するシステムなどへの適用において有用である。
Here, the
更に、図10に示した音響再生装置10は、人物P1が注目している音源を判別し、判別した音源に対応する音響信号から生成される視覚への刺激と聴覚への刺激との時間差を短縮する調整を行う。すなわち、図10に示した音響再生装置10は、人物P1が注目している音源に対応する音響信号から再生された音響を、実際の音源までの距離よりも近くにある音源からの音響として再生する。そして、人物P1が注目している音源に対応する音響信号から生成される視覚への刺激と聴覚への刺激との時間差が短縮されたことにより、人物P1は、注目している音源からの音響を聴くことに集中することが可能となる。
Furthermore, the
以上の詳細な説明により、実施形態の特徴点及び利点は明らかになるであろう。これは、特許請求の範囲が、その精神及び権利範囲を逸脱しない範囲で、前述のような実施形態の特徴点及び利点にまで及ぶことを意図するものである。また、当該技術分野において通常の知識を有する者であれば、あらゆる改良及び変更を容易に想到できるはずである。したがって、発明性を有する実施形態の範囲を前述したものに限定する意図はなく、実施形態に開示された範囲に含まれる適当な改良物及び均等物に拠ることも可能である。 From the above detailed description, features and advantages of the embodiment will become apparent. It is intended that the scope of the claims extend to the features and advantages of the embodiments described above without departing from the spirit and scope of the right. Further, any improvement and change should be easily conceived by those having ordinary knowledge in the technical field. Therefore, there is no intention to limit the scope of the inventive embodiments to those described above, and appropriate improvements and equivalents included in the scope disclosed in the embodiments can be used.
以上の説明に関して、更に、以下の各項を開示する。
(付記1)
音源から発せられる音を示す音響信号を受け、受けた音響信号から再生した音を人物の聴覚に与える再生部と、
前記音響信号で示される音の強さの変化に応じて変化する強度を持つ刺激を前記人物の視覚に与える提示部と、
前記音源の位置を示す情報と前記人物の位置を示す情報とに基づいて、前記音源と前記人物との距離を算出する第1算出部と、
前記再生部によって前記人物の聴覚に音を与える第1タイミングと前記提示部によって前記人物の視覚に前記刺激を与える第2タイミングとの間の時間差を、前記第1算出部で算出された距離に応じて変更する制御を行う制御部と、
を有することを特徴とする音響再生装置。
(付記2)
付記1に記載の音響再生装置において、
前記制御部は、
前記人物の動きを示す情報に基づいて、前記人物が前記音源に注目しているか否かを判定する判定部を有し、
前記判定部により、前記人物が前記音源に注目しているとされた場合に、前記音源と前記人物との距離に応じて設定される値よりも、前記時間差を小さくする制御を行う
ことを特徴とする音響再生装置。
(付記3)
付記2に記載の音響再生装置において、
前記制御部は、
前記人物が前記音源に注目している時間が長いほど前記時間差を小さくする制御を行う
ことを特徴とする音響再生装置。
(付記4)
付記1乃至付記3のいずれか1に記載の音響再生装置において、
前記音源の位置を示す情報と前記人物の位置を示す情報とに基づいて、前記人物の位置を基準とする前記音源の方向を求める第2算出部を有し、
前記提示部は、前記第2算出部によって求められた前記音源の方向から前記人物の視覚に前記刺激を与え、
前記再生部は、前記第2算出部によって求められた前記音源の方向に音像定位された音響信号から再生した音を前記人物の聴覚に与える
ことを特徴とする音響再生装置。
(付記5)
付記1乃至付記4のいずれか1に記載の音響再生装置において、
前記制御部は、
前記第2タイミングよりも第1タイミングを遅れさせる方向に前記時間差を設定する
ことを特徴とする音響再生装置。
(付記6)
付記1に記載の音響再生装置において、
前記制御部は、前記第1タイミングと前記第2タイミングとの間の時間差を、前記第1算出部で算出された前記距離を音が伝搬する時間よりも大きく設定する
ことを特徴とする音響再生装置。
(付記7)
付記1乃至付記6のいずれか1に記載の音響再生装置において、
前記提示部は、前記音の強さの変化に応じて、前記人物の視覚に対して与える前記刺激の輝度を変化させる
ことを特徴とする音響再生装置。
(付記8)
音源から発せられる音を示す音響信号を受け、
前記音響信号で示される音の強さに基づいて、人物の視覚に与える刺激の強度を決定し、
前記音源の位置を示す情報と前記人物の位置を示す情報とに基づいて、前記音源と前記人物との距離を算出し、
前記音響信号から再生される音を前記人物の聴覚に与える第1タイミングと前記決定された強度を持つ刺激を前記人物の視覚に与える第2タイミングとの間の時間差を、前記算出された距離に応じて変更する制御を行う、
処理をコンピュータに実行させることを特徴とする音響再生プログラム。
Regarding the above description, the following items are further disclosed.
(Appendix 1)
A playback unit that receives an acoustic signal indicating a sound emitted from a sound source and gives a sound reproduced from the received acoustic signal to a person's hearing;
A presentation unit that gives the person's vision a stimulus having an intensity that changes in accordance with a change in sound intensity indicated by the acoustic signal;
A first calculation unit that calculates a distance between the sound source and the person based on information indicating the position of the sound source and information indicating the position of the person;
A time difference between a first timing at which sound is given to the hearing of the person by the reproducing unit and a second timing at which the stimulus is given to the visual of the person by the presentation unit is set to a distance calculated by the first calculating unit. A control unit that performs control to change according to the
A sound reproducing device comprising:
(Appendix 2)
In the sound reproduction device according to attachment 1,
The controller is
A determination unit that determines whether the person is paying attention to the sound source based on information indicating the movement of the person;
When the determination unit determines that the person is paying attention to the sound source, control is performed to make the time difference smaller than a value set according to a distance between the sound source and the person. A sound reproducing device.
(Appendix 3)
In the sound reproduction device according to attachment 2,
The controller is
The sound reproducing apparatus is characterized in that control is performed to reduce the time difference as the time during which the person focuses on the sound source is longer.
(Appendix 4)
In the sound reproduction device according to any one of appendix 1 to appendix 3,
Based on information indicating the position of the sound source and information indicating the position of the person, a second calculation unit for determining the direction of the sound source with respect to the position of the person,
The presenting unit gives the stimulus to the visual sense of the person from the direction of the sound source obtained by the second calculation unit,
The sound reproduction device, wherein the reproduction unit gives sound reproduced from the sound signal localized in the direction of the sound source obtained by the second calculation unit to the hearing of the person.
(Appendix 5)
In the sound reproduction device according to any one of appendix 1 to appendix 4,
The controller is
The sound reproduction apparatus according to claim 1, wherein the time difference is set in a direction in which the first timing is delayed from the second timing.
(Appendix 6)
In the sound reproduction device according to attachment 1,
The control unit sets the time difference between the first timing and the second timing to be greater than the time for sound to propagate through the distance calculated by the first calculation unit. apparatus.
(Appendix 7)
In the sound reproduction device according to any one of supplementary notes 1 to 6,
The sound reproducing device, wherein the presenting unit changes the luminance of the stimulus given to the person's vision according to a change in the intensity of the sound.
(Appendix 8)
Receive an acoustic signal indicating the sound emitted from the sound source,
Based on the intensity of the sound indicated by the acoustic signal, determine the intensity of the stimulus given to the human vision,
Based on the information indicating the position of the sound source and the information indicating the position of the person, the distance between the sound source and the person is calculated,
A time difference between a first timing at which a sound reproduced from the acoustic signal is given to the auditory sense of the person and a second timing at which a stimulus having the determined intensity is given to the visual sense of the person is defined as the calculated distance. Control to change accordingly,
A sound reproduction program that causes a computer to execute processing.
10…音響再生装置;11…提示部;12…再生部;13…第1算出部;14…制御部;15…第2算出部;111a,111b…表示画面;112c…円形;112t…テキスト;112m…マーク;112b…背景;112f…枠;113…発光素子;114…板状の部材;115…蔓状の部材;141…生成部;142…遅延部;143…変換部;144…判定部;145…調整部;21…プロセッサ;22…メモリ;24…汎用インタフェース;25…音声処理部;26…ネットワークインタフェース;27…表示制御部;28…タッチパネル;29…入力制御部;P1…人物;UE…携帯端末;Gp…GPSセンサ;S…音源;MC…マイクロホン;SV…サーバ装置;AP…アクセスポイント;Ex1,Ex1−1,Ex1−2,Ex1−3,Ex1−4,Ex2−1,Ex2−2,Ex2−3,Ex2−4…展示;DB…展示データベース;NW…ネットワーク;GS…案内システム
DESCRIPTION OF
Claims (5)
前記音響信号で示される音の強さの変化に応じて変化する強度を持つ刺激を前記人物の視覚に与える提示部と、
前記音源の位置を示す情報と前記人物の位置を示す情報とに基づいて、前記音源と前記人物との距離を算出する第1算出部と、
前記再生部によって前記人物の聴覚に音を与える第1タイミングと前記提示部によって前記人物の視覚に前記刺激を与える第2タイミングとの間の時間差を、前記第1算出部で算出された距離に応じて変更する制御を行う制御部と、
を備えたことを特徴とする音響再生装置。 A playback unit that receives an acoustic signal indicating a sound emitted from a sound source and gives a sound reproduced from the received acoustic signal to a person's hearing;
A presentation unit that gives the person's vision a stimulus having an intensity that changes in accordance with a change in sound intensity indicated by the acoustic signal;
A first calculation unit that calculates a distance between the sound source and the person based on information indicating the position of the sound source and information indicating the position of the person;
A time difference between a first timing at which sound is given to the hearing of the person by the reproducing unit and a second timing at which the stimulus is given to the visual of the person by the presentation unit is set to a distance calculated by the first calculating unit. A control unit that performs control to change according to the
A sound reproducing apparatus comprising:
前記制御部は、
前記人物の動きを示す情報に基づいて、前記人物が前記音源に注目しているか否かを判定する判定部を有し、
前記判定部により、前記人物が前記音源に注目しているとされた場合に、前記音源と前記人物との距離に応じて設定される値よりも、前記時間差を小さくする制御を行う
ことを特徴とする音響再生装置。 The sound reproducing device according to claim 1,
The controller is
A determination unit that determines whether the person is paying attention to the sound source based on information indicating the movement of the person;
When the determination unit determines that the person is paying attention to the sound source, control is performed to make the time difference smaller than a value set according to a distance between the sound source and the person. A sound reproducing device.
前記音源の位置を示す情報と前記人物の位置を示す情報とに基づいて、前記人物の位置を基準とする前記音源の方向を求める第2算出部を有し、
前記提示部は、前記第2算出部によって求められた前記音源の方向から前記人物の視覚に前記刺激を与え、
前記再生部は、前記第2算出部によって求められた前記音源の方向に音像定位された音響信号から再生した音を前記人物の聴覚に与える
ことを特徴とする音響再生装置。 The sound reproducing device according to claim 1 or 2,
Based on information indicating the position of the sound source and information indicating the position of the person, a second calculation unit for determining the direction of the sound source with respect to the position of the person,
The presenting unit gives the stimulus to the visual sense of the person from the direction of the sound source obtained by the second calculation unit,
The sound reproduction device, wherein the reproduction unit gives sound reproduced from the sound signal localized in the direction of the sound source obtained by the second calculation unit to the hearing of the person.
前記制御部は、
前記第2タイミングよりも第1タイミングを遅れさせる方向に前記時間差を設定する
ことを特徴とする音響再生装置。 The sound reproducing device according to claim 1, wherein
The controller is
The sound reproduction apparatus according to claim 1, wherein the time difference is set in a direction in which the first timing is delayed from the second timing.
前記音響信号で示される音の強さに基づいて、人物の視覚に提示する刺激の強度を決定し、
前記音源の位置を示す情報と前記人物の位置を示す情報とに基づいて、前記音源と前記人物との距離を算出し、
前記音響信号から再生される音を前記人物の聴覚に与える第1タイミングと前記決定された強度を持つ刺激を前記人物の視覚に与える第2タイミングとの間の時間差を、前記算出された距離に応じて変更する制御を行う、
処理をコンピュータに実行させることを特徴とする音響再生プログラム。
Receive an acoustic signal indicating the sound emitted from the sound source,
Based on the sound intensity indicated by the acoustic signal, determine the intensity of the stimulus to be presented to the human vision,
Based on the information indicating the position of the sound source and the information indicating the position of the person, the distance between the sound source and the person is calculated,
A time difference between a first timing at which a sound reproduced from the acoustic signal is given to the auditory sense of the person and a second timing at which a stimulus having the determined intensity is given to the visual sense of the person is defined as the calculated distance. Control to change accordingly,
A sound reproduction program that causes a computer to execute processing.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013148746A JP6127792B2 (en) | 2013-07-17 | 2013-07-17 | Sound reproduction apparatus and sound reproduction program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013148746A JP6127792B2 (en) | 2013-07-17 | 2013-07-17 | Sound reproduction apparatus and sound reproduction program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2015023354A JP2015023354A (en) | 2015-02-02 |
| JP6127792B2 true JP6127792B2 (en) | 2017-05-17 |
Family
ID=52487487
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013148746A Active JP6127792B2 (en) | 2013-07-17 | 2013-07-17 | Sound reproduction apparatus and sound reproduction program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6127792B2 (en) |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004113479A (en) * | 2002-09-26 | 2004-04-15 | Kawakami Sangyo Co Ltd | Amusement machine |
| WO2012048299A1 (en) * | 2010-10-07 | 2012-04-12 | Clair Brothers Audio Enterprises, Inc. | Method and system for enhancing sound |
-
2013
- 2013-07-17 JP JP2013148746A patent/JP6127792B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2015023354A (en) | 2015-02-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7283506B2 (en) | Information processing device, information processing method, and information processing program | |
| JP7165215B2 (en) | Virtual Reality, Augmented Reality, and Mixed Reality Systems with Spatialized Audio | |
| JP7275227B2 (en) | Recording virtual and real objects in mixed reality devices | |
| US12495266B2 (en) | Systems and methods for sound source virtualization | |
| EP2891955B1 (en) | In-vehicle gesture interactive spatial audio system | |
| KR102427212B1 (en) | Information processing devices, information processing methods and programs | |
| US10321258B2 (en) | Emulating spatial perception using virtual echolocation | |
| US9971403B1 (en) | Intentional user experience | |
| EP4254353B1 (en) | Augmented reality interaction method and electronic device | |
| CN109087485A (en) | Assisting automobile driver method, apparatus, intelligent glasses and storage medium | |
| JP2020520576A (en) | Apparatus and related method for presentation of spatial audio | |
| JP7048784B2 (en) | Display control system, display control method and program | |
| US20200111257A1 (en) | Sound reproduction apparatus for reproducing virtual speaker based on image information | |
| JP7066115B2 (en) | Public speaking support device and program | |
| CN109145847A (en) | Identification method and device, wearable device and storage medium | |
| Sodnik et al. | Spatial auditory human-computer interfaces | |
| CN110622106A (en) | Audio processing | |
| JP7053074B1 (en) | Appreciation system, appreciation device and program | |
| JP6127792B2 (en) | Sound reproduction apparatus and sound reproduction program | |
| US20130215010A1 (en) | Portable electronic equipment and method of visualizing sound | |
| CN111586395A (en) | Method, computer program and head-mounted device for assisting a subject in acquiring spatial information about an environment | |
| JP6751777B2 (en) | Computer program, display device, head-mounted display device | |
| JP6600186B2 (en) | Information processing apparatus, control method, and program | |
| Zijlstra | Using the hololens' spatial sound system to aid the visually impaired when navigating indoors | |
| JP2018072950A (en) | Simulation apparatus and simulation system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160405 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170217 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170314 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170327 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6127792 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |