Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
JP7188545B2 - Out-of-head localization system and out-of-head localization method - Google Patents
[go: Go Back, main page]

JP7188545B2 - Out-of-head localization system and out-of-head localization method - Google Patents

Out-of-head localization system and out-of-head localization method Download PDF

Info

Publication number
JP7188545B2
JP7188545B2 JP2021194105A JP2021194105A JP7188545B2 JP 7188545 B2 JP7188545 B2 JP 7188545B2 JP 2021194105 A JP2021194105 A JP 2021194105A JP 2021194105 A JP2021194105 A JP 2021194105A JP 7188545 B2 JP7188545 B2 JP 7188545B2
Authority
JP
Japan
Prior art keywords
filter
user
head localization
sound
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021194105A
Other languages
Japanese (ja)
Other versions
JP2022024154A (en
Inventor
寿子 村田
正也 小西
優美 藤井
敬洋 下条
邦明 高地
俊明 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2018183579A external-priority patent/JP6988758B2/en
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2021194105A priority Critical patent/JP7188545B2/en
Publication of JP2022024154A publication Critical patent/JP2022024154A/en
Application granted granted Critical
Publication of JP7188545B2 publication Critical patent/JP7188545B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Description

本発明は、頭外定位処理システム及び頭外定位処理方法に関する。 The present invention relates to an out-of-head localization processing system and out-of-head localization processing method.

特許文献1には、ディスプレイ装置で画像を見ながら、イヤホンやヘッドホンによって
音声を聴く場合において、音像定位を制御するシステムが開示されている。特許文献1の
システムでは、スピーカから両耳に至る伝達関数を時間領域に変換したインパルス応答を
畳み込むフィルタを用いている。さらに、イヤホン又はヘッドホンの左右の出力毎に加算
回路が設けられている。加算回路は、デジタルフィルタからの音声信号を加算している。
加算回路からの音声信号が、DAC(Digital to Analog Converter)でアナログ信号に変
換される。変換後の音声信号は、増幅回路を介して、トランスデューサに供給される。さ
らに、特許文献1では、ディスプレイ又はリスナー頭部の移動距離と回転とに応じて、音
像の定位位置を制御している。
Patent Literature 1 discloses a system for controlling sound image localization when listening to audio through earphones or headphones while viewing an image on a display device. The system of Patent Document 1 uses a filter that convolves an impulse response obtained by transforming a transfer function from a speaker to both ears into a time domain. Further, an adder circuit is provided for each of the left and right outputs of the earphone or headphone. The adding circuit adds the audio signals from the digital filters.
An audio signal from the adder circuit is converted into an analog signal by a DAC (Digital to Analog Converter). The converted audio signal is supplied to the transducer through an amplifier circuit. Furthermore, in Patent Document 1, the localization position of the sound image is controlled according to the movement distance and rotation of the display or the listener's head.

ところで、音像定位技術として、ヘッドホンを用いて受聴者の頭部の外側に音像を定位
させる頭外定位技術がある。頭外定位技術では、ヘッドホンから耳までの特性をキャンセ
ルし、ステレオスピーカから耳までの4本の特性(空間音響伝達特性)を与えることによ
り、音像を頭外に定位させている。
By the way, as a sound image localization technique, there is an out-of-head localization technique in which a sound image is localized outside the listener's head using headphones. In the out-of-head localization technology, the sound image is localized out of the head by canceling the characteristics from the headphones to the ears and giving the four characteristics (spatial sound transfer characteristics) from the stereo speakers to the ears.

頭外定位再生においては、例えば、2チャンネル(以下、chと記載)のスピーカから
発した測定信号(インパルス音等)を聴取者(リスナー)本人の耳に設置したマイクロフ
ォン(以下、マイクとする)で録音する。これにより、スピーカからマイクまでの特性(
空間音響伝達特性、空間音響伝達関数、頭部伝達関数HRTF等とも称する)そして、測
定信号を集音して得られた空間音響伝達特性に基づいて、処理装置がフィルタを生成する
。頭外定位処理装置は、フィルタを2chのオーディオ信号に畳み込む。
In out-of-head localization reproduction, for example, a measurement signal (impulse sound, etc.) emitted from a two-channel (hereinafter referred to as ch) speaker is placed in the ear of the listener (hereinafter referred to as a microphone). to record. This allows the characteristics from the speaker to the microphone (
Also referred to as spatial acoustic transfer characteristics, spatial acoustic transfer function, head-related transfer function HRTF, etc.), and based on the spatial acoustic transfer characteristics obtained by collecting the measured signals, a processing unit generates a filter. The out-of-head localization processing device convolves the filter with the 2ch audio signal.

さらに、ヘッドホンから耳までの特性をキャンセルするフィルタを生成するために、ヘ
ッドホンから耳元乃至鼓膜までの特性(外耳道伝達関数ECTF、外耳道伝達特性とも称
する)を聴取者本人の耳に設置したマイクで測定する。
Furthermore, in order to generate a filter that cancels the characteristics from the headphones to the ear, the characteristics from the headphones to the ear to the eardrum (also called the external auditory canal transfer function ECTF, external auditory canal transfer characteristics) are measured with a microphone placed in the listener's own ear. do.

特開2010-147529号公報JP 2010-147529 A

頭外定位処理を行う場合、聴取者本人の耳に設置したマイクで特性を測定することが好
ましい。しかしながら、聴取者本人の耳にマイクを適切に設置することは困難である。さ
らに、スピーカからマイクまでの空間音響伝達特性を測定する測定場所も制限される。一
方、聴取者以外の特性を用いた場合、適切に頭外定位処理を行うことができないおそれが
ある。特に、人毎、あるいは耳毎に外耳道の形状が異なるため、他人の外耳道伝達特性に
応じたフィルタを用いた場合、処理を適切に行なうことができない場合がある。
When performing out-of-head localization processing, it is preferable to measure the characteristics with a microphone placed in the listener's own ear. However, it is difficult to properly place the microphone in the listener's own ear. Furthermore, the measurement location for measuring the spatial sound transfer characteristics from the speaker to the microphone is also limited. On the other hand, when characteristics other than those of the listener are used, there is a possibility that out-of-head localization processing cannot be appropriately performed. In particular, since the shape of the ear canal differs from person to person or from ear to ear, it may not be possible to perform appropriate processing when using a filter that corresponds to another person's ear canal transfer characteristics.

本発明は上記の点に鑑みなされたものであり、適切に処理することができる頭外定位処
理装置、処理方法、及びプログラムを提供することを目的とする。
SUMMARY OF THE INVENTION It is an object of the present invention to provide an out-of-head localization processing apparatus, a processing method, and a program capable of performing appropriate processing.

本実施形態にかかる頭外定位処理システムは、ユーザが座席に着席する前に、前記ユーザの耳に装着されたマイクを用いて、伝達特性を測定する測定装置と、前記伝達特性に応じたフィルタを用いて頭外定位処理を行う頭外定位処理装置と、前記ユーザの識別情報に基づいて、前記伝達特性に応じたフィルタを、前記頭外定位処理装置に送信するサーバと、を備えたものである。 The out-of-head localization processing system according to the present embodiment includes a measuring device for measuring transfer characteristics using a microphone attached to the ear of the user, and a filter corresponding to the transfer characteristics before the user sits on the seat. and a server for transmitting a filter corresponding to the transfer characteristic to the out-of-head localization processing apparatus based on the identification information of the user. is.

本実施形態にかかる頭外定位処理方法は、ユーザが乗り物に搭乗する前に、前記ユーザ
の耳に装着されたマイクを用いて、伝達特性を測定するステップと、前記ユーザの識別情
報に基づいて、前記乗り物に設置された頭外定位処理装置に前記伝達特性に応じたフィル
タを送信するステップと、前記頭外定位処理装置が、再生信号に対して前記フィルタを用
いた頭外定位処理を行うステップと、前記識別情報に対応する前記ユーザに対して、前記
頭外定位処理された再生信号をヘッドホン又はイヤホンから出力するステップと、を備え
たものである。
The out-of-head localization processing method according to this embodiment comprises the steps of measuring transmission characteristics using a microphone worn on the user's ear before the user boards a vehicle, and a step of transmitting a filter corresponding to the transfer characteristics to an out-of-head localization processing device installed in the vehicle; and outputting the out-of-head localization-processed reproduction signal from headphones or earphones to the user corresponding to the identification information.

本実施形態にかかるフィルタ生成装置は、ユーザが装着したヘッドホン又はイヤホンか
らマイクまでの外耳道伝達特性を取得する外耳道伝達特性取得部と、スピーカからマイク
までの空間音響伝達特性に対応する第1の特性データと、前記外耳道伝達特性に対応する
第2の特性データとを1セットとして、複数セット分を格納するデータベースを参照する
ことで、前記ユーザの外耳道伝達特性の第1の周波数帯域における周波数特性に基づいて
、第1のセットを選択する第1の選択部と、前記第1の選択部で選択された前記第1のセ
ットに含まれる第2の特性データを取得する第1の取得部と、前記データベースを参照す
ることで、前記ユーザの外耳道伝達特性の第2の周波数帯域における周波数特性に基づい
て、第2のセットを選択する第2の選択部と、前記第2の選択部で選択された前記第2の
セットに含まれる第2の特性データを取得する第2の取得部と、予め設定されたプリセッ
トデータを取得する第3の取得部と、前記第1のセットの前記第2の特性データと、前記
第2のセットの第2の特性データと、前記プリセットデータとに基づいて、前記ユーザの
空間音響伝達特性に応じたフィルタを生成するフィルタ生成部と、を備えたものである。
The filter generation device according to the present embodiment includes an ear canal transfer characteristic acquisition unit that acquires the ear canal transfer characteristic from the headphone or earphone worn by the user to the microphone, and a first characteristic corresponding to the spatial sound transfer characteristic from the speaker to the microphone. Data and the second characteristic data corresponding to the ear canal transfer characteristics are set as one set, and by referring to a database storing a plurality of sets, the frequency characteristics in the first frequency band of the ear canal transfer characteristics of the user are obtained. a first selection unit that selects a first set based on, a first acquisition unit that acquires second characteristic data included in the first set selected by the first selection unit; A second selection unit that selects a second set based on frequency characteristics in a second frequency band of the ear canal transfer characteristics of the user by referring to the database, and selected by the second selection unit a second acquisition unit that acquires second characteristic data included in the second set; a third acquisition unit that acquires preset data set in advance; and the second acquisition unit of the first set. a filter generation unit that generates a filter corresponding to the spatial sound transfer characteristic of the user based on the characteristic data, the second characteristic data of the second set, and the preset data. .

本実施形態にかかるフィルタ生成方法は、ユーザが装着したヘッドホン又はイヤホンか
らマイクまでの外耳道伝達特性を取得するステップと、スピーカからマイクまでの空間音
響伝達特性に対応する第1の特性データと、前記外耳道伝達特性に対応する第2の特性デ
ータとを1セットとして、複数セット分を格納するデータベースを参照することで、前記
ユーザの外耳道伝達特性の第1の周波数帯域における周波数特性に基づいて、第1のセッ
トを選択するステップと、前記第1のセットに含まれる第2の特性データを取得するステ
ップと、前記データベースを参照することで、前記ユーザの外耳道伝達特性の第2の周波
数帯域における周波数特性に基づいて、第2のセットを選択するステップと、前記第2の
セットに含まれる第2の特性データを取得するステップと、予め設定されたプリセットデ
ータを取得するステップと、前記第1のセットの前記第2の特性データと、前記第2のセ
ットの第2の特性データと、前記プリセットデータとに基づいて、前記ユーザの空間音響
伝達特性に応じたフィルタを生成するステップと、を備えたフィルタものである。
The filter generation method according to the present embodiment includes the step of acquiring the ear canal transfer characteristic from the headphone or earphone worn by the user to the microphone, the first characteristic data corresponding to the spatial sound transfer characteristic from the speaker to the microphone, and By referring to a database that stores a plurality of sets of second characteristic data corresponding to the ear canal transfer characteristic as one set, based on the frequency characteristic in the first frequency band of the ear canal transfer characteristic of the user, the first selecting one set; obtaining second characteristic data included in the first set; and referring to the database to determine the frequency in the second frequency band of the user's ear canal transfer characteristic. selecting a second set based on the characteristics; obtaining second characteristic data included in the second set; obtaining preset data; generating a filter according to the spatial sound transfer characteristics of the user based on the set of second characteristic data, the second set of second characteristic data, and the preset data. It is a filter thing.

本発明によれば、適切な処理を行うことができる頭外定位処理システム、フィルタ生成
装置、方法、及びプログラムを提供することを目的とする。
An object of the present invention is to provide an out-of-head localization processing system, a filter generation device, a method, and a program capable of performing appropriate processing.

本実施の形態に係る頭外定位処理装置を示すブロック図である。1 is a block diagram showing an out-of-head localization processing apparatus according to this embodiment; FIG. 外耳道伝達特性を測定するための測定装置を示す模式図である。It is a schematic diagram which shows the measuring apparatus for measuring an external auditory canal transfer characteristic. システムの全体構成を示す図である。It is a figure which shows the whole structure of a system. サーバ端末の構成を示す図である。It is a figure which shows the structure of a server terminal. 航空機内に設置された搭乗席と座席端末を示す図である。1 is a diagram showing a boarding seat and a seat terminal installed in an aircraft; FIG. 測定装置における処理を示すフローチャートである。It is a flowchart which shows the process in a measuring device. サーバ端末における処理を示すフローチャートである。4 is a flowchart showing processing in a server terminal; 実施の形態2にかかるフィルタ生成装置の構成を示すブロック図である。2 is a block diagram showing the configuration of a filter generation device according to a second embodiment; FIG. データベースに格納されている第1及び第2の特性データを示す表である。4 is a table showing first and second characteristic data stored in a database; 収音信号における直接音及び反射音を説明するための図である。FIG. 2 is a diagram for explaining direct sound and reflected sound in a collected sound signal; FIG. 実施の形態3にかかる処理装置の構成を示すブロック図である。FIG. 11 is a block diagram showing the configuration of a processing device according to a third embodiment; FIG. 5.1chの再生信号での畳み込み処理と音量調整を説明するための図である。FIG. 10 is a diagram for explaining convolution processing and volume adjustment in a 5.1 ch reproduction signal; 実施の形態4の例1において、LPFをかける処理前後のフィルタを示す図である。FIG. 10 is a diagram showing filters before and after applying an LPF in example 1 of the fourth embodiment; FIG. 実施の形態4の例2において、残響成分を付加したフィルタを示す図である。FIG. 20 is a diagram showing a filter to which a reverberation component is added in Example 2 of Embodiment 4;

本実施の形態にかかる頭外定位処理の概要について説明する。本実施形態にかかる頭外
定位処理は、空間音響伝達特性と外耳道伝達特性を用いて頭外定位処理を行うものである
。空間音響伝達特性は、スピーカなどの音源から外耳道までの伝達特性である。外耳道伝
達特性は、ヘッドホン又はイヤホンのスピーカユニットから鼓膜までの伝達特性である。
本実施形態では、ヘッドホン又はイヤホンを装着していない状態で測定された空間音響伝
達特性に応じたフィルタを用いて、頭外定位処理を行うことができる。さらに、ヘッドホ
ン又はイヤホンを装着した状態で測定された外耳道伝達特性に応じたフィルタを用いて、
頭外定位処理を行うことができる。
An outline of out-of-head localization processing according to the present embodiment will be described. The out-of-head localization processing according to this embodiment uses the spatial sound transfer characteristics and the ear canal transfer characteristics to perform the out-of-head localization processing. Spatial sound transfer characteristics are transfer characteristics from a sound source such as a speaker to the ear canal. The ear canal transfer characteristic is the transfer characteristic from the speaker unit of the headphone or earphone to the eardrum.
In this embodiment, out-of-head localization processing can be performed using a filter corresponding to the spatial sound transfer characteristics measured without wearing headphones or earphones. Furthermore, using a filter according to the ear canal transfer characteristics measured while wearing headphones or earphones,
Out-of-head localization processing can be performed.

本実施の形態にかかる頭外定位処理は、パーソナルコンピュータ、スマートホン、タブ
レットPCなどのユーザ端末で実行される。さらに、頭外定位処理を行うユーザ端末は、
航空機、電車(鉄道車両)、船舶、バス等の乗り物に搭載された再生装置であってもよい
。この場合、乗り物の搭乗席に搭乗した搭乗者が頭外定位受聴を行う。ユーザ端末は、プ
ロセッサ等の処理手段、メモリやハードディスクなどの記憶手段、液晶モニタ等の表示手
段、タッチパネル、ボタン、キーボード、マウスなどの入力手段を有する情報処理装置で
ある。ユーザ端末は、データを送受信する通信機能を有していてもよい。さらに、ユーザ
端末には、ヘッドホン又はイヤホンを有する出力手段(出力ユニット)が接続される。以
下の説明ではヘッドホンを用いる例について説明するが、ヘッドホンの代わりにイヤホン
を用いてもよい。
実施の形態1.
(頭外定位処理装置)
本実施の形態にかかる音場再生装置の一例である頭外定位処理装置100を図1に示す
。図1は、頭外定位処理装置100のブロック図である。頭外定位処理装置100は、ヘ
ッドホン43を装着するユーザUに対して音場を再生する。そのため、頭外定位処理装置
100は、LchとRchのステレオ入力信号XL、XRについて、頭外定位処理を行う
。LchとRchのステレオ入力信号XL、XRは、CD(Compact Disc)プレイヤーな
どから出力されるアナログのオーディオ再生信号、又は、mp3(MPEG Audio Layer-3)等の
デジタルオーディオデータである。なお、オーディオ再生信号、又はデジタルオーディオ
データをまとめて再生信号と称する。すなわち、LchとRchのステレオ入力信号XL
、XRが再生信号となっている。
The out-of-head localization processing according to this embodiment is executed by a user terminal such as a personal computer, a smart phone, or a tablet PC. Furthermore, the user terminal that performs out-of-head localization processing is
It may be a playback device mounted on a vehicle such as an aircraft, a train (railway vehicle), a ship, or a bus. In this case, the passenger in the passenger seat of the vehicle performs out-of-head localized listening. A user terminal is an information processing device having processing means such as a processor, storage means such as a memory and a hard disk, display means such as a liquid crystal monitor, and input means such as a touch panel, buttons, keyboard, and mouse. A user terminal may have a communication function for transmitting and receiving data. Furthermore, output means (output unit) having headphones or earphones are connected to the user terminal. Although an example using headphones will be described below, earphones may be used instead of headphones.
Embodiment 1.
(Out-of-head stereotactic processing device)
FIG. 1 shows an out-of-head localization processing device 100, which is an example of a sound field reproducing device according to the present embodiment. FIG. 1 is a block diagram of an out-of-head localization processing apparatus 100. As shown in FIG. The out-of-head localization processing device 100 reproduces a sound field for the user U wearing the headphones 43 . Therefore, the out-of-head localization processing apparatus 100 performs out-of-head localization processing on the Lch and Rch stereo input signals XL and XR. The Lch and Rch stereo input signals XL and XR are analog audio reproduction signals output from a CD (Compact Disc) player or the like, or digital audio data such as mp3 (MPEG Audio Layer-3). Note that the audio reproduction signal or digital audio data will be collectively referred to as a reproduction signal. That is, Lch and Rch stereo input signal XL
, and XR are reproduction signals.

なお、頭外定位処理装置100は、物理的に単一な装置に限られるものではなく、一部
の処理が異なる装置で行われてもよい。例えば、一部の処理がスマートホンなどにより行
われ、残りの処理がヘッドホン43に内蔵されたDSP(Digital Signal Processor)など
により行われてもよい。
It should be noted that the out-of-head localization processing apparatus 100 is not limited to a physically single apparatus, and a part of the processing may be performed by a different apparatus. For example, part of the processing may be performed by a smart phone or the like, and the rest of the processing may be performed by a DSP (Digital Signal Processor) built in the headphones 43 or the like.

頭外定位処理装置100は、頭外定位処理部10、フィルタ部41、フィルタ部42、
及びヘッドホン43を備えている。頭外定位処理部10、フィルタ部41、及びフィルタ
部42は、具体的にはプロセッサ等により実現可能である。
The out-of-head localization processing device 100 includes an out-of-head localization processing unit 10, a filter unit 41, a filter unit 42,
and headphones 43 are provided. The out-of-head localization processing unit 10, filter unit 41, and filter unit 42 can be specifically realized by a processor or the like.

頭外定位処理部10は、畳み込み演算部11~12、21~22、及び加算器24、2
5を備えている。畳み込み演算部11~12、21~22は、空間音響伝達特性を用いた
畳み込み処理を行う。頭外定位処理部10には、CDプレイヤーなどからのステレオ入力
信号XL、XRが入力される。頭外定位処理部10には、空間音響伝達特性が設定されて
いる。頭外定位処理部10は、各chのステレオ入力信号XL、XRに対し、空間音響伝
達特性のフィルタ(以下、空間音響フィルタとも称する)を畳み込む。空間音響伝達特性
は被測定者の頭部や耳介で測定した頭部伝達関数HRTFでもよいし、ダミーヘッドまた
は第三者の頭部伝達関数であってもよい。
The out-of-head localization processing unit 10 includes convolution calculation units 11 to 12, 21 to 22, and adders 24, 2
5. The convolution calculation units 11 to 12 and 21 to 22 perform convolution processing using spatial acoustic transfer characteristics. Stereo input signals XL and XR from a CD player or the like are input to the out-of-head localization processing unit 10 . Spatial sound transfer characteristics are set in the out-of-head localization processing unit 10 . The out-of-head localization processing unit 10 convolves a spatial acoustic transfer characteristic filter (hereinafter, also referred to as a spatial acoustic filter) with stereo input signals XL and XR of each channel. The spatial sound transfer characteristic may be a head-related transfer function HRTF measured from the head or pinna of the person to be measured, or may be a head-related transfer function of a dummy head or a third person.

4つの空間音響伝達特性Hls、Hlo、Hro、Hrsを1セットとしたものを空間
音響伝達関数とする。畳み込み演算部11、12、21、22で畳み込みに用いられるデ
ータが空間音響フィルタとなる。空間音響伝達特性Hls、Hlo、Hro、Hrsを所
定のフィルタ長で切り出すことで、空間音響フィルタが生成される。
A set of four spatial sound transfer characteristics Hls, Hlo, Hro, and Hrs is defined as a spatial sound transfer function. The data used for convolution in the convolution calculation units 11, 12, 21, and 22 serve as spatial acoustic filters. A spatial acoustic filter is generated by cutting out the spatial acoustic transfer characteristics Hls, Hlo, Hro, and Hrs with a predetermined filter length.

空間音響伝達特性Hls、Hlo、Hro、Hrsのそれぞれは、インパルス応答測定
などにより、事前に取得されている。例えば、ユーザUが左右の耳にマイクをそれぞれ装
着する。ユーザUの前方に配置された左右のスピーカが、インパルス応答測定を行うため
の、インパルス音をそれぞれ出力する。そして、スピーカから出力されたインパルス音等
の測定信号をマイクで収音する。マイクでの収音信号に基づいて、空間音響伝達特性Hl
s、Hlo、Hro、Hrsが取得される。左スピーカと左マイクとの間の空間音響伝達
特性Hls、左スピーカと右マイクとの間の空間音響伝達特性Hlo、右スピーカと左マ
イクとの間の空間音響伝達特性Hro、右スピーカと右マイクとの間の空間音響伝達特性
Hrsが測定される。
Spatial sound transfer characteristics Hls, Hlo, Hro, and Hrs are obtained in advance by impulse response measurement or the like. For example, the user U wears microphones on the left and right ears, respectively. Left and right speakers placed in front of the user U output impulse sounds for impulse response measurement. Then, a measurement signal such as an impulse sound output from the speaker is picked up by a microphone. Spatial sound transfer characteristic Hl
s, Hlo, Hro, Hrs are obtained. Spatial sound transfer characteristics Hls between the left speaker and the left microphone, Spatial sound transfer characteristics Hlo between the left speaker and the right microphone, Spatial sound transfer characteristics Hro between the right speaker and the left microphone, Right speaker and the right microphone The spatial sound transfer characteristic Hrs between is measured.

そして、畳み込み演算部11は、Lchのステレオ入力信号XLに対して空間音響伝達
特性Hlsに応じた空間音響フィルタを畳み込む。畳み込み演算部11は、畳み込み演算
データを加算器24に出力する。畳み込み演算部21は、Rchのステレオ入力信号XR
に対して空間音響伝達特性Hroに応じた空間音響フィルタを畳み込む。畳み込み演算部
21は、畳み込み演算データを加算器24に出力する。加算器24は2つの畳み込み演算
データを加算して、フィルタ部41に出力する。
Then, the convolution calculation unit 11 convolves the Lch stereo input signal XL with a spatial acoustic filter corresponding to the spatial acoustic transfer characteristic Hls. The convolution calculation unit 11 outputs the convolution calculation data to the adder 24 . The convolution calculation unit 21 converts the Rch stereo input signal XR
A spatial acoustic filter corresponding to the spatial acoustic transfer characteristic Hro is convoluted with respect to . The convolution calculation unit 21 outputs the convolution calculation data to the adder 24 . The adder 24 adds the two pieces of convolution operation data and outputs the result to the filter section 41 .

畳み込み演算部12は、Lchのステレオ入力信号XLに対して空間音響伝達特性Hl
oに応じた空間音響フィルタを畳み込む。畳み込み演算部12は、畳み込み演算データを
、加算器25に出力する。畳み込み演算部22は、Rchのステレオ入力信号XRに対し
て空間音響伝達特性Hrsに応じた空間音響フィルタを畳み込む。畳み込み演算部22は
、畳み込み演算データを、加算器25に出力する。加算器25は2つの畳み込み演算デー
タを加算して、フィルタ部42に出力する。
The convolution calculation unit 12 calculates the spatial sound transfer characteristic Hl for the Lch stereo input signal XL.
Convolve the spatial acoustic filter according to o. The convolution calculation unit 12 outputs the convolution calculation data to the adder 25 . The convolution calculation unit 22 convolves a spatial acoustic filter corresponding to the spatial acoustic transfer characteristic Hrs with respect to the Rch stereo input signal XR. The convolution calculation unit 22 outputs the convolution calculation data to the adder 25 . The adder 25 adds the two pieces of convolution operation data and outputs the result to the filter section 42 .

フィルタ部41、42にはヘッドホン特性(ヘッドホンの再生ユニットとマイク間の特
性)をキャンセルする逆フィルタLinv、Rinvが設定されている。そして、頭外定
位処理部10での処理が施された再生信号(畳み込み演算信号)に逆フィルタLinv、
Rinvを畳み込む。フィルタ部41で加算器24からのLch信号に対して、Lch側
のヘッドホン特性の逆フィルタLinvを畳み込む。同様に、フィルタ部42は加算器2
5からのRch信号に対して、Rch側のヘッドホン特性の逆フィルタRinvを畳み込
む。逆フィルタLinv、Rinvは、ヘッドホン43を装着した場合に、ヘッドホンユ
ニットからマイクまでの特性をキャンセルする。マイクは、外耳道入口から鼓膜までの間
ならばどこに配置してもよい。
Inverse filters Linv and Rinv for canceling headphone characteristics (characteristics between the reproduction unit of the headphones and the microphone) are set in the filter units 41 and 42 . Then, an inverse filter Linv,
Convolve Rinv. In the filter unit 41, the Lch signal from the adder 24 is convoluted with an inverse filter Linv of headphone characteristics on the Lch side. Similarly, filter section 42 includes adder 2
The Rch signal from 5 is convolved with an inverse filter Rinv of headphone characteristics on the Rch side. The inverse filters Linv and Rinv cancel the characteristics from the headphone unit to the microphone when the headphones 43 are worn. The microphone can be placed anywhere between the ear canal entrance and the eardrum.

フィルタ部41は、処理されたLch信号YLをヘッドホン43の左ユニット43Lに
出力する。フィルタ部42は、処理されたRch信号YRをヘッドホン43の右ユニット
43Rに出力する。ユーザUは、ヘッドホン43を装着している。ヘッドホン43は、L
ch信号YLとRch信号YR(以下、Lch信号YLとRch信号をまとめてステレオ
信号ともいう)をユーザUに向けて出力する。これにより、ユーザUの頭外に定位された
音像を再生することができる。
Filter section 41 outputs processed Lch signal YL to left unit 43L of headphone 43 . The filter section 42 outputs the processed Rch signal YR to the right unit 43R of the headphone 43 . A user U wears headphones 43 . Headphones 43 are L
A ch signal YL and an Rch signal YR (hereinafter, the Lch signal YL and the Rch signal are collectively referred to as a stereo signal) are output to the user U. Thereby, a sound image localized outside the head of the user U can be reproduced.

このように、頭外定位処理装置100は、空間音響伝達特性Hls、Hlo、Hro、
Hrsに応じた空間音響フィルタと、ヘッドホン特性の逆フィルタLinv,Rinvを
用いて、頭外定位処理を行っている。以下の説明において、空間音響伝達特性Hls、H
lo、Hro、Hrsに応じた空間音響フィルタと、ヘッドホン特性の逆フィルタLin
v,Rinvとをまとめて頭外定位処理フィルタとする。2chのステレオ再生信号の場
合、頭外定位フィルタは、4つの空間音響フィルタと、2つの逆フィルタとから構成され
ている。そして、頭外定位処理装置100は、ステレオ再生信号に対して合計6個の頭外
定位フィルタを用いて畳み込み演算処理を行うことで、頭外定位処理を実行する。頭外定
位フィルタは、ユーザU個人の測定に基づくものであることが好ましい。例えば,ユーザ
Uの耳に装着されたマイクが収音した収音信号に基づいて、頭外定位フィルタが設定され
ている。なお、メモリ容量を削減するため、フィルタ同士を演算し、4つのフィルタにま
とめてもよい。
In this way, the out-of-head localization processing apparatus 100 uses the spatial sound transfer characteristics Hls, Hlo, Hro,
Out-of-head localization processing is performed using a spatial acoustic filter corresponding to Hrs and inverse filters Linv and Rinv of headphone characteristics. In the following description, spatial sound transfer characteristics Hls, H
Spatial acoustic filter corresponding to lo, Hro, Hrs and inverse filter Lin for headphone characteristics
v and Rinv are collectively used as an out-of-head localization processing filter. In the case of a 2ch stereo reproduction signal, the out-of-head localization filter is composed of four spatial acoustic filters and two inverse filters. Then, the out-of-head localization processing apparatus 100 performs out-of-head localization processing by performing convolution processing on the stereo reproduction signal using a total of six out-of-head localization filters. The out-of-head localization filter is preferably based on user U's individual measurements. For example, an out-of-head localization filter is set based on a sound signal picked up by a microphone attached to the user's U ear. In order to reduce the memory capacity, the filters may be calculated and combined into four filters.

このように空間音響フィルタと、ヘッドホン特性の逆フィルタはオーディオ信号用のフ
ィルタである。これらのフィルタが再生信号(ステレオ入力信号XL、XR)に畳み込ま
れることで、頭外定位処理装置100が、頭外定位処理を実行する。つまり、頭外定位処
理装置100は、頭外に音像が定位された音場を再生する再生装置となる。
(測定装置)
次に、図2を用いて、伝達特性を測定する測定装置について説明する。図2は、測定装
置200の測定構成を模式的に示す図である。なお、測定装置200は、図1に示す頭外
定位処理装置100と共通の装置であってもよい。あるいは、測定装置200の一部又は
全部が頭外定位処理装置100と異なる装置となっていてもよい。
Thus, the spatial acoustic filter and the inverse headphone characteristic filter are filters for audio signals. By convolving these filters with the reproduced signals (stereo input signals XL and XR), the out-of-head localization processing apparatus 100 executes out-of-head localization processing. In other words, the out-of-head localization processing device 100 serves as a reproduction device that reproduces a sound field in which a sound image is localized out-of-head.
(measuring device)
Next, a measuring device for measuring transfer characteristics will be described with reference to FIG. FIG. 2 is a diagram schematically showing the measurement configuration of the measurement device 200. As shown in FIG. Note that the measuring device 200 may be a common device with the out-of-head localization processing device 100 shown in FIG. Alternatively, part or all of the measurement device 200 may be a device different from the out-of-head localization processing device 100 .

図2に示すように、測定装置200は、ステレオスピーカ5と、ステレオマイク2と、
ヘッドホン43と、処理装置201とを有している。ステレオスピーカ5が測定環境に設
置されている。測定環境は、被測定者1の自宅の部屋やオーディオシステムの販売店舗や
ショールーム等でもよい。また、測定環境は空港、駅、港湾、バスターミナルなど、乗り
物に搭乗する際に利用する各種施設に設置されていてもよい。
As shown in FIG. 2, the measuring device 200 includes a stereo speaker 5, a stereo microphone 2,
It has a headphone 43 and a processing device 201 . A stereo speaker 5 is installed in the measurement environment. The measurement environment may be a room in the person to be measured 1's home, an audio system store, a showroom, or the like. Also, the measurement environment may be installed in various facilities used when boarding a vehicle, such as airports, stations, harbors, and bus terminals.

本実施の形態では、測定装置200の処理装置201が、測定結果に応じて、頭外定位
フィルタを適切に生成するための演算処理を行っている。処理装置201は、測定信号生
成部211と、収音信号取得部212と、フィルタ生成部213と、を備えている。処理
装置201は、パーソナルコンピュータ(PC)、タブレット端末、スマートホン等であ
り、メモリ、及びCPUを備えている。メモリは、処理プログラムや各種パラメータや測
定データなどを記憶している。CPUは、メモリに格納された処理プログラムを実行する
。CPUが処理プログラムを実行することで、測定信号生成部211、収音信号取得部2
12、フィルタ生成部213の各処理が実行される。
In this embodiment, the processing device 201 of the measuring device 200 performs arithmetic processing for appropriately generating an out-of-head localization filter according to the measurement result. The processing device 201 includes a measurement signal generation section 211 , a collected sound signal acquisition section 212 and a filter generation section 213 . The processing device 201 is a personal computer (PC), tablet terminal, smart phone, or the like, and includes a memory and a CPU. The memory stores processing programs, various parameters, measurement data, and the like. The CPU executes a processing program stored in memory. By executing the processing program by the CPU, the measurement signal generation unit 211 and the collected sound signal acquisition unit 2
12, each process of the filter generator 213 is executed.

測定信号生成部211は、外耳道伝達特性又は空間音響伝達特性を測定するための測定
信号を生成する。測定信号は、例えば、インパルス信号やTSP(Time Strec
hed Pulse)信号等である。ここでは、測定信号としてインパルス音を用いて、
測定装置200がインパルス応答測定を実施している。
The measurement signal generator 211 generates a measurement signal for measuring ear canal transfer characteristics or spatial sound transfer characteristics. The measurement signal is, for example, an impulse signal or a TSP (Time Stroke
hed pulse) signal and the like. Here, using an impulse sound as the measurement signal,
A measurement device 200 is performing an impulse response measurement.

空間音響伝達特性Hls、Hlo、Hro、Hrsを測定する場合、測定装置200は
、ステレオスピーカ5を用いた測定を行う。つまり、被測定者1がヘッドホン43を装着
せずに、ステレオマイク2のみを装着する。そして、ステレオスピーカ5から測定信号を
出力し、ステレオマイク2が測定信号を収音する。空間音響伝達特性Hls、Hlo、H
ro、Hrsを測定する場合、ヘッドホン43は使用されない。
When measuring the spatial sound transfer characteristics Hls, Hlo, Hro, and Hrs, the measurement device 200 performs measurement using the stereo speakers 5 . That is, the person 1 to be measured does not wear the headphones 43 but only the stereo microphone 2 . Then, a measurement signal is output from the stereo speaker 5 and the measurement signal is picked up by the stereo microphone 2 . Spatial sound transfer characteristics Hls, Hlo, H
Headphones 43 are not used when measuring ro, Hrs.

外耳道伝達特性を測定する場合、測定装置200は、ヘッドホン43を用いた測定を行
う。つまり、被測定者1がステレオマイク2、及びヘッドホン43を装着する。そして、
ヘッドホン43から測定信号を出力し、ステレオマイク2が測定信号を収音する。外耳道
伝達特性を測定する場合、ステレオスピーカ5は使用されない。
When measuring the ear canal transfer characteristics, the measurement device 200 performs measurement using the headphones 43 . That is, the subject 1 wears the stereo microphone 2 and the headphones 43 . and,
A measurement signal is output from the headphone 43, and the stereo microphone 2 picks up the measurement signal. Stereo speakers 5 are not used when measuring ear canal transfer characteristics.

まず、空間音響伝達特性Hls、Hlo、Hro、Hrs(以下、単に伝達特性Hls
、Hlo、Hro、Hrsともいう)の測定と、空間音響フィルタの生成について説明す
る。ステレオスピーカ5は、左スピーカ5Lと右スピーカ5Rを備えている。例えば、被
測定者1の前方に左スピーカ5Lと右スピーカ5Rが設置されている。左スピーカ5Lと
右スピーカ5Rは、インパルス応答測定を行うための測定信号を出力する。以下、本実施
の形態では、音源となるスピーカの数を2(ステレオスピーカ)として説明するが、測定
に用いる音源の数は2に限らず、1以上であればよい。すなわち、1chのモノラル、また
は、5.1ch、7.1ch等の、いわゆるマルチチャンネル環境においても同様に、本実施の形態
を適用することができる。
First, spatial sound transfer characteristics Hls, Hlo, Hro, Hrs (hereinafter simply transfer characteristics Hls
, Hlo, Hro, and Hrs) and generating a spatial acoustic filter. The stereo speaker 5 has a left speaker 5L and a right speaker 5R. For example, a left speaker 5L and a right speaker 5R are installed in front of the person 1 to be measured. The left speaker 5L and the right speaker 5R output measurement signals for impulse response measurement. In the following description of the present embodiment, the number of speakers serving as sound sources is two (stereo speakers), but the number of sound sources used for measurement is not limited to two, and may be one or more. That is, the present embodiment can be similarly applied in a so-called multi-channel environment such as 1ch monaural, 5.1ch, 7.1ch, and the like.

ステレオマイク2は、左のマイク2Lと右のマイク2Rを有している。左のマイク2L
は、被測定者1の左耳9Lに設置され、右のマイク2Rは、被測定者1の右耳9Rに設置
されている。具体的には、左耳9L、右耳9Rの外耳道入口から鼓膜までの位置にマイク
2L、2Rを設置することが好ましい。マイク2L、2Rは、ステレオスピーカ5から出
力された測定信号を収音して、収音信号を取得する。マイク2L、2Rは収音信号を処理
装置201に出力する。被測定者1は、人でもよく、ダミーヘッドでもよい。すなわち、
本実施形態において、被測定者1は人だけでなく、ダミーヘッドを含む概念である。
The stereo microphone 2 has a left microphone 2L and a right microphone 2R. Left mic 2L
is installed on the subject's 1 left ear 9L, and the right microphone 2R is installed on the subject's 1 right ear 9R. Specifically, it is preferable to install the microphones 2L and 2R at positions from the entrance of the ear canal of the left ear 9L and the right ear 9R to the eardrum. The microphones 2L and 2R pick up the measurement signal output from the stereo speaker 5 to acquire the picked-up sound signal. The microphones 2L and 2R output picked-up sound signals to the processing device 201. FIG. The person 1 to be measured may be a person or a dummy head. i.e.
In this embodiment, the person to be measured 1 is a concept including not only a person but also a dummy head.

ステレオマイク2の左マイク2L、右マイク2Rがそれぞれ測定信号を収音し、収音信
号を処理装置201に出力する。収音信号取得部212は、左マイク2L、右マイク2R
で収音された収音信号を取得する。なお、収音信号取得部212は、マイク2L、2Rか
らの収音信号をA/D変換するA/D変換器を備えていてもよい。収音信号取得部212
は、複数回の測定により得られた信号を同期加算してもよい。
The left microphone 2 L and the right microphone 2 R of the stereo microphone 2 each pick up the measurement signal and output the picked-up sound signal to the processing device 201 . The collected sound signal acquisition unit 212 receives the left microphone 2L, the right microphone 2R,
Acquire the collected sound signal. The collected sound signal acquisition unit 212 may include an A/D converter that A/D converts the collected sound signals from the microphones 2L and 2R. Acquired sound signal acquisition unit 212
may synchronously add signals obtained by multiple measurements.

左スピーカ5Lがインパルス音を出力することで、収音信号取得部212は、伝達特性
Hlsに対応する収音信号と、伝達特性Hloに対応する収音信号を取得する。その後、
右スピーカ5Rがインパルス音を出力することで、収音信号取得部212は、伝達特性H
rsに対応する収音信号と、伝達特性Hroに対応する収音信号を取得する。なお、左ス
ピーカ5Lによる測定と、右スピーカ5Rによる測定との順番は反対でもよい。
When the left speaker 5L outputs the impulse sound, the collected sound signal acquisition unit 212 acquires a collected sound signal corresponding to the transfer characteristic Hls and a collected sound signal corresponding to the transfer characteristic Hlo. after that,
By outputting the impulse sound from the right speaker 5R, the collected sound signal acquisition unit 212 acquires the transfer characteristic H
A picked-up sound signal corresponding to rs and a picked-up sound signal corresponding to the transfer characteristic Hro are obtained. The order of the measurement by the left speaker 5L and the measurement by the right speaker 5R may be reversed.

上記のように、左右のスピーカ5L、5Rで出力されたインパルス音をマイク2L、2
Rで測定することでインパルス応答が測定される。処理装置201は、インパルス応答測
定に基づいて取得した収音信号をメモリなどに記憶する。これにより、左スピーカ5Lと
左マイク2Lとの間の伝達特性Hls、左スピーカ5Lと右マイク2Rとの間の伝達特性
Hlo、右スピーカ5Rと左マイク2Lとの間の伝達特性Hro、右スピーカ5Rと右マ
イク2Rとの間の伝達特性Hrsが測定される。すなわち、左スピーカ5Lから出力され
た測定信号を左マイク2Lが収音することで、伝達特性Hlsが取得される。左スピーカ
5Lから出力された測定信号を右マイク2Rが収音することで、伝達特性Hloが取得さ
れる。右スピーカ5Rから出力された測定信号を左マイク2Lが収音することで、伝達特
性Hroが取得される。右スピーカ5Rから出力された測定信号を右マイク2Rが収音す
ることで、伝達特性Hrsが取得される。
As described above, the impulse sounds output by the left and right speakers 5L and 5R are transferred to the microphones 2L and 2
Measuring with R measures the impulse response. The processing device 201 stores the picked-up sound signal acquired based on the impulse response measurement in a memory or the like. As a result, the transfer characteristic Hls between the left speaker 5L and the left microphone 2L, the transfer characteristic Hlo between the left speaker 5L and the right microphone 2R, the transfer characteristic Hro between the right speaker 5R and the left microphone 2L, the right speaker A transfer characteristic Hrs between 5R and the right microphone 2R is measured. That is, the measurement signal output from the left speaker 5L is picked up by the left microphone 2L to obtain the transfer characteristic Hls. The transfer characteristic Hlo is acquired by the right microphone 2R picking up the measurement signal output from the left speaker 5L. The measurement signal output from the right speaker 5R is picked up by the left microphone 2L to obtain the transfer characteristic Hro. The transfer characteristic Hrs is acquired by the right microphone 2R picking up the measurement signal output from the right speaker 5R.

そして、フィルタ生成部213は、収音信号に基づいて、左右のスピーカ5L、5Rか
ら左右のマイク2L、2Rまでの伝達特性Hls、Hlo、Hro、Hrsに応じたフィ
ルタを生成する。フィルタ生成部213は、伝達特性Hls、Hlo、Hro、Hrsを
所定のフィルタ長で切り出して、所定の演算処理を行う。このようにすることで、処理装
置201は、頭外定位処理装置100の畳み込み演算に用いられる空間音響フィルタを生
成する。
Then, the filter generation unit 213 generates filters according to the transfer characteristics Hls, Hlo, Hro, Hrs from the left and right speakers 5L, 5R to the left and right microphones 2L, 2R based on the collected sound signals. The filter generator 213 cuts out the transfer characteristics Hls, Hlo, Hro, and Hrs with a predetermined filter length and performs predetermined arithmetic processing. By doing so, the processing device 201 generates a spatial acoustic filter used in the convolution operation of the out-of-head localization processing device 100 .

次に、外耳道伝達特性の測定と、逆フィルタLinv、Rinvの生成について説明す
る。被測定者1が、左右の耳9L、9Rにマイク2L、2Rを装着した状態で、ヘッドホ
ン43を装着する。すなわち、被測定者1は左右のマイク2L、2Rの上から、ヘッドホ
ン43を装着する。左マイク2L、及び右マイク2Rは、ヘッドホン43に干渉しないよ
うに構成されている。すなわち、左マイク2L、及び右マイク2Rは左耳9L、右耳9R
の適切な位置に配置された状態で、被測定者1がヘッドホン43を装着することができる
Next, the measurement of the ear canal transfer characteristics and the generation of the inverse filters Linv and Rinv will be described. The subject 1 wears the headphones 43 with the microphones 2L and 2R attached to the left and right ears 9L and 9R. That is, the subject 1 wears the headphones 43 over the left and right microphones 2L and 2R. The left microphone 2L and the right microphone 2R are configured so as not to interfere with the headphone 43. FIG. That is, the left microphone 2L and the right microphone 2R are connected to the left ear 9L and the right ear 9R.
The person to be measured 1 can wear the headphones 43 while the headphones 43 are arranged at appropriate positions.

測定信号生成部211が生成した測定信号は、ヘッドホン43の左ユニット43L、右
ユニット43Rからそれぞれ出力される。左マイク2Lは、ヘッドホン43の左ユニット
43Lから出力された音を収音する。右マイク2Rは、ヘッドホン43の右ユニット43
Rから出力された音を収音する。
The measurement signal generated by the measurement signal generator 211 is output from the left unit 43L and the right unit 43R of the headphone 43, respectively. The left microphone 2L picks up sound output from the left unit 43L of the headphone 43 . The right microphone 2R is connected to the right unit 43 of the headphone 43.
Sound output from R is collected.

このように、マイク2L、2Rは、ヘッドホン43から出力された測定信号を収音して
、収音信号を検出する。収音信号取得部212は、マイク2L、2Rからの収音信号を取
得する。なお、外耳道伝達特性と空間音響伝達特性の測定は、別の処理装置201を用い
て、別の場所で行われてもよい。したがって、ステレオスピーカ5が設けられている測定
環境以外の場所でも、外耳道伝達特性を測定することが可能である。
In this way, the microphones 2L and 2R pick up the measurement signal output from the headphone 43 and detect the picked-up sound signal. The collected sound signal acquisition unit 212 acquires the collected sound signals from the microphones 2L and 2R. It should be noted that the measurement of the ear canal transfer characteristics and the spatial sound transfer characteristics may be performed using another processing device 201 and at another location. Therefore, it is possible to measure the ear canal transfer characteristics even in a place other than the measurement environment where the stereo speakers 5 are provided.

処理装置201は、インパルス応答測定に基づく収音信号をメモリなどに記憶する。こ
れにより、左ユニット43Lと左マイク2Lとの間の伝達特性(すなわち、左耳9Lの外
耳道伝達特性ECTFL)と、右ユニット43Rと右マイク2Rとの間の伝達特性(すな
わち、右耳9Rの外耳道伝達特性ECTFR)が取得される。処理装置201は、測定デ
ータを記憶するメモリなどを有している。
The processing device 201 stores the picked-up sound signal based on the impulse response measurement in a memory or the like. As a result, the transfer characteristic between the left unit 43L and the left microphone 2L (that is, the ear canal transfer characteristic ECTFL of the left ear 9L) and the transfer characteristic between the right unit 43R and the right microphone 2R (that is, the Ear canal transfer characteristics (ECTFR) are obtained. The processing device 201 has a memory or the like for storing measurement data.

処理装置201は、外耳道伝達特性ECTFL、ECTFRに基づいて、逆フィルタL
inv、Rinvをそれぞれ算出する。例えば、処理装置201は、離散フーリエ変換や
離散コサイン変換などにより、外耳道伝達特性の周波数振幅特性及び周波数位相特性を算
出する。そして、処理装置201は、周波数振幅特性の逆特性を求める。なお、処理装置
201は、周波数帯域毎に、周波数振幅特性、又はその逆特性等を補正してもよい。処理
装置201は、逆離散フーリエ変換等により、逆特性と位相特性とを用いて時間信号を算
出する。処理装置201は、時間信号を所定のフィルタ長で切り出すことで、逆フィルタ
を算出する。上記のように、逆フィルタはヘッドホン特性(ヘッドホンの再生ユニットと
マイク間の特性)をキャンセルするフィルタである。なお、逆フィルタの算出方法につい
ては、公知の手法を用いることができるため、詳細な説明を省略する。
The processing device 201 applies an inverse filter L
Calculate inv and Rinv respectively. For example, the processing device 201 calculates frequency-amplitude characteristics and frequency-phase characteristics of the ear canal transfer characteristics by discrete Fourier transform, discrete cosine transform, or the like. Then, the processing device 201 obtains the inverse characteristic of the frequency-amplitude characteristic. Note that the processing device 201 may correct the frequency amplitude characteristic or its inverse characteristic for each frequency band. The processing unit 201 calculates a time signal using the inverse characteristic and the phase characteristic by inverse discrete Fourier transform or the like. The processing device 201 calculates an inverse filter by cutting out the time signal with a predetermined filter length. As described above, the inverse filter is a filter that cancels the headphone characteristics (the characteristics between the headphone playback unit and the microphone). In addition, since a well-known method can be used for the calculation method of the inverse filter, detailed description thereof will be omitted.

処理装置201は、空間音響伝達特性Hls、Hlo、Hro、Hrsに応じたフィル
タ、及び左右の逆フィルタLinv、Rinvを保存する。処理装置201と頭外定位処
理装置100とが異なる装置の場合、処理装置201は、フィルタ、及び逆フィルタを頭
外定位処理装置100に送信する。なお、ヘッドホン43又はステレオスピーカ5と、処
理装置201との接続は、Bluetooth(登録商標)などを用いた無線接続であっ
てもよい。
The processing unit 201 stores filters according to the spatial sound transfer characteristics Hls, Hlo, Hro, Hrs and left and right inverse filters Linv, Rinv. If the processing device 201 and the out-of-head localization processing device 100 are different devices, the processing device 201 transmits the filter and the inverse filter to the out-of-head localization processing device 100 . Note that the connection between the headphones 43 or the stereo speakers 5 and the processing device 201 may be a wireless connection using Bluetooth (registered trademark) or the like.

ここで、頭外定位処理受聴を行うユーザUに対して、測定装置200が測定を行うこと
で、ユーザUに適した頭外定位フィルタを生成することができる。つまり、ユーザUを被
測定者1として、測定装置200が、空間音響伝達特性、及び外耳道伝達特性を行うこと
で、ユーザU固有の頭外定位フィルタ(以下、単にフィルタとも称する)を生成すること
ができる。
(システム構成)
次に、フィルタ生成、及び頭外定位処理を行うシステム構成について、図3を用いて説
明する。図3は、システムの全体構成を模式的に示す図である。システム1000は測定
装置200と、サーバ端末600と、を備えている。図3では、航空機500の搭乗者に
対して、頭外定位処理を行うためのシステム1000が示されている。つまり、図1で示
したユーザUが航空機500の搭乗者となる。ここでは、フィルタと搭乗者の識別情報と
を対応付けて格納することで、搭乗者毎にフィルタを設定することができる。従って、搭
乗者毎に異なるフィルタを用いて、頭外定位処理を行うことができる。
Here, an out-of-head localization filter suitable for the user U can be generated by measuring the user U who performs out-of-head localization processing listening with the measurement device 200 . That is, with the user U as the person to be measured 1, the measurement apparatus 200 performs spatial acoustic transfer characteristics and ear canal transfer characteristics to generate an out-of-head localization filter (hereinafter simply referred to as a filter) unique to the user U. can be done.
(System configuration)
Next, a system configuration for filter generation and out-of-head localization processing will be described with reference to FIG. FIG. 3 is a diagram schematically showing the overall configuration of the system. A system 1000 includes a measuring device 200 and a server terminal 600 . Referring to FIG. 3, a system 1000 for performing out-of-head localization for occupants of aircraft 500 is shown. In other words, user U shown in FIG. 1 becomes a passenger on aircraft 500 . Here, the filter can be set for each passenger by storing the filter and the identification information of the passenger in association with each other. Therefore, out-of-head localization processing can be performed using a different filter for each passenger.

測定装置200は、図2で示した測定装置200と同様である。ここでは、測定装置2
00は、空港に設置されている。例えば、測定装置200は、航空会社のラウンジ等に設
置されていてもよい。ラウンジを測定環境とする場合、ラウンジには、ステレオスピーカ
5、ヘッドホン43、及び処理装置201等が設置されている。さらに、ラウンジには、
測定装置200を設置するためのデスクなどが設けられていてもよい。処理装置201は
、図1で示した頭外定位処理装置100の頭外定位処理機能を有していてもよい。
The measuring device 200 is similar to the measuring device 200 shown in FIG. Here, the measuring device 2
00 is installed at the airport. For example, the measuring device 200 may be installed in an airline lounge or the like. When the lounge is used as the measurement environment, stereo speakers 5, headphones 43, processing device 201, and the like are installed in the lounge. In addition, the lounge has
A desk or the like for installing the measuring device 200 may be provided. The processing device 201 may have the out-of-head localization processing function of the out-of-head localization processing device 100 shown in FIG.

測定装置200には、入力手段221と、表示手段222と、通信手段223と、アン
テナ224が設けられている。入力手段221は、キーボード、マウス、タッチパネルな
どを備えており、搭乗者又は操作者からの入力を受け付ける。あるいは、音声入力を受け
付ける場合、入力手段221は、マイク及び音声認識機能を備えている。表示手段222
は、モニタなどを備えており、入力画面や測定画面を表示する。
The measuring device 200 is provided with input means 221 , display means 222 , communication means 223 and an antenna 224 . The input means 221 includes a keyboard, mouse, touch panel, etc., and receives input from the passenger or operator. Alternatively, when accepting voice input, the input means 221 has a microphone and a voice recognition function. display means 222
has a monitor, etc., and displays an input screen and a measurement screen.

搭乗者は、表示手段222に表示された入力画面を確認しながら、入力手段221を操
作することで、搭乗者を識別するための識別情報を入力する。識別情報は搭乗者毎に与え
られている固有の情報である。例えば、搭乗者が搭乗する航空機500の航空会社におけ
るマイレージクラブの会員番号(会員ID)を、識別情報として用いることができる。こ
の場合、入力手段221は、マイレージカードをスキャンするカードスキャナなどであっ
てもよい。入力手段221は、スマートホンの画面に表示した識別情報やスマートホンに
内蔵されたICチップに記憶された識別情報などを読み取る装置であってもよい。
The passenger operates the input means 221 while checking the input screen displayed on the display means 222 to input identification information for identifying the passenger. The identification information is unique information given to each passenger. For example, a membership number (member ID) of a mileage club of an airline company of aircraft 500 boarded by a passenger can be used as identification information. In this case, the input means 221 may be a card scanner or the like for scanning a mileage card. The input unit 221 may be a device that reads identification information displayed on the screen of the smartphone or identification information stored in an IC chip built into the smartphone.

図2で説明したように、測定装置200は、測定を行って、フィルタを生成する。ここ
で、ヘッドホン43は、航空機500に搭載されたヘッドホンと同じタイプのものである
。ヘッドホン43は、航空会社から貸与される。あるいは、搭乗者がヘッドホン43を購
入することも可能となっている。また、複数のヘッドホン43を用意しておいて、測定に
使用したヘッドホン43を搭乗者が機内に持ち込むようにしてもよい。フライト毎にヘッ
ドホン43の機種が異なる場合、測定環境に、それぞれの機種のヘッドホン43を用意し
ておくことが好ましい。
As described in FIG. 2, the measurement device 200 makes measurements and generates filters. Here, the headphones 43 are of the same type as the headphones carried on the aircraft 500 . Headphones 43 are loaned from airlines. Alternatively, the passenger can purchase the headphones 43 . Alternatively, a plurality of headphones 43 may be prepared and passengers may carry the headphones 43 used for measurement into the cabin. When the model of the headphones 43 differs for each flight, it is preferable to prepare the headphones 43 of each model in the measurement environment.

測定装置200は、生成したフィルタをサーバ端末600に送信する。測定装置200
は、識別情報に対応付けてフィルタをサーバ端末600に送信する。これにより、サーバ
端末600は、搭乗者の識別情報とフィルタとを受信する。サーバ端末600は、機内に
配置されていてもよく、機外に配置されていてもよい。
Measuring device 200 transmits the generated filter to server terminal 600 . Measuring device 200
transmits the filter to the server terminal 600 in association with the identification information. Accordingly, server terminal 600 receives the identification information of the passenger and the filter. The server terminal 600 may be placed inside the aircraft or outside the aircraft.

例えば、通信手段223は、フィルタや識別情報のデータに対して、変調などを行う変
調回路等を有している。通信手段223で変調されたデータが、アンテナ224から送信
される。サーバ端末600のアンテナ601は、アンテナ224から送信されたデータを
受信する。
For example, the communication means 223 has a modulation circuit or the like that modulates data of filters and identification information. Data modulated by communication means 223 is transmitted from antenna 224 . Antenna 601 of server terminal 600 receives data transmitted from antenna 224 .

図4は、サーバ端末600を模式的に示す図である。受信手段602は、受信したデー
タを復調する復調回路等を備えている。サーバ端末600は、識別情報に応じて、フィル
タを航空機500内の座席端末511に設定する。
FIG. 4 is a diagram schematically showing the server terminal 600. As shown in FIG. The receiving means 602 includes a demodulation circuit or the like for demodulating the received data. Server terminal 600 sets a filter to seat terminal 511 in aircraft 500 according to the identification information.

航空機500は、複数の搭乗席と、複数の座席端末511と、が備えている。つまり、
航空機500内では、搭乗席毎に座席端末511が設けられている。図5に搭乗席と座席
端末511の一例を示す。図5では、搭乗席521に搭乗者であるユーザU(搭乗者)が
座っている。ユーザUがヘッドホン43を装着している。機内においてユーザUが装着す
るヘッドホン43は、測定を行ったヘッドホン43と同じ機種のものとなっている。
Aircraft 500 includes multiple passenger seats and multiple seat terminals 511 . in short,
In the aircraft 500, a seat terminal 511 is provided for each passenger seat. FIG. 5 shows an example of a passenger seat and a seat terminal 511. As shown in FIG. In FIG. 5 , a user U (passenger) who is a passenger is sitting in a passenger seat 521 . A user U is wearing headphones 43 . The headphones 43 worn by the user U in the cabin are of the same model as the headphones 43 used for the measurement.

座席端末511は、例えば、搭乗席521の下や肘掛け等に設置されている。ここでは
、搭乗席521毎に座席端末511が設置されている。そして、座席端末511に設けら
れたイヤホンジャック(不図示)には、ヘッドホン43が接続されている。座席端末51
1が図1で示した頭外定位処理装置100に対応する。
The seat terminal 511 is installed, for example, under the passenger seat 521 or on an armrest. Here, a seat terminal 511 is installed for each passenger seat 521 . A headphone 43 is connected to an earphone jack (not shown) provided on the seat terminal 511 . seat terminal 51
1 corresponds to the out-of-head localization processing apparatus 100 shown in FIG.

座席端末511は、搭乗席521毎に設置されている。つまり、複数の搭乗席521と
複数の座席端末511は、1対1に対応付けられている。サーバ端末600は、搭乗席5
21の座席番号と、座席端末511の端末番号を対応付けて、保存している。座席端末5
11の端末番号は、例えば、座席端末511のIPアドレス等の固有の情報である。さら
に、航空機500では、搭乗者毎に搭乗する搭乗席521が指定されている。つまり、サ
ーバ端末600は、搭乗者の識別情報と搭乗席とを対応付けて、保存している。
A seat terminal 511 is installed for each passenger seat 521 . That is, the plurality of boarding seats 521 and the plurality of seat terminals 511 are associated one-to-one. The server terminal 600 is connected to the passenger seat 5
21 and the terminal number of the seat terminal 511 are associated and stored. seat terminal 5
The terminal number 11 is unique information such as the IP address of the seat terminal 511, for example. Furthermore, in aircraft 500, a boarding seat 521 is designated for each passenger. In other words, the server terminal 600 associates and stores the identification information of the passenger and the boarding seat.

例えば、航空会社は、搭乗者の識別情報と、フライト番号と、座席番号と、端末番号と
、を管理している。よって、サーバ端末600は、識別情報を参照することで、搭乗者が
搭乗する航空機とその搭乗席を特定することができる。そして、サーバ端末600は、特
定した搭乗席521に対応する座席端末511にフィルタを送信する。
For example, airlines manage passenger identification information, flight numbers, seat numbers, and terminal numbers. Therefore, the server terminal 600 can specify the aircraft and the boarding seat of the passenger by referring to the identification information. The server terminal 600 then transmits the filter to the seat terminal 511 corresponding to the specified boarding seat 521 .

このように、測定装置200は、搭乗者を識別するための識別情報に対応付けて、フィ
ルタをサーバ端末600に送信する。そして、サーバ端末600は、識別情報を参照して
、搭乗者の搭乗席521の座席端末511にフィルタを送信する。これにより、システム
1000は、搭乗者毎に適切なフィルタを設定することができる。
In this way, the measuring device 200 transmits the filter to the server terminal 600 in association with the identification information for identifying the passenger. Then, the server terminal 600 refers to the identification information and transmits the filter to the seat terminal 511 of the passenger's boarding seat 521 . This allows system 1000 to set an appropriate filter for each passenger.

次に、測定装置200における処理について、図6を用いて説明する。図6は、測定装
置200における処理を示すフローチャートである。まず、搭乗者(ユーザU)の操作に
よって、処理装置201に搭乗者のID(識別情報)が入力される(S1)。処理装置2
01は、識別情報を記憶する。そして、処理装置201が識別情報に対応する搭乗者のフ
ライト番号と座席番号を確認する(S2)。例えば、処理装置201は、サーバ端末60
0の情報を参照して、フライト番号と座席番号を確認する。処理装置201が、フライト
番号又は座席番号を確認できない場合(S2のNO)、エラーメッセージを表示し(S3
)、終了する。つまり、処理装置201は、搭乗者の識別情報に対応するフライト番号と
座席番号を特定することができないため、エラーメッセージを表示した上で、処理を終了
する。
Next, processing in the measuring device 200 will be described using FIG. FIG. 6 is a flowchart showing processing in the measuring device 200. As shown in FIG. First, the ID (identification information) of the passenger is input to the processing device 201 by the operation of the passenger (user U) (S1). Processing device 2
01 stores identification information. Then, the processing device 201 confirms the passenger's flight number and seat number corresponding to the identification information (S2). For example, the processing device 201 may use the server terminal 60
Check the flight number and seat number by referring to the information in 0. If the processing device 201 cannot confirm the flight number or seat number (NO in S2), it displays an error message (S3
),finish. That is, since the processing device 201 cannot specify the flight number and seat number corresponding to the passenger identification information, the processing ends after displaying an error message.

処理装置201が、フライト番号又は座席番号を確認できた場合(S2のYES)、測
定装置200が、空間音響伝達特性及び外耳道伝達特性の測定を行う(S4)。なお、空
間音響伝達特性及び外耳道伝達特性を測定する順番は、特に限定されるものではない。そ
して、処理装置201が、測定結果に基づいて、フィルタを生成する(S5)。ここでは
、処理装置201は、4つの空間音響フィルタ、及び左右の逆フィルタLinv、Rin
vを含む頭外定位処理フィルタを保存する。
If the processing device 201 can confirm the flight number or seat number (YES in S2), the measuring device 200 measures the spatial sound transfer characteristics and the ear canal transfer characteristics (S4). The order of measuring the spatial sound transfer characteristics and the ear canal transfer characteristics is not particularly limited. Then, the processing device 201 generates a filter based on the measurement result (S5). Here, the processing unit 201 includes four spatial acoustic filters and left and right inverse filters Linv, Rin
Save the out-of-head localization filter containing v.

次に、S5で生成されたフィルタを用いて、頭外定位処理装置100がユーザUに頭外
定位処理された再生信号を試聴させる(S6)。つまり、ユーザUがヘッドホン43を装
着して、頭外定位受聴を行なう。これにより、頭外に音像が定位された音場を再生するこ
とができる。ここで、頭外定位処理装置100は、S4での測定やS5でのフィルタ生成
を行った処理装置201と共通の装置であってもよく、別の装置であってもよい。処理装
置201と頭外定位処理装置100とが、物理的に別の装置となっている場合、処理装置
201は、無線又は有線で、頭外定位処理装置100にフィルタを送信する。
Next, using the filter generated in S5, the out-of-head localization processing device 100 causes the user U to listen to the reproduced signal after out-of-head localization processing (S6). That is, the user U wears the headphones 43 and performs out-of-head localization listening. As a result, a sound field in which the sound image is localized outside the head can be reproduced. Here, the out-of-head localization processing device 100 may be the same device as the processing device 201 that performed the measurement in S4 and the filter generation in S5, or may be a separate device. If the processing device 201 and the out-of-head localization processing device 100 are physically separate devices, the processing device 201 transmits the filter to the out-of-head localization processing device 100 wirelessly or by wire.

そして、処理装置201又は頭外定位処理装置100が、この音場を採用するか否かを
判定する(S7)。処理装置201又は頭外定位処理装置100は、ユーザ入力に応じて
、この音場を採用するか否かを判定する。例えば、表示手段222が、試聴した音場でよ
いか否かを確認するためのメッセージと選択ボタンなどをモニタ上に表示させる。あるい
は、処理装置201は、音声メッセージで問い合わせを行うようにしてもよい。
Then, the processing device 201 or the out-of-head localization processing device 100 determines whether or not to adopt this sound field (S7). The processing device 201 or the out-of-head localization processing device 100 determines whether or not to adopt this sound field according to user input. For example, the display means 222 displays on the monitor a message and a selection button for confirming whether or not the auditioned sound field is acceptable. Alternatively, the processing unit 201 may ask for a voice message.

ユーザUは、入力手段221を操作することで、試聴した音場を採用するか否かを選択
することができる。つまり、ユーザUは、頭外定位受聴の受聴結果に応じて、音場が適切
であるか否かを指定する。ユーザUは、頭外定位処理された音場に違和感などを覚えた場
合、この音場を採用しないように、入力を行う。頭外定位再生された音場が好みの音場で
ある場合、ユーザUは、この音場を採用するように、入力を行う。ユーザUは、音場を試
聴した聴感に応じて、音場(フィルタ)の採用又は不採用のボタンを選択(例えばクリッ
クやタップなど)する。そして、処理装置201がユーザ入力に基づいて、音場を採用す
るか否かを判定する。
By operating the input means 221, the user U can select whether or not to adopt the sound field that has been auditioned. That is, the user U specifies whether the sound field is appropriate or not according to the listening result of the out-of-head localization listening. If the user U feels uncomfortable with the sound field subjected to out-of-head localization processing, he or she makes an input so as not to adopt this sound field. If the out-of-head localization-reproduced sound field is the desired sound field, the user U makes an input to adopt this sound field. The user U selects (for example, clicks or taps) a button for adopting or not adopting the sound field (filter) according to the auditory sense of the sound field. Then, based on the user input, the processing device 201 determines whether or not to adopt the sound field.

この音場を採用しないと判定した場合(S7のNO)。処理装置201は、再測定の要
求があるか否かを判定する(S8)。処理装置201又は頭外定位処理装置100は、ユ
ーザ入力に応じて、再測定の要求があるか否かを判定する。例えば、表示手段222が、
再測定ボタンと終了ボタンなどをモニタ上に表示させる。あるいは、処理装置201は、
音声メッセージで再測定の問い合わせを行うようにしてもよい。
When it is determined that this sound field is not adopted (NO in S7). The processing device 201 determines whether or not there is a request for remeasurement (S8). The processing device 201 or the out-of-head localization processing device 100 determines whether or not there is a request for re-measurement according to user input. For example, the display means 222
Display a remeasurement button, an end button, etc. on the monitor. Alternatively, the processing device 201
An inquiry about remeasurement may be made by a voice message.

ユーザUは再測定を行なう場合、再測定ボタンを選択する。ユーザUは、再測定を行な
わない場合、終了ボタンを選択する。処理装置201は、ユーザ入力を受け付けると、ユ
ーザ入力に基づいて、再測定を行なうか否かを判定する。もちろん、音声メッセージを用
いた入出力であってもよい。
The user U selects the remeasurement button when performing remeasurement. The user U selects the end button when not re-measuring. Upon receiving the user input, the processing device 201 determines whether or not to perform re-measurement based on the user input. Of course, input/output using a voice message may be used.

S8において、再測定要求が無いと判定された場合(S8のNO)、処理装置201は
、処理を終了する。S8において、再測定要求が有ると判定された場合(S8のYES)
、S4に戻り、再測定を行う。そして、再測定結果に基づいて、測定装置200がフィル
タを生成する(S5)。そして、頭外定位処理装置100が再測定により得られたフィル
タを用いて、再度、試聴を実施する。(S6)。
If it is determined in S8 that there is no remeasurement request (NO in S8), the processing device 201 ends the process. If it is determined in S8 that there is a remeasurement request (YES in S8)
, and returns to S4 for re-measurement. Then, based on the re-measurement result, the measuring device 200 generates a filter (S5). Then, the out-of-head localization processing apparatus 100 uses the filter obtained by the remeasurement to perform trial listening again. (S6).

S7において、処理装置201が、この音場を採用すると判定した場合(S7のYES
)、ユーザUによる料金の支払いを受け付ける(S9)。ここで、料金はクレジットカー
ド、又は現金による支払いに限らず、航空会社のマイル(マイレージ)等のポイントによ
る支払いでもよい。そして、処理装置201は、フィルタ及び識別情報を含む個人データ
をサーバ端末600に送信する(S10)。これにより、処理が終了する。
In S7, when the processing device 201 determines to adopt this sound field (YES in S7
), and accepts the payment of the fee by the user U (S9). Here, the fee is not limited to payment by credit card or cash, but payment by points such as airline miles (mileage) may be used. Then, the processing device 201 transmits personal data including the filter and identification information to the server terminal 600 (S10). This ends the processing.

次に、サーバ端末600における処理について、図7を用いて、説明する。図7は、サ
ーバ端末600における処理を示すフローチャートである。まず、サーバ端末600は、
搭乗者のID(識別情報)を受信したか否かを判定する(S11)。ここでは、サーバ端
末600が、図6のS1において入力された識別情報を処理装置201から受信したか否
かを判定する。サーバ端末600が、識別情報を受信していない場合(S11のNO)、
受信するまで処理を繰り返す。
Next, processing in server terminal 600 will be described using FIG. FIG. 7 is a flow chart showing processing in the server terminal 600. As shown in FIG. First, the server terminal 600
It is determined whether or not the passenger's ID (identification information) has been received (S11). Here, it is determined whether or not the server terminal 600 has received the identification information input in S1 of FIG. If the server terminal 600 has not received the identification information (NO in S11),
Repeat the process until received.

サーバ端末600は、識別情報を受信した場合(S11のYES)、識別情報に対応す
るフライト番号、座席番号、座席端末番号を検索して、処理装置201に送信する(S1
2)。サーバ端末600は、航空会社が管理しているフライト情報等を参照して、識別情
報の搭乗者が搭乗するフライト番号、座席番号、座席端末番号を特定する。なお、処理装
置201では、S12で送信されたフライト番号、座席番号に基づいて、図6のS2での
判定を行っている。
When the server terminal 600 receives the identification information (YES in S11), it searches for the flight number, seat number, and seat terminal number corresponding to the identification information, and transmits them to the processing device 201 (S1
2). The server terminal 600 identifies the flight number, seat number, and seat terminal number of the passenger of the identification information by referring to flight information managed by the airline company. Note that the processing device 201 performs the determination in S2 of FIG. 6 based on the flight number and seat number transmitted in S12.

次に、サーバ端末600は、支払い意思通知を受信したか否かを判定する(S13)。
ここでは、サーバ端末600は、図6のS9での料金支払いが行なわれているか否かを判
定する。サーバ端末600は、料金の支払い意思通知を受信していない場合(S13のN
O)、支払い意思通知を受信するまで待機する。
Next, the server terminal 600 determines whether or not the notice of intention to pay has been received (S13).
Here, server terminal 600 determines whether or not payment has been made in S9 of FIG. If the server terminal 600 has not received the notice of intention to pay the fee (N in S13
O), wait until receiving notification of intention to pay;

サーバ端末600は、料金の支払い意思通知を受信した場合(S13のYES)、支払
い処理を実行する(S14)。そして、サーバ端末600は、支払いを完了したか否かを
判定する(S15)。サーバ端末600は、支払いを完了していない場合(S15のNO
)、エラーメッセージを表示手段222に表示させる(S16)。つまり、サーバ端末6
00は、ポイント残高が不足している場合などに、エラーメッセージを処理装置201に
送信する。これにより、処理装置201の表示手段222がエラーメッセージをユーザU
に対して表示する。
When the server terminal 600 receives the notice of intention to pay the fee (YES in S13), it executes the payment process (S14). Then, the server terminal 600 determines whether or not the payment has been completed (S15). If the payment has not been completed (NO in S15), the server terminal 600
), and an error message is displayed on the display means 222 (S16). That is, the server terminal 6
00 transmits an error message to the processing device 201 when the point balance is insufficient. As a result, the display means 222 of the processing device 201 displays the error message to the user U.
display for

支払いを完了した場合(S15のYES)、サーバ端末600は、個人データを受信す
る(S17)。つまり、図6のS10で処理装置201が送信した個人データをサーバ端
末600が受信する。個人データは、識別情報とフィルタとを含んでいる。そして、サー
バ端末600は、識別情報を参照して、座席端末511にフィルタを転送する。つまり、
識別情報に対応する搭乗席の座席端末511に、フィルタを送信する(S18)。これに
より、搭乗者に応じたフィルタが、座席端末511に設定される。
If the payment has been completed (YES in S15), the server terminal 600 receives personal data (S17). That is, the server terminal 600 receives the personal data transmitted by the processing device 201 in S10 of FIG. Personal data includes identification information and filters. Then, server terminal 600 refers to the identification information and transfers the filter to seat terminal 511 . in short,
The filter is transmitted to the seat terminal 511 of the boarding seat corresponding to the identification information (S18). As a result, a filter corresponding to the passenger is set in the seat terminal 511. FIG.

搭乗者が航空機に搭乗した後に、頭外定位処理機能をオンとすると、座席端末511が
フィルタを用いて頭外定位処理を行う。つまり、座席端末511が図1の頭外定位処理装
置100として機能する。これにより、ヘッドホン43が、頭外定位処理された再生信号
を搭乗者に対して出力する。このように、搭乗者に対して測定された空間音響伝達特性、
及び外耳道伝達特性に応じたフィルタを用いて、搭乗者が頭外定位受聴を行なうことがで
きる。このようにすることで、適切なフィルタを用いて、頭外定位受聴を行うことができ
る。
When the passenger turns on the out-of-head localization processing function after boarding the aircraft, the seat terminal 511 performs out-of-head localization processing using a filter. In other words, the seat terminal 511 functions as the out-of-head localization processing device 100 in FIG. As a result, the headphone 43 outputs the reproduction signal subjected to the out-of-head localization processing to the passenger. Thus, the spatial sound transfer characteristics measured with respect to the occupant,
And, using a filter according to the ear canal transfer characteristics, the passenger can perform out-of-head stereotactic listening. By doing so, out-of-head localization listening can be performed using an appropriate filter.

よって、搭乗者は、搭乗席521に着席している間において、リラックスして、再生信
号を受聴することができるため、長時間の移動でも快適に過ごすことができる。識別情報
とフィルタが紐付いているため、乗り継ぎ後の航空機でも、搭乗者は、同様に頭外定位受
聴を楽しむことができる。さらに、フライト到着後において、生成されたフィルタを識別
情報に対応付けて、サーバ端末600に保存しておくことも可能である。このようにする
ことで、次回以降のフライト時において、搭乗者に対する測定の一部又は全部を省略する
ことができる。さらに、残存するマイルの利用を促進することができる。
Therefore, the passenger can relax and listen to the reproduced signal while sitting on the passenger seat 521, so that the passenger can spend a long time comfortably. Since the identification information and the filter are linked, the passenger can enjoy out-of-head stereophonic listening in the same way even after connecting flights. Furthermore, after flight arrival, the generated filter can be associated with the identification information and stored in the server terminal 600 . By doing so, it is possible to omit part or all of the measurement of the passengers in the next and subsequent flights. In addition, the use of remaining miles can be encouraged.

さらに、航空機に搭載されているエンターテインメントシステムにおいて、頭外定位処
理を行なうことができる。よって、搭乗者は、音楽の再生信号だけでなく、映画やゲーム
などの再生信号を頭外定位受聴することができる。
Furthermore, out-of-head localization processing can be performed in the entertainment system on board the aircraft. Therefore, the passenger can hear not only the reproduction signal of music but also the reproduction signal of movies and games out of head.

以上まとめると、本実施の形態1にかかるシステム1000は、測定装置200と、座
席端末511と、サーバ端末600とを備えている。測定装置200は、ユーザUが乗り
物に搭乗する前に、ユーザの耳に装着されたマイクを用いて、伝達特性を測定する。座席
端末511は、乗り物に設置され、伝達特性に応じたフィルタを用いて頭外定位処理を行
う頭外定位処理装置である。サーバ端末は、ユーザの識別情報に基づいて、伝達特性に応
じたフィルタを、座席端末511に送信する。これにより、搭乗者(ユーザU)に対して
適切に頭外定位処理を行うことができる。
In summary, the system 1000 according to the first embodiment includes the measuring device 200, the seat terminal 511, and the server terminal 600. The measuring device 200 measures transfer characteristics using a microphone attached to the user's ear before the user U gets on the vehicle. The seat terminal 511 is an out-of-head localization processing device that is installed in a vehicle and performs out-of-head localization processing using a filter according to transfer characteristics. The server terminal transmits a filter according to the transfer characteristics to the seat terminal 511 based on the user's identification information. As a result, the out-of-head localization process can be appropriately performed for the passenger (user U).

なお、上記の説明では、航空機の搭乗者が頭外定位受聴を行う例について説明したが、
搭乗者が搭乗する乗り物は、航空機に限られるものではない。先に述べた電車、バス、船
舶等の搭乗者に対して、ヘッドホン43が頭外定位処理された再生信号を出力してもよい
。電車やバス、船舶などの場合は、駅やバスターミナル、港湾の待合室などに、測定装置
200を設置しておけばよい。さらには、乗り物は、アミューズメントパークのアトラク
ション等であってもよい。この場合、頭外定位処理装置100は、実際に移動する乗り物
に限らず、その場に滞在したままの乗り物に搭載されていてもよい。
In the above description, an example of out-of-head localization listening performed by an aircraft passenger was described.
Vehicles boarded by passengers are not limited to aircraft. The headphone 43 may output a reproduced signal subjected to out-of-head localization processing to passengers on trains, buses, ships, etc., as described above. In the case of trains, buses, ships, etc., the measuring device 200 may be installed in stations, bus terminals, port waiting rooms, and the like. Furthermore, the ride may be an amusement park attraction or the like. In this case, the out-of-head localization processing device 100 may be installed in a vehicle that is not limited to a vehicle that actually moves, but a vehicle that stays in place.

頭外定位処理装置となる端末が搭乗者の識別情報と対応付けられていればよい。そして
、それぞれの搭乗者が搭乗席において、ヘッドホンやイヤホンを装着する。そして、再生
装置が搭乗席毎に設置されており、再生装置が搭乗者に適したフィルタを用いて、頭外定
位処理を行う。もちろん、一部の搭乗者については、頭外定位処理を行わなくてもよい。
さらには、複数の搭乗者に対して共通の再生信号を用いてもよい。この場合、再生信号を
再生する装置は共通となっており、頭外定位フィルタを用いた処理が、搭乗者毎に実施さ
れていればよい。また、ヘッドホン又はイヤホンは、測定環境に設置されたものに限らず
、ユーザUが持参したものでもよい。
実施の形態2.
(空間音響フィルタの生成)
また、実施の形態1では、測定装置200が、空間音響伝達特性と、外耳道伝達特性の
両方を測定するものとして説明したが、一部の測定を行うことができない場合がある。測
定環境の制限などから、頭外定位受聴を行うユーザUに対して、空間音響伝達特性Hls
、Hlo、Hro、Hrsと、左右の外耳道伝達特性ECTFL、ECTFRの全てを測
定できないことがある。特に、空間音響伝達特性の測定では、ユーザUから離れた位置に
1台又は複数台のスピーカを設置する必要がある。よって、空港等に広くて静かな測定環
境を用意できない場合がある。
It is sufficient that the terminal serving as the out-of-head localization processing device is associated with the identification information of the passenger. Then, each passenger wears headphones or earphones in the passenger seat. A playback device is installed for each passenger seat, and the playback device performs out-of-head localization processing using a filter suitable for the passenger. Of course, it is not necessary to perform out-of-head localization processing for some passengers.
Furthermore, a common reproduced signal may be used for a plurality of passengers. In this case, the apparatus for reproducing the reproduced signal is common, and the processing using the out-of-head localization filter may be performed for each passenger. Moreover, the headphones or earphones are not limited to those installed in the measurement environment, and may be those brought by the user U.
Embodiment 2.
(Generation of spatial acoustic filter)
Also, in the first embodiment, the measurement apparatus 200 measures both the spatial sound transfer characteristic and the ear canal transfer characteristic, but there are cases where part of the measurement cannot be performed. Due to limitations in the measurement environment, etc., the spatial sound transfer characteristic Hls
, Hlo, Hro, Hrs, and the left and right ear canal transfer characteristics ECTFL, ECTFR may not all be measured. In particular, in the measurement of spatial sound transfer characteristics, it is necessary to install one or more speakers at positions distant from the user U. Therefore, it may not be possible to provide a wide and quiet measurement environment at an airport or the like.

一方、外耳道伝達特性は、ヘッドホンを装着した状態で測定される。このため、外耳道
伝達特性の測定では、空間音響伝達特性の測定ほど、広くて静かな測定環境は要求されな
い。よって、搭乗者に対して、外耳道伝達特性の測定のみを行うことで、頭外定位フィル
タの全てを取得できることが好ましい。つまり、スピーカを用いた空間音響伝達特性の測
定を行わずに、搭乗者に適した空間音響フィルタを生成することが望まれる。以下、外耳
道伝達特性の測定結果から、搭乗者に適した空間音響フィルタを生成する方法について、
説明する。
On the other hand, the ear canal transfer characteristics are measured while wearing headphones. For this reason, measurement of ear canal transfer characteristics does not require a large and quiet environment as much as measurement of spatial sound transfer characteristics. Therefore, it is preferable that all of the out-of-head localization filters can be obtained by only measuring the ear canal transfer characteristics of the passenger. In other words, it is desired to generate a spatial acoustic filter suitable for a passenger without measuring spatial acoustic transfer characteristics using a speaker. The method for generating a spatial acoustic filter suitable for passengers from the measurement results of the ear canal transfer characteristics is described below.
explain.

外耳道伝達特性ECTFL、ECTFRの測定結果に基づいて、空間音響フィルタを生
成するフィルタ生成装置について、図8を用いて説明する。図8は、フィルタ生成装置9
00の構成を示すブロック図である。なお、フィルタ生成装置900は、処理装置201
と同一の装置であってもよく、異なる装置であってもよい。さらには、フィルタ生成装置
900は、物理的に単一な装置に限られるものではない。例えば、フィルタ生成装置90
0と、処理装置201とが異なる装置の場合、後述する処理の一部が処理装置201にお
いて実施されていてもよい。また、データベース901は、異なる装置に格納されていて
もよく、複数の装置に分散して格納されていてもよい。
A filter generation device that generates a spatial acoustic filter based on the measurement results of the ear canal transfer characteristics ECTFL and ECTFR will be described with reference to FIG. FIG. 8 shows the filter generation device 9
00 is a block diagram showing the configuration of FIG. It should be noted that the filter generation device 900 is the processing device 201
It may be the same device as , or it may be a different device. Furthermore, filter generation device 900 is not limited to a physically single device. For example, the filter generator 90
0 and the processing device 201 are different devices, the processing device 201 may perform part of the processing described later. Also, the database 901 may be stored in different devices, or may be distributed and stored in a plurality of devices.

フィルタ生成装置900は、データベース901と、第1の選択部902と、第1の取
得部903と、第2の選択部904と、第2の取得部905と、第3の取得部906と、
第1の調整部907と、第1の合成部908と、第2の調整部911と、第2の合成部9
12と、生成部920と、外耳道伝達特性取得部930と、を備えている。
The filter generation device 900 includes a database 901, a first selection unit 902, a first acquisition unit 903, a second selection unit 904, a second acquisition unit 905, a third acquisition unit 906,
First adjuster 907 , first combiner 908 , second adjuster 911 , and second combiner 9
12 , a generation unit 920 , and an ear canal transfer characteristic acquisition unit 930 .

外耳道伝達特性取得部930は、ユーザUの外耳道伝達特性の測定結果を取得する。な
お。フィルタ生成装置900が処理装置201と別の装置とする場合、外耳道伝達特性取
得部930は、有線通信又は無線通信により、ユーザUの外耳道伝達特性が送信されてい
る。
The ear canal transfer characteristic acquisition unit 930 acquires the measurement result of the user's U ear canal transfer characteristic. note that. When the filter generation device 900 is a device different from the processing device 201, the ear canal transfer characteristics of the user U are transmitted to the ear canal transfer characteristics acquisition unit 930 by wired communication or wireless communication.

データベース901は、複数人分の特性データを格納している。つまり、複数の被測定
者1に対して、予め、空間音響伝達特性及び外耳道伝達特性の測定が行われている。そし
て、データベース901は、複数人に対する測定結果に基づく空間音響伝達特性及び外耳
道伝達特性のデータを特性データとして格納している。具体的には、データベース901
は、第1の特性データと、第2の特性データと、を1セットとして、複数セット分のデー
タを格納している。例えば、N人(Nは2以上の整数)の被測定者1に対して、外耳道伝
達特性の測定が事前に行われている。よって、データベース901は、左耳に関してNセ
ット分の特性データを格納し、右耳に関してNセット分の特性データを格納する。
A database 901 stores characteristic data for a plurality of persons. That is, the spatial sound transfer characteristics and the ear canal transfer characteristics are measured in advance for a plurality of persons 1 to be measured. The database 901 stores data of spatial sound transfer characteristics and ear canal transfer characteristics based on measurement results for a plurality of people as characteristic data. Specifically, the database 901
stores a plurality of sets of data, with first characteristic data and second characteristic data as one set. For example, the ear canal transfer characteristics are measured in advance for N subjects 1 (N is an integer equal to or greater than 2). Therefore, the database 901 stores N sets of characteristic data for the left ear and N sets of characteristic data for the right ear.

第1の特性データは、音源となるスピーカからマイクまでの空間音響伝達特性に対応す
るデータである。第1の特性データは、例えば、空間音響伝達特性の周波数特性である。
具体的には、第1の特性データは、周波数領域の振幅特性を備えている。もちろん、第1
の特性データは、振幅特性の代わりにパワー特性を備えていてもよい。また、第1の特性
データは、空間音響伝達特性の直接音部分の周波数振幅特性を有していることが好ましい
。第1の特性データは時間領域の信号を有していてもよい。例えば、時間領域の信号は測
定装置200のマイク2L、2Rで収音された収音信号である。あるいは、時間領域の信
号は、マイク2L、2Rで収音された収音信号を所定のフィルタ長で切りだした信号であ
ってもよい。
The first characteristic data is data corresponding to spatial sound transfer characteristics from a speaker, which is a sound source, to a microphone. The first characteristic data is, for example, frequency characteristics of spatial sound transfer characteristics.
Specifically, the first characteristic data includes amplitude characteristics in the frequency domain. Of course, the first
The characteristic data of may include power characteristics instead of amplitude characteristics. Moreover, it is preferable that the first characteristic data have the frequency amplitude characteristic of the direct sound portion of the spatial sound transfer characteristic. The first characteristic data may comprise time domain signals. For example, the time domain signals are sound signals picked up by the microphones 2L and 2R of the measuring device 200. FIG. Alternatively, the time-domain signal may be a signal obtained by extracting the sound signals picked up by the microphones 2L and 2R with a predetermined filter length.

第2の特性データは、外耳道伝達特性に対応するデータである。第2の特性データは、
例えば、外耳道伝達特性の周波数特性である。具体的には、第2の特性データは、周波数
領域の振幅特性を備えている。もちろん、第2の特性データは、振幅特性の代わりにパワ
ー特性を備えていてもよい。さらには、第2の特性データは、周波数領域の位相特性を有
していてもよい。第2の特性データは時間領域の信号を有していてもよい。例えば、時間
領域の信号は測定装置200のマイク2L、2Rで収音された収音信号である。あるいは
、時間領域の信号は、マイク2L、2Rで収音された収音信号を所定のフィルタ長で切り
だした信号であってもよい。
The second characteristic data is data corresponding to the ear canal transfer characteristic. The second characteristic data are
For example, it is the frequency characteristic of the ear canal transfer characteristic. Specifically, the second characteristic data includes amplitude characteristics in the frequency domain. Of course, the second characteristic data may have power characteristics instead of amplitude characteristics. Furthermore, the second characteristic data may have phase characteristics in the frequency domain. The second characteristic data may comprise time domain signals. For example, the time domain signals are sound signals picked up by the microphones 2L and 2R of the measuring device 200 . Alternatively, the time-domain signal may be a signal obtained by extracting the sound signals picked up by the microphones 2L and 2R with a predetermined filter length.

処理装置201又はフィルタ生成装置900等が、時間領域の収音信号に対して、離散
フーリエ変換や離散コサイン変換などを施すことで、周波数振幅特性等が求められる。ま
た、収音信号を所定のフィルタ長で切り出すことで得られたフィルタに対して、離散フー
リエ変換や離散コサイン変換などを施すことで、周波数振幅特性を求めてもよい。あるい
は、データベース901は、第1の特性データ、及び第2の特性データとして、時間領域
の収音信号やフィルタを記憶しており、フィルタ生成処理を行う毎に高速フーリエ変換(
FFT)等を行うことで、周波数振幅特性を求めてもよい。
The processing device 201, the filter generation device 900, or the like applies discrete Fourier transform, discrete cosine transform, or the like to the collected sound signal in the time domain, thereby obtaining the frequency amplitude characteristics and the like. Further, the frequency-amplitude characteristic may be obtained by performing discrete Fourier transform, discrete cosine transform, or the like on a filter obtained by cutting out the picked-up sound signal with a predetermined filter length. Alternatively, the database 901 stores time-domain picked-up signals and filters as the first characteristic data and the second characteristic data, and fast Fourier transform (
FFT) or the like may be performed to obtain the frequency-amplitude characteristic.

データベース901に格納された第1及び第2の特性データについて、図9を用いて説
明する。1人目(1セット目)の被測定者1について、空間音響伝達特性Hls、Hlo
、Hro、Hrsに関するデータをそれぞれ第1の特性データHls_DB1、Hlo_
DB1、Hro_DB1、Hrs_DB1とする。N人目等についても、それぞれ第1の
特性データHls_DBN、Hlo_DBN、Hro_DBN、Hrs_DBN等と称す
る。データベース901に格納されたN人分の第1の特性データHls_DB1~Hls
_DBNをまとめて、第1の特性データHls_DBと称する。同様に、第1の特性デー
タHlo_DB1~Hlo_DBN、Hro_DB1~Hro_DBN、Hrs_DB1
~Hrs_DBNについても、同様に、N人分のデータをまとめて、第1の特性データH
lo_DB、Hro_DB、Hrs_DBと称する。
The first and second characteristic data stored in database 901 will be described with reference to FIG. Spatial sound transfer characteristics Hls, Hlo for the first person (first set) subject 1
, Hro and Hrs as first characteristic data Hls_DB1 and Hlo_
Let DB1, Hro_DB1, and Hrs_DB1. The N-th person is also referred to as the first characteristic data Hls_DBN, Hlo_DBN, Hro_DBN, Hrs_DBN, etc., respectively. First characteristic data Hls_DB1 to Hls for N persons stored in database 901
_DBN are collectively referred to as first characteristic data Hls_DB. Similarly, first characteristic data Hlo_DB1 to Hlo_DBN, Hro_DB1 to Hro_DBN, Hrs_DB1
~Hrs_DBN, similarly, the data for N persons are put together to obtain the first characteristic data H
They are referred to as lo_DB, Hro_DB, and Hrs_DB.

1人目の被測定者1について、外耳道伝達特性ECTFL、ECTFRに関するデータ
をそれぞれ第2の特性データECTFL_DB1、ECTFR_DB1とする。N人目等
の被測定者1についても、外耳道伝達特性ECTFL、ECTFRに関するデータを第2
の特性データECTFL_DBN、ECTFR_DBN等と称する。また、データベース
901に格納されたN人分の第2の特性データECTFL_DB1~ECTFL_DBN
をまとめて、第2の特性データECTFL_DBと称する。N人分の第2の特性データE
CTFR_DB1~ECTFR_DBNをまとめて、第2の特性データECTFR_DB
と称する。
For the first person to be measured 1, the data on the ear canal transfer characteristics ECTFL and ECTFR are assumed to be second characteristic data ECTFL_DB1 and ECTFR_DB1, respectively. Data on the ear canal transfer characteristics ECTFL and ECTFR for the person 1 to be measured such as the N-th person are also sent to the second
characteristic data ECTFL_DBN, ECTFR_DBN, and the like. In addition, the second characteristic data ECTFL_DB1 to ECTFL_DBN for N persons stored in the database 901
are collectively referred to as second characteristic data ECTFL_DB. Second characteristic data E for N people
CTFR_DB1 to ECTFR_DBN are put together to form second characteristic data ECTFR_DB
called.

データベース901は、1人目の被測定者1の左耳に関する第1の特性データHls_
DB1、Hro_DB1と、第2の特性データECTFL_DB1を1セットにして記憶
する。同様に、データベース901は、N人目の被測定者1の左耳に関する第1の特性デ
ータHls_DBN、Hro_DBNと、第2の特性データECTFL_DBNとを、1
セットとして記憶する。また、データベース901は、1人目の被測定者1の右耳に関す
る第1の特性データHlo_DB1、Hrs_DB1と、第2の特性データECTFR_
DB1を1セットにして記憶する。データベース901は、N人目の被測定者1の右耳に
関する第1の特性データHlo_DBN、Hrs_DBNと、第2の特性データECTF
R_DBNとを1セットとして記憶する。
The database 901 stores the first characteristic data Hls_
DB1, Hro_DB1, and second characteristic data ECTFL_DB1 are stored as one set. Similarly, the database 901 stores the first characteristic data Hls_DBN, Hro_DBN and the second characteristic data ECTFL_DBN regarding the left ear of the N-th subject 1 as 1
Store as a set. The database 901 also stores first characteristic data Hlo_DB1 and Hrs_DB1 related to the right ear of the first subject 1, and second characteristic data ECTFR_
Store DB1 as one set. The database 901 stores first characteristic data Hlo_DBN, Hrs_DBN and second characteristic data ECTF regarding the right ear of the N-th person 1 to be measured.
and R_DBN are stored as one set.

したがって、1セットは、少なくとも3つの周波数振幅特性を備えている。データベー
ス901は、同じ被測定者1であっても異なる耳の特性データは異なるセットとして格納
する。もちろん、スピーカのチャネル数に応じて、1セットに含まれる第1の特性データ
の数が変化する。また、データベース901は、第1及び第2の特性データを識別情報に
対応付けて記憶してもよい。
A set therefore comprises at least three frequency-amplitude characteristics. The database 901 stores different ear characteristic data for the same subject 1 as different sets. Of course, the number of first characteristic data included in one set changes according to the number of speaker channels. Also, the database 901 may store the first and second characteristic data in association with the identification information.

さらに、第1の特性データHls_DB、Hlo_DB、Hro_DB、Hrs_DB
は、それぞれ2種類の周波数振幅特性を備えていることが好ましい。例えば、第1の特性
データHls_DB1は、直接音部分の周波数振幅特性と、直接音部分及び反射音部分の
周波数振幅特性を有していることが好ましい。直接音部分及び反射音部分の周波数振幅特
性は、直接音と反射音とを含む時間領域の収音信号をFFTすることで求めることができ
る。直接音部分の周波数振幅特性は、反射音を含まずに直接音のみを含む時間領域の収音
信号をFFTすることで求めることができる。なお、直接音は、音源(スピーカ)から直
接耳(マイク)に到達する音であり、反射音は、音源から壁面などで反射して、耳に到達
する音である。反射音は、直接音の後にマイクに到達する。他の第1の特性データHlo
_DB1、Hro_DB1、Hrs_DB1等についても同様とする。
Further, first characteristic data Hls_DB, Hlo_DB, Hro_DB, Hrs_DB
preferably have two types of frequency-amplitude characteristics. For example, the first characteristic data Hls_DB1 preferably has frequency amplitude characteristics of the direct sound portion and frequency amplitude characteristics of the direct sound portion and the reflected sound portion. The frequency-amplitude characteristics of the direct sound portion and the reflected sound portion can be obtained by performing FFT on the collected sound signal in the time domain including the direct sound and the reflected sound. The frequency-amplitude characteristics of the direct sound portion can be obtained by performing FFT on the collected sound signal in the time domain that contains only the direct sound and does not contain the reflected sound. The direct sound is the sound that reaches the ear (microphone) directly from the sound source (speaker), and the reflected sound is the sound that reaches the ear after being reflected from the sound source by a wall or the like. Reflected sound reaches the microphone after the direct sound. Other first characteristic data Hlo
The same applies to _DB1, Hro_DB1, Hrs_DB1, and the like.

例えば、図10のように、空間音響伝達特性の測定で、0~4095サンプルの収音信
号を収音している場合について説明する。この場合、0~4095サンプルの収音信号の
全体をフーリエ変換することで直接音及び反射音の周波数振幅特性が得られる。0~40
95サンプルの収音信号から0~X(Xは1以上の整数)サンプルの直接音信号(図10
の点線部分)を切り出して、切り出した直接音信号をフーリエ変換することで、直接音の
周波数振幅特性が得られる。
For example, as shown in FIG. 10, a case where 0 to 4095 samples of sound signals are collected in the measurement of spatial sound transfer characteristics will be described. In this case, the frequency amplitude characteristics of the direct sound and the reflected sound can be obtained by Fourier transforming the entire collected sound signal of 0 to 4095 samples. 0-40
A direct sound signal of 0 to X (X is an integer of 1 or more) samples from the 95 samples of the collected sound signal (Fig. 10
) is cut out, and the cut-out direct sound signal is Fourier-transformed to obtain the frequency-amplitude characteristics of the direct sound.

このように、データベース901において、第1の特性データHls_DB1は、直接
音の周波数振幅特性と、直接音及び反射音の周波数振幅特性とをそれぞれ含んでいること
が好ましい。同様に、第1の特性データHlo_DB1、Hro_DB1、Hrs_DB
1は、直接音部分の周波数振幅特性と、直接音及び反射音部分の周波数振幅特性とをそれ
ぞれ含んでいることが好ましい。もちろん、2~N人目についても同様とする。
Thus, in the database 901, the first characteristic data Hls_DB1 preferably includes the frequency-amplitude characteristic of the direct sound and the frequency-amplitude characteristics of the direct sound and the reflected sound. Similarly, the first characteristic data Hlo_DB1, Hro_DB1, Hrs_DB
1 preferably includes the frequency-amplitude characteristics of the direct sound portion and the frequency-amplitude characteristics of the direct and reflected sound portions, respectively. Of course, the same applies to the 2nd to Nth persons.

図2で示した測定装置200は、頭外定位受聴を行うユーザUに対して外耳道伝達特性
ECTFL、ECTFRを測定する。ユーザUに対する測定結果が外耳道伝達特性取得部
930に入力される。以下、搭乗者となるユーザUに対して測定された外耳道伝達特性E
CTFL、ECTFRを外耳道伝達特性ECTFL_U、外耳道伝達特性ECTFR_U
とする。
The measuring device 200 shown in FIG. 2 measures the external auditory canal transfer characteristics ECTFL and ECTFR for a user U who performs out-of-head stereotactic listening. A measurement result for the user U is input to the ear canal transfer characteristic acquisition unit 930 . Hereinafter, the ear canal transfer characteristics E measured for the user U who is a passenger
CTFL and ECTFR are defined as ear canal transfer characteristics ECTFL_U and ear canal transfer characteristics ECTFR_U.
and

フィルタ生成装置900は、外耳道伝達特性ECTFL_Uに対して、フィルタ生成処
理を行う。これにより、フィルタ生成装置900は、ユーザUの左耳に対する空間音響伝
達特性Hls、Hroに関するフィルタ(以下、フィルタF_Hls_U、F_Hro_
Uと称する)をそれぞれ生成する。つまり、フィルタ生成装置900は、外耳道伝達特性
ECTFL_Uに基づいて、2つのフィルタF_Hls_U及びフィルタF_Hro_U
を生成する。このとき、フィルタ生成装置900は、複数の被測定者1の左耳に関するセ
ットのみを参照してもよく、両耳に関するセットを参照してもよい。
The filter generation device 900 performs filter generation processing on the ear canal transfer characteristic ECTFL_U. As a result, the filter generation device 900 generates filters related to the spatial acoustic transfer characteristics Hls and Hro for the left ear of the user U (hereinafter referred to as filters F_Hls_U and F_Hro_
U) respectively. That is, the filter generation device 900 generates two filters F_Hls_U and F_Hro_U based on the ear canal transfer characteristic ECTFL_U.
to generate At this time, the filter generation device 900 may refer to only the set relating to the left ears of the plurality of subjects 1, or may refer to the set relating to both ears.

同様に、フィルタ生成装置900は、外耳道伝達特性ECTFR_Uに対して、フィル
タ生成処理を行う。これにより、フィルタ生成装置900は、ユーザUの右耳に対する空
間音響伝達特性Hlo、Hrsに関するフィルタ(以下、フィルタF_Hlo_U、F_
Hrs_Uと称する)をそれぞれ生成する。つまり、フィルタ生成装置900は、外耳道
伝達特性ECTFR_Uに基づいて、2つのフィルタF_Hlo_U、F_Hrs_Uを
生成する。このとき、フィルタ生成装置900は、複数の被測定者1の右耳に関するセッ
トのみを参照してもよく、両耳に関するセットを参照してもよい。
Similarly, the filter generation device 900 performs filter generation processing on the ear canal transfer characteristic ECTFR_U. As a result, the filter generation device 900 generates filters related to the spatial acoustic transfer characteristics Hlo and Hrs for the right ear of the user U (hereinafter referred to as filters F_Hlo_U, F_
Hrs_U) respectively. That is, the filter generating device 900 generates two filters F_Hlo_U and F_Hrs_U based on the ear canal transfer characteristic ECTFR_U. At this time, the filter generation device 900 may refer to only the set related to the right ear of the plurality of subjects 1, or may refer to the set related to both ears.

なお、フィルタF_Hls_U、F_Hro_Uの処理と、フィルタF_Hlo_U、
F_Hrs_Uの処理は同様である。よって、以下の説明では、外耳道伝達特性ECTF
L_Uに基づいて、フィルタF_Hls_U、F_Hro_Uを生成する処理について説
明する。
Note that the processing of filters F_Hls_U and F_Hro_U and the processing of filters F_Hlo_U and
The processing of F_Hrs_U is similar. Therefore, in the following description, the ear canal transfer characteristic ECTF
Processing for generating filters F_Hls_U and F_Hro_U based on L_U will be described.

第1の選択部902は、データベース901を参照することで、外耳道伝達特性ECT
FL_Uに基づいて、第1のセットを選択する。例えば、第1の選択部902は、第1の
周波数帯域(例えば、1kHz~4kHz)において、外耳道伝達特性ECTFL_Uの
周波数振幅特性を、第2の特性データECTFL_DBと比較する。具体的には、第1の
選択部902は、第2の特性データECTFL_DB1~ECTFL_DBNのそれぞれ
について、外耳道伝達特性ECTFL_Uとの相関値を算出する。第1の選択部902は
、第1の周波数帯域における周波数振幅特性の相関値を求める。そして、第1の選択部9
02は、最も相関値が大きい第2の特性データECTFL_DBk(kは1以上N以下の
任意の整数)を含むセットを選択する。第1の選択部902が選択したセットを第1のセ
ットとする。
The first selection unit 902 refers to the database 901 to select the ear canal transfer characteristics ECT.
Based on FL_U, select the first set. For example, the first selection unit 902 compares the frequency amplitude characteristic of the ear canal transfer characteristic ECTFL_U with the second characteristic data ECTFL_DB in a first frequency band (eg, 1 kHz to 4 kHz). Specifically, the first selection unit 902 calculates a correlation value between each of the second characteristic data ECTFL_DB1 to ECTFL_DBN and the ear canal transfer characteristic ECTFL_U. First selection section 902 obtains the correlation value of the frequency-amplitude characteristic in the first frequency band. And the first selection unit 9
02 selects a set including the second characteristic data ECTFL_DBk (k is an arbitrary integer from 1 to N) having the largest correlation value. The set selected by the first selection unit 902 is referred to as the first set.

第1の取得部903は、データベース901から、第1のセットに含まれる第1の特性
データHls_DBk、Hro_DBkを取得する。第1の取得部903は、直接音部分
の周波数振幅特性を第1の合成部908に出力し、直接音及び反射音部分の周波数振幅特
性を第1の調整部907に出力する。
A first acquisition unit 903 acquires first characteristic data Hls_DBk and Hro_DBk included in the first set from the database 901 . First acquisition section 903 outputs the frequency amplitude characteristics of the direct sound portion to first synthesizing section 908 , and outputs the frequency amplitude characteristics of the direct sound and reflected sound portions to first adjustment section 907 .

第2の選択部904は、データベース901を参照することで、外耳道伝達特性ECT
FL_Uに基づいて、第2のセットを選択する。例えば、第2の選択部904は、第2の
周波数帯域(例えば、4kHz~15kHz)において、外耳道伝達特性ECTFL_U
の周波数振幅特性を、第2の特性データECTFL_DBと比較する。第2の選択部90
4は、第2の特性ECTFL_DB1~ECTFL_DB1のそれぞれについて、外耳道
伝達特性ECTFL_Uとの相関値を算出する。第2の選択部904は、第2の周波数帯
域における周波数振幅特性の相関値を求める。そして、第2の選択部904は、最も相関
値が大きい第2の特性データECTFL_DBm(mは1以上N以下の整数)を含むセッ
トを選択する。第2の選択部904が選択したセットを第2のセットとする。
A second selection unit 904 refers to the database 901 to select the ear canal transfer characteristics ECT.
Select the second set based on FL_U. For example, the second selection unit 904 selects the ear canal transfer characteristic ECTFL_U in the second frequency band (eg, 4 kHz to 15 kHz).
is compared with the second characteristic data ECTFL_DB. Second selection unit 90
4 calculates a correlation value between each of the second characteristics ECTFL_DB1 to ECTFL_DB1 and the ear canal transfer characteristic ECTFL_U. Second selection section 904 obtains the correlation value of the frequency-amplitude characteristic in the second frequency band. Then, second selection section 904 selects a set including second characteristic data ECTFL_DBm (m is an integer equal to or greater than 1 and equal to or less than N) having the largest correlation value. The set selected by the second selection unit 904 is referred to as the second set.

第2の取得部905は、データベース901から、第2のセットに含まれる第1の特性
データHls_DBm、Hro_DBmを取得する。第2の取得部905は、直接音部分
の周波数振幅特性を第1の合成部908に出力し、直接音及び反射音部分の周波数振幅特
性を第1の調整部907に出力する。
A second acquisition unit 905 acquires the first characteristic data Hls_DBm and Hro_DBm included in the second set from the database 901 . The second acquisition unit 905 outputs the frequency amplitude characteristics of the direct sound portion to the first synthesizing unit 908 and outputs the frequency amplitude characteristics of the direct sound and reflected sound portions to the first adjustment unit 907 .

第1の調整部907は、第1の特性データHls_DBk、Hro_DBkと、第1の
特性データHls_DBm、Hro_DBmとの振幅レベルを調整するためのゲイン値を
求める。例えば、調整用周波数帯域(200Hz~1kHz)において、第1の特性デー
タHls_DBkと第1の特性データHls_DBmとの間で振幅のレベルが等しくなる
ようなゲイン値を第1の調整部907が求める。そして、一方、または両方の第1の特性
データにゲイン値を乗じることで、第1の特性データの振幅レベルを上下させることがで
きる。具体的には、調整用周波数帯域における離散的な振幅の総和が等しくなるように、
振幅特性にゲイン値(係数)を乗じることで、振幅レベルが調整される。
A first adjustment unit 907 obtains gain values for adjusting the amplitude levels of the first characteristic data Hls_DBk, Hro_DBk and the first characteristic data Hls_DBm, Hro_DBm. For example, in the frequency band for adjustment (200 Hz to 1 kHz), the first adjuster 907 obtains a gain value that makes the amplitude level equal between the first characteristic data Hls_DBk and the first characteristic data Hls_DBm. By multiplying one or both of the first characteristic data by a gain value, the amplitude level of the first characteristic data can be increased or decreased. Specifically, so that the sum of discrete amplitudes in the adjustment frequency band is equal,
The amplitude level is adjusted by multiplying the amplitude characteristic by the gain value (coefficient).

具体的には、調整用周波数帯域において、第1の特性データHls_DBkの振幅レベ
ルが第1の特性データHls_DBmの振幅レベルよりも高い場合、第1の調整部907
は、第1の特性データHls_DBkの振幅レベルを下げるためのゲイン値を求める。あ
るいは、第1の特性データHls_DBkの振幅レベルが第1の特性データHls_DB
mの振幅レベルよりも高い場合、第1の調整部907は、第1の特性データHls_DB
mの振幅レベルを上げるためのゲイン値を求める。もちろん、第1の調整部907は、両
方の振幅レベルが所定の範囲に含まれるように、2つのゲイン値を算出してもよい。この
場合、第1の特性データHls_DBm、第1の特性データHls_DBkのそれぞれに
ゲイン値が乗じられる。なお、第1の調整部907は、第1の特性データHls_DBk
、Hro_DBkについて、ゲイン値を共通としてもよく、それぞれに異なるゲイン値を
求めてもよい。
Specifically, in the adjustment frequency band, when the amplitude level of the first characteristic data Hls_DBk is higher than the amplitude level of the first characteristic data Hls_DBm, the first adjusting section 907
obtains a gain value for lowering the amplitude level of the first characteristic data Hls_DBk. Alternatively, the amplitude level of the first characteristic data Hls_DBk is the first characteristic data Hls_DB
m amplitude level, the first adjustment unit 907 adjusts the first characteristic data Hls_DB
Find a gain value to increase the amplitude level of m. Of course, the first adjusting section 907 may calculate two gain values so that both amplitude levels are within a predetermined range. In this case, each of the first characteristic data Hls_DBm and the first characteristic data Hls_DBk is multiplied by the gain value. Note that the first adjustment unit 907 uses the first characteristic data Hls_DBk
, Hro_DBk may have a common gain value, or different gain values may be obtained for each.

上記のように、第1の特性データは、複数の被測定者1に対して行われた測定結果によ
るものである。それぞれの測定において、スピーカの音量やマイク感度が同じとなってい
るとは限らない。さらには、測定環境が異なっていたり、異なるスピーカやマイクが使用
されていたりすることもある。したがって、第1の調整部907は、異なるセットの第1
の特性データの振幅レベルを調整する。例えば、第1の調整部907は2つの周波数振幅
特性のバランスを調整するためのゲイン値を算出する。これにより、異なるセットの第1
の特性データの振幅レベルのバランスを調整することができる。ここでは、直接音及び反
射音の周波数振幅特性において、ゲイン値を算出している。
As described above, the first characteristic data are based on the results of measurements performed on a plurality of subjects 1 . In each measurement, the loudspeaker volume and microphone sensitivity are not always the same. Furthermore, the measurement environment may differ, or different speakers and microphones may be used. Therefore, the first adjuster 907 may select different sets of first
Adjust the amplitude level of the characteristic data. For example, the first adjuster 907 calculates a gain value for adjusting the balance between the two frequency amplitude characteristics. This allows the first
The amplitude level balance of the characteristic data can be adjusted. Here, the gain value is calculated for the frequency amplitude characteristics of the direct sound and the reflected sound.

そして、第1の調整部907は、振幅レベルを調整するためのゲイン値を第1の合成部
908に出力する。第1の合成部908は、第1の特性データにゲイン値を乗じて、レベ
ル調整を行った後、第1の特性データHls_DBkと、第1の特性データHls_DB
mとを合成する。第1の合成部908は、第1の特性データにゲイン値を乗じて、レベル
調整を行った後、第1の特性データHro_DBkと、第1の特性データHro_DBm
とを合成する。
First adjusting section 907 then outputs a gain value for adjusting the amplitude level to first synthesizing section 908 . The first synthesizing unit 908 multiplies the first characteristic data by the gain value to perform level adjustment, and then combines the first characteristic data Hls_DBk and the first characteristic data Hls_DB.
Composite with m. The first synthesizing unit 908 multiplies the first characteristic data by the gain value, adjusts the level, and then combines the first characteristic data Hro_DBk and the first characteristic data Hro_DBm.
Synthesize with

ここでは、第1の合成部908は、直接音を合成する。すなわち、合成する第1の特性
データHls_DBk、Hro_DBk及び第1の特性データHls_DBm、Hro_
DBmは、直接音の周波数振幅特性となっている。第1の合成部908は、第1の周波数
帯域(1kHz~4kHz)における第1の特性データHls_DBmの振幅値を第1の
特性データHls_DBkの振幅値に置き換える。第1の合成部908は、第1の周波数
帯域における第1の特性データHro_DBmの振幅値を第1の特性データHro_DB
kの振幅値に置き換える。第1の合成部908は、置換後の周波数振幅特性を第1の合成
データHls_com1、Hro_com1として、第2の調整部911に出力する。
Here, the first synthesizing unit 908 synthesizes the direct sound. That is, the first characteristic data Hls_DBk, Hro_DBk and the first characteristic data Hls_DBm, Hro_
DBm is the frequency amplitude characteristic of the direct sound. The first synthesizing unit 908 replaces the amplitude value of the first characteristic data Hls_DBm in the first frequency band (1 kHz to 4 kHz) with the amplitude value of the first characteristic data Hls_DBk. First synthesizing section 908 converts the amplitude value of first characteristic data Hro_DBm in the first frequency band into first characteristic data Hro_DB
Replace with the amplitude value of k. First synthesizing section 908 outputs the frequency-amplitude characteristic after replacement to second adjusting section 911 as first synthesized data Hls_com1 and Hro_com1.

第1の合成データHls_com1、Hro_com1において、第1の周波数帯域の
振幅値は、第1の特性データHls_DBk、Hro_DBkに基づくものとなっており
、第1の周波数帯域以外の振幅値は、第2の特性データHls_DBm、Hro_DBm
に基づくものとなっている。あるいは、第1の合成データHls_com1、Hro_c
om1において、第2の周波数帯域の振幅値は、第1の特性データHls_DBm、Hr
o_DBmに基づくものとし、第2の周波数帯域以外の振幅値は、第1の特性データHl
s_DBk、Hro_DBkに基づくものとするようにしてもよい。第1の合成部908
は、第1の特性データHls_DBm、Hro_DBmと第1の特性データHls_DB
k、Hro_DBkのバランスを取りながら、すなわち、調整用周波数帯域のレベルが所
定の範囲に含まれるように周波数振幅特性を合成してもよい。
In the first synthesized data Hls_com1 and Hro_com1, the amplitude values of the first frequency band are based on the first characteristic data Hls_DBk and Hro_DBk, and the amplitude values of other than the first frequency band are the second Characteristic data Hls_DBm, Hro_DBm
It is based on Alternatively, the first combined data Hls_com1, Hro_c
In om1, the amplitude value of the second frequency band is the first characteristic data Hls_DBm, Hr
o_DBm, and amplitude values other than the second frequency band are based on the first characteristic data Hl
It may be based on s_DBk and Hro_DBk. First combiner 908
are the first characteristic data Hls_DBm, Hro_DBm and the first characteristic data Hls_DB
The frequency-amplitude characteristics may be synthesized while balancing k and Hro_DBk, that is, so that the level of the adjustment frequency band is included in a predetermined range.

第3の取得部906は、データベース901を参照して、予め設定された第1の特性デ
ータHls_DBps、Hro_DBps(以下、プリセットデータHls_DBps、
Hro_DBpsとする)を取得する。プリセットデータHls_DBps、Hro_D
Bpsは、第1の特性データHls_DB、Hro_DBのうちの、代表的な1人分(1
セット分)のデータである。
The third acquisition unit 906 refers to the database 901 and obtains preset first characteristic data Hls_DBps, Hro_DBps (hereinafter referred to as preset data Hls_DBps,
Hro_DBps). Preset data Hls_DBps, Hro_D
Bps is a representative one-person (1
set).

ここで、プリセットデータHls_DBps、Hro_DBpsは、左右の位相特性や
振幅レベルのバランスが取れている被測定者1の第1の特性データであることが好ましい
。つまり、プリセットデータHls_DBps、Hlo_DBps、Hro_DBps、
Hrs_DBpsは同一の被測定者1の第1の特性データとなる。さらに、1kHz以下
の周波数振幅特性に大きなディップがない第1の特性データがプリセットデータとして設
定されていることが好ましい。また、100kHzの4つの空間音響伝達特性Hls、H
lo、Hro、Hrsにおいて、100kHz以下の周波数振幅特性が揃っている被測定
者1の第1の特性データをプリセットデータとすることが好ましい。プリセットデータは
、システムの管理者等により予め設定されている。
Here, the preset data Hls_DBps and Hro_DBps are preferably the first characteristic data of the subject 1 in which the left and right phase characteristics and amplitude levels are balanced. That is, the preset data Hls_DBps, Hlo_DBps, Hro_DBps,
Hrs_DBps is the first characteristic data of the same subject 1 . Furthermore, it is preferable that the first characteristic data having no large dip in the frequency amplitude characteristic of 1 kHz or less is set as the preset data. In addition, the four spatial acoustic transfer characteristics Hls at 100 kHz, H
In lo, Hro, and Hrs, it is preferable to use the first characteristic data of the person to be measured 1 having uniform frequency amplitude characteristics of 100 kHz or less as the preset data. The preset data is set in advance by a system administrator or the like.

さらに、プリセットデータの候補を複数セット分用意して、外耳道伝達特性ECTFL
_Uに基づいて、1セット分のプリセットデータを選択してもよい。この場合、プリセッ
トデータの候補となる複数セットの中で、外耳道伝達特性ECTFL_Uとの相関値が最
も高くなる第2の特性データを有する1セットを選択してもよい。
Furthermore, multiple sets of preset data candidates are prepared, and the ear canal transfer characteristic ECTFL
One set of preset data may be selected based on _U. In this case, one set having the second characteristic data having the highest correlation value with the ear canal transfer characteristic ECTFL_U may be selected from among the multiple sets as preset data candidates.

第3の取得部906は、プリセットデータHls_DBps、Hro_DBpsを取得
して、第2の合成部912、及び第2の調整部911に出力する。プリセットデータHl
s_DBps、Hro_DBpsは直接音部分の周波数振幅特性であるが、直接音及び反
射音部分の周波数振幅特性となっていてもよい。
The third acquisition unit 906 acquires the preset data Hls_DBps and Hro_DBps and outputs them to the second synthesis unit 912 and the second adjustment unit 911 . Preset data Hl
s_DBps and Hro_DBps are frequency amplitude characteristics of the direct sound portion, but may be frequency amplitude characteristics of the direct sound and reflected sound portions.

第1の合成データHls_com1、Hro_com1と第1のプリセットデータHl
s_DBps、Hro_DBpsの振幅レベルを調整するためのゲイン値を算出する。第
2の調整部911は、第1の調整部907と同様に、調整用周波数帯域(200Hz~1
kHz)において、第1の合成データHls_com1とプリセットデータHls_DB
psとの間で振幅のレベルが等しくなるようなゲイン値を第2の調整部911が求める。
そして、ゲイン値が第1の合成データ及び第1のプリセットデータの少なくとも一方に乗
じられることで、振幅レベルが調整される。第2の調整部911は、第1の調整部907
と同様の処理を行うため、説明を省略する。
First combined data Hls_com1, Hro_com1 and first preset data Hl
Gain values for adjusting the amplitude levels of s_DBps and Hro_DBps are calculated. Similar to the first adjustment unit 907, the second adjustment unit 911 adjusts the adjustment frequency band (200 Hz to 1
kHz), the first combined data Hls_com1 and the preset data Hls_DB
The second adjuster 911 obtains a gain value that makes the amplitude level equal to ps.
Then, the amplitude level is adjusted by multiplying at least one of the first synthesized data and the first preset data by the gain value. The second adjuster 911 adjusts the first adjuster 907
Since the same processing as is performed, the description is omitted.

第2の調整部911は、ゲイン値を第2の合成部912に出力する。第2の合成部91
2は、ゲイン値を用いてレベル調整を行った後、第1の合成データHls_com1と、
プリセットデータHls_DBpsとを合成する。第2の合成部912は、ゲイン値を用
いてレベル調整を行った後、第1の合成データHro_com1と、プリセットデータH
ro_DBpsとを合成する。これにより、第2の合成データHro_com2、Hro
_com2が生成される。
Second adjusting section 911 outputs the gain value to second synthesizing section 912 . Second synthesizing unit 91
2 is the first combined data Hls_com1 after performing level adjustment using the gain value;
Synthesize with preset data Hls_DBps. After performing level adjustment using the gain value, the second combining unit 912 combines the first combined data Hro_com1 and the preset data H
ro_DBps. As a result, the second combined data Hro_com2, Hro
_com2 is generated.

第2の合成部912は、直接音を合成する。すなわち、第1の合成データHls_co
m1、Hro_com1及びプリセットデータHls_DBps、Hro_DBpsは、
直接音の周波数振幅特性となっている。第2の合成部912は、第3の周波数帯域(最低
周波数~1kHz)における第1の合成データHls_com1の振幅値をプリセットデ
ータHls_DBpsの振幅値に置き換える。第2の合成部912は、第3の周波数帯域
(最低周波数~1kHz)における第1の合成データHro_com1の振幅値をプリセ
ットデータHro_DBpsの振幅値に置き換える。なお、最低周波数はFFTで得られ
る周波数特性における最も低い周波数であり、例えば、1Hzとなる。
A second synthesizing unit 912 synthesizes the direct sound. That is, the first combined data Hls_co
m1, Hro_com1 and preset data Hls_DBps, Hro_DBps are
It is the frequency amplitude characteristic of the direct sound. The second synthesizing unit 912 replaces the amplitude value of the first synthesized data Hls_com1 in the third frequency band (lowest frequency to 1 kHz) with the amplitude value of the preset data Hls_DBps. The second combining unit 912 replaces the amplitude value of the first combined data Hro_com1 in the third frequency band (lowest frequency to 1 kHz) with the amplitude value of the preset data Hro_DBps. The lowest frequency is the lowest frequency in frequency characteristics obtained by FFT, and is 1 Hz, for example.

第2の合成データHls_com2、Hro_com2において、第3の周波数帯域(
最低周波数~1kHz)の振幅値は、プリセットデータHls_DBps、Hro_DB
psに基づくものとなっている。第2の合成データHls_com2、Hro_com2
において、第1の周波数帯域(1kHz~4kHz)の振幅値は、第1の特性データHl
s_DBk、Hro_DBkに基づくものとなっている。第2の合成データHls_co
m2、Hro_com2において、第2の周波数帯域(4kHz~15kHz)の振幅値
は、第2の特性データHls_DBm、Hro_DBmに基づくものとなっている。なお
、第1の周波数帯域、第2の周波数帯域、及び第3の周波数帯域以外の第4の周波数帯域
(15kHz~最高周波数)の振幅値は、第2の特性データHls_DBm、Hro_D
Bmに基づくものとすることができるが、プリセットデータHls_DBps、Hro_
DBpsに基づくものとしてもよい。最高周波数はFFTで得られる周波数特性における
最も高い周波数である。ここで、FFTのフレームサイズをframe_sizeとする
と、最も高い周波数は、(FS/frame_size)*(frame_size/2-
1)で求めることができる。また、各周波数帯域における振幅レベルは第1の調整部90
7、又は第2の調整部911で求めたゲイン値で調整されている。よって、適切に周波数
振幅特性を合成することができる。
In the second synthesized data Hls_com2, Hro_com2, the third frequency band (
(minimum frequency to 1 kHz) are preset data Hls_DBps, Hro_DB
It is based on ps. Second synthetic data Hls_com2, Hro_com2
, the amplitude value of the first frequency band (1 kHz to 4 kHz) is the first characteristic data Hl
It is based on s_DBk and Hro_DBk. Second synthetic data Hls_co
In m2 and Hro_com2, the amplitude values of the second frequency band (4 kHz to 15 kHz) are based on the second characteristic data Hls_DBm and Hro_DBm. The amplitude value of the fourth frequency band (15 kHz to highest frequency) other than the first frequency band, the second frequency band, and the third frequency band is the second characteristic data Hls_DBm, Hro_D
Bm, but preset data Hls_DBps, Hro_
It may be based on DBps. The highest frequency is the highest frequency in frequency characteristics obtained by FFT. Here, if the FFT frame size is frame_size, the highest frequency is (FS/frame_size)*(frame_size/2-
1). Also, the amplitude level in each frequency band is adjusted by the first adjusting section 90
7 or the gain value obtained by the second adjustment unit 911 . Therefore, it is possible to appropriately synthesize frequency-amplitude characteristics.

第2の合成部912は、第2の合成データHls_com2、Hro_com2は生成
部920に出力する。生成部920は、第2の合成データHls_com2、Hro_c
om2に基づいて、フィルタF_Hls_U、F_Hro_Uを生成する。例えば、生成
部920は、第2の合成データHls_com2、Hro_com2を、それぞれ逆フー
リエ変換等することで、時間領域における第2の合成データHls_com2_Time
、Hro_com2_Timeを算出する。なお、逆フーリエ変換において用いられる位
相特性は、第2のセットのものとすることができるが、プリセットデータのものであって
もよい。
The second synthesizer 912 outputs the second synthesized data Hls_com2 and Hro_com2 to the generator 920 . The generation unit 920 generates the second combined data Hls_com2, Hro_c
Based on om2, generate filters F_Hls_U, F_Hro_U. For example, the generating unit 920 performs an inverse Fourier transform on the second combined data Hls_com2 and Hro_com2, respectively, to obtain the second combined data Hls_com2_Time in the time domain.
, Hro_com2_Time. It should be noted that the phase characteristics used in the inverse Fourier transform may be those of the second set, but may also be those of the preset data.

これにより、生成部920は、フィルタF_Hls_U、F_Hro_Uの直接音部分
を求めることができる。そして、生成部920は、第2の合成データHls_com2_
TimeにプリセットデータHls_DBpsを合成する。また、生成部920は、第2
の合成データHro_com2_Timeに、プリセットデータHro_DBpsの反射
音部分を合成する。例えば、フィルタF_Hls_U、F_Hro_Uの直接音部分(つ
まり、0~Xサンプル)は、第2の合成データHls_com2_Time、Hro_c
om2_Timeとなっている。反射音部分((X+1)~4095サンプル)は、時間
領域のプリセットデータHls_DBps、Hro_DBpsの反射音部分((X+1)
~4095サンプル)を切り出したものとなっている。なお、フィルタF_Hls_U、
F_Hro_Uの反射音部分は、プリセットデータHls_DBps、Hro_DBps
のものとするが、第2のセットのものとなっていてもよい。なお、プリセットデータにつ
いては、データベース901が、予め時間領域の第1の特性データを格納しておくことが
好ましい。
Thereby, the generator 920 can obtain the direct sound portion of the filters F_Hls_U and F_Hro_U. Then, the generation unit 920 generates the second synthesized data Hls_com2_
Preset data Hls_DBps is combined with Time. In addition, the generating unit 920 generates the second
The reflected sound portion of the preset data Hro_DBps is synthesized with the synthesized data Hro_com2_Time of the above. For example, the direct sound portion (i.e., 0-X samples) of filters F_Hls_U, F_Hro_U is the second synthesized data Hls_com2_Time, Hro_c
om2_Time. The reflected sound portion ((X+1) to 4095 samples) is the reflected sound portion ((X+1)
~ 4095 samples). Note that the filters F_Hls_U,
The reflected sound portion of F_Hro_U is the preset data Hls_DBps, Hro_DBps
but may be of the second set. As for the preset data, it is preferable that the database 901 stores the first characteristic data in the time domain in advance.

上記の処理により、フィルタ生成装置900が、フィルタF_Hls_U、F_Hro
_Uを生成することができる。また、同様の処理によって、フィルタ生成装置900は、
フィルタF_Hlo_U、F_Hrs_Uを生成する。これにより、ユーザUが外耳道伝
達特性のみしか測定できない場合であっても、ユーザUに適したフィルタF_Hls_U
、F_Hlo_U、F_Hro_U、F_Hrs_Uを生成することができる。
Through the above processing, the filter generation device 900 generates the filters F_Hls_U, F_Hro
_U can be generated. Further, through similar processing, the filter generation device 900
Generate filters F_Hlo_U, F_Hrs_U. As a result, even if the user U can only measure the ear canal transfer characteristic, the filter F_Hls_U suitable for the user U
, F_Hlo_U, F_Hro_U, F_Hrs_U can be generated.

なお、上記説明における第1~第3の周波数帯域の上限周波数及び下限周波数、信号の
サンプル数、最高周波数、最低周波数の値は、例示的な値であり、特に限定されるもので
はない。また、第1の合成部908と第2の合成部912との処理順は特に限定されるも
のではない。例えば、プリセットデータと第2のセットの第1の特性データとを合成した
後に、第1のセットの第1の特性データを合成してもよい。あるいは、プリセットデータ
と第2のセットの第1の特性データと第1のセットの第1の特性データとをまとめて合成
してもよい。また、周波数領域における振幅値の代わりにパワー値を用いてもよい。
Note that the values of the upper limit frequency and lower limit frequency of the first to third frequency bands, the number of signal samples, the highest frequency, and the lowest frequency in the above description are exemplary values, and are not particularly limited. Also, the processing order of the first synthesizing unit 908 and the second synthesizing unit 912 is not particularly limited. For example, the first set of first characteristic data may be synthesized after the preset data and the second set of first characteristic data are synthesized. Alternatively, the preset data, the second set of first characteristic data, and the first set of first characteristic data may be combined together. Also, power values may be used instead of amplitude values in the frequency domain.

なお、実施の形態2では、頭外定位受聴を行うユーザは、航空機などの乗り物の搭乗者
に限られるものではない。つまり、スマートホンやタブレット端末などのユーザが所有す
るユーザ端末において、頭外定位処理を行う場合に、実施の形態2の処理を適用すること
ができる。従って、識別情報は不要となる。
In the second embodiment, users who perform out-of-head localized listening are not limited to passengers in vehicles such as airplanes. In other words, the process of the second embodiment can be applied to a user terminal such as a smart phone or a tablet terminal owned by the user, when the out-of-head localization process is performed. Therefore, no identification information is required.

以上まとめると、実施の形態2に係るフィルタ生成装置900は、外耳道伝達特性取得
部930と、第1の選択部902と、第1の取得部903と、第2の選択部904と、第
2の取得部905と、第3の取得部906と、生成部920と、を備えている。外耳道伝
達特性取得部930は、ユーザが装着したヘッドホン又はイヤホンからマイクまでの外耳
道伝達特性を取得する。第1の選択部902は、スピーカからマイクまでの空間音響伝達
特性に対応する第1の特性データと、外耳道伝達特性に対応する第2の特性データとを1
セットとして、複数セット分を格納するデータベース901を参照することで、ユーザの
外耳道伝達特性の第1の周波数帯域における周波数特性に基づいて、第1のセットを選択
する。第1の取得部903は、第1の選択部で選択された第1のセットに含まれる第2の
特性データを取得する。第2の選択部904は、データベース901を参照することで、
ユーザの外耳道伝達特性の第2の周波数帯域における周波数特性に基づいて、第2のセッ
トを選択する。第2の取得部905は、第2の選択部903で選択された第2のセットに
含まれる第2の特性データを取得する。第3の選択部906は、予め設定されたプリセッ
トデータを取得する。生成部920は、第1のセットの第2の特性データと、第2のセッ
トの第2の特性データと、プリセットデータとに基づいて、ユーザの空間音響伝達特性に
応じたフィルタを生成する。これにより、適切な処理を行うことができるフィルタを生成
することができる。
実施の形態3.
実施の形態3では、5.1chの再生信号を用いて、頭外定位処理を行っている。5.
1chの場合、6個のスピーカがある。つまり、測定装置200の測定環境には、センタ
ースピーカ(正面スピーカ)、右前方スピーカ、左前方スピーカ、右後方スピーカ、左後
方スピーカ、低音サブウーファースピーカが配置されている。従って、図2に示した測定
装置200に、センタースピーカ、左後方スピーカ、右後方スピーカ、サブウーファース
ピーカが追加されている。センタースピーカは、被測定者1の正面前方に配置される。セ
ンタースピーカは、例えば、左前方スピーカと右前方スピーカとの間に配置される。
In summary, the filter generation device 900 according to Embodiment 2 includes an ear canal transfer characteristic acquisition unit 930, a first selection unit 902, a first acquisition unit 903, a second selection unit 904, a second acquisition unit 905 , a third acquisition unit 906 , and a generation unit 920 . The ear canal transfer characteristic acquisition unit 930 acquires the ear canal transfer characteristic from the headphone or earphone worn by the user to the microphone. A first selection unit 902 selects the first characteristic data corresponding to the spatial sound transfer characteristic from the speaker to the microphone and the second characteristic data corresponding to the ear canal transfer characteristic.
By referring to the database 901 that stores a plurality of sets as sets, the first set is selected based on the frequency characteristics in the first frequency band of the ear canal transfer characteristics of the user. A first acquisition unit 903 acquires second characteristic data included in the first set selected by the first selection unit. The second selection unit 904 refers to the database 901 to
A second set is selected based on frequency characteristics in a second frequency band of the user's ear canal transfer characteristics. A second acquisition unit 905 acquires second characteristic data included in the second set selected by the second selection unit 903 . A third selection unit 906 acquires preset data set in advance. Based on the first set of second characteristic data, the second set of second characteristic data, and the preset data, the generation unit 920 generates a filter according to the spatial sound transfer characteristic of the user. This makes it possible to generate a filter capable of performing appropriate processing.
Embodiment 3.
In the third embodiment, out-of-head localization processing is performed using a 5.1ch reproduced signal. 5.
In the case of 1ch, there are 6 speakers. That is, a center speaker (front speaker), a right front speaker, a left front speaker, a right rear speaker, a left rear speaker, and a bass subwoofer speaker are arranged in the measurement environment of the measurement apparatus 200 . Therefore, a center speaker, a left rear speaker, a right rear speaker, and a subwoofer speaker are added to the measurement apparatus 200 shown in FIG. A center speaker is arranged in front of the person 1 to be measured. The center speaker is arranged, for example, between the left front speaker and the right front speaker.

左前方スピーカから左耳、及び右耳までの空間音響伝達特性を、実施の形態1と同様に
Hls、Hloとする。右前方スピーカから左耳、及び右耳までの空間音響伝達特性を、
実施の形態1と同様にHro、Hrsとする。センタースピーカから左耳及び右耳までの
空間音響伝達特性をCHl、CHrとする。左後方スピーカから左耳及び右耳までの空間
音響伝達特性をSHls、SHloとする。右後方スピーカから左耳、及び右耳までの空
間音響伝達特性を、SHro、SHrsとする。低音出力用のサブウーファースピーカか
ら左耳及び右耳までの空間音響伝達特性をSWHl、SWHrとする。
Let Hls and Hlo be the spatial sound transfer characteristics from the left front speaker to the left ear and the right ear, as in the first embodiment. Spatial sound transfer characteristics from the right front speaker to the left and right ears are
Let Hro and Hrs be the same as in the first embodiment. Let CHl and CHr be the spatial sound transfer characteristics from the center speaker to the left and right ears. Let SHls and SHlo be the spatial sound transfer characteristics from the left rear speaker to the left and right ears. Let SHro and SHrs be the spatial sound transfer characteristics from the right rear speaker to the left and right ears. Let SWHl and SWHr be the spatial sound transfer characteristics from the subwoofer speaker for bass output to the left and right ears.

従って、空間音響伝特性Hls、Hlo、CHl、CHr、Hro、Hrs、SHls
、SHlo、SHro、SHrs、SWHl、SWHrに対応する12個のフィルタを用
いて、畳み込み演算処理が実施される。空間音響伝特性Hls、Hlo、CHl、CHr
、Hro、Hrs、SHls、SHlo、SHro、SHrs、SWHl、SWHrに対
応するフィルタを、F_Hls、F_Hlo、F_CHl、F_CHr、F_Hro、F
_Hrs、F_SHls、F_SHlo、F_SHro、F_SHrs、F_SWHl、
F_SWHrとする。
Therefore, the spatial acoustic transfer characteristics Hls, Hlo, CHl, CHr, Hro, Hrs, SHls
, SHlo, SHro, SHrs, SWHl, and SWHr are used to perform the convolution operation. Spatial Acoustic Transfer Hls, Hlo, CHl, CHr
, Hro, Hrs, SHls, SHlo, SHro, SHrs, SWHl, SWHr corresponding to F_Hls, F_Hlo, F_CHl, F_CHr, F_Hro, F
_Hrs, F_SHls, F_SHlo, F_SHro, F_SHrs, F_SWHl,
F_SWHr.

図11は、本実施の形態にかかる処理装置700の構成を示すブロック図である。処理
装置700は、図2に示す処理装置201に対応するものであり、フィルタを生成する。
さらに、処理装置700は、図1で示したような頭外定位処理を行うものである。ここで
は、処理装置700は、12個のフィルタF_Hls、F_Hlo、F_CHl、F_C
Hr、F_Hro、F_Hrs、F_SHls、F_SHlo、F_SHro、F_SH
rs、F_SWHl、F_SWHrを用いて、畳み込み演算処理を行う。もちろん、実施
の形態1のシステムのように、フィルタを生成する装置と、頭外定位処理を行う装置が異
なる装置となっていてもよい
処理装置700は、音源ファイル701と、測定手段702と、フィルタ生成手段70
3と、畳み込み手段704と、再生手段705と、送受信手段706と、メモリ707と
、センタch用残響除去手段708と、センタch用音量可変手段709と、を備えてい
る。さらに、処理装置700には、セリフ音量制御手段711が接続されている。
FIG. 11 is a block diagram showing the configuration of a processing device 700 according to this embodiment. The processing device 700 corresponds to the processing device 201 shown in FIG. 2 and generates a filter.
Further, the processing device 700 performs out-of-head localization processing as shown in FIG. Here, the processing unit 700 includes 12 filters F_Hls, F_Hlo, F_CHl, F_C
Hr, F_Hro, F_Hrs, F_SHls, F_SHlo, F_SHro, F_SH
rs, F_SWHl, and F_SWHr are used to perform convolution operation processing. Of course, as in the system of Embodiment 1, the device that generates the filter and the device that performs the out-of-head localization processing may be different devices. Filter generating means 70
3, convolution means 704, reproduction means 705, transmission/reception means 706, memory 707, center channel dereverberation means 708, and center channel volume varying means 709. Further, the processing device 700 is connected with dialogue volume control means 711 .

測定手段702は、空間音響伝達特性を測定する。測定手段702は、6個のスピーカ
に対して、それぞれインパルス測定を行う。具体的には、図2に示した測定信号生成部2
11のように、各スピーカにインパルス音を出力する。さらに、測定手段702は、収音
信号取得部212のように、マイク2L、2Rからの収音信号を取得する。
Measuring means 702 measures spatial sound transfer characteristics. The measurement means 702 performs impulse measurement for each of the six speakers. Specifically, the measurement signal generator 2 shown in FIG.
Like 11, an impulse sound is output to each speaker. Furthermore, the measurement means 702 acquires sound signals from the microphones 2L and 2R, like the sound signal acquisition unit 212 .

フィルタ生成手段703は、フィルタ生成部213と同様に、収音信号に基づいて、フ
ィルタを生成する。ここでは、6個のスピーカ及び2個のマイクを用いて測定が行われて
いるため、12個のフィルタが生成される。メモリ707は、12個のフィルタを格納す
る。なお、送受信手段706は、例えば、図3で示したサーバ端末600にフィルタを送
信してもよい。これにより、データベースにフィルタが格納される。
Similar to the filter generation unit 213, the filter generation unit 703 generates a filter based on the collected sound signal. Here, 12 filters are generated because the measurements are made with 6 loudspeakers and 2 microphones. Memory 707 stores 12 filters. Note that the transmitting/receiving means 706 may transmit the filter to the server terminal 600 shown in FIG. 3, for example. This will store the filter in the database.

5.1chの再生信号を再生している場合、ユーザUがセリフ音量を個別に調整するこ
とができるようになっている。つまり、セリフの音声信号を出力するセンタースピーカの
音量のみが独立して調整可能になっている。セリフ音量制御手段711は、ユーザUから
の入力を受け付けて、セリフ音量(センタchの音量)を制御する。例えば、セリフ音量
制御手段711は、音量調整用のボタンやレバーを表示させる。そして、頭外定位受聴結
果に応じて、ユーザUが、セリフ音量を上げたり、下げたりする。セリフ音量制御手段7
11は、セリフ音量を示す音量信号をセンタch用音量可変手段709に出力する。セン
タch用音量可変手段709は可変増幅器を有しており、入力に応じて増幅率を可変する
。音量信号は、例えば音量の大きさを示すVolの数値または音量の増幅率を用いてもよ
い。
When reproducing a 5.1ch reproduction signal, the user U can individually adjust the dialogue volume. In other words, only the volume of the center speaker that outputs the audio signal of the dialogue can be adjusted independently. The dialogue volume control means 711 receives an input from the user U and controls the dialogue volume (the volume of the center channel). For example, the dialogue volume control means 711 displays buttons and levers for volume adjustment. Then, the user U raises or lowers the dialogue volume according to the out-of-head localization listening result. Dialogue volume control means 7
11 outputs a volume signal indicating the dialogue volume to the center channel volume varying means 709 . The center channel volume varying means 709 has a variable amplifier and varies the amplification factor according to the input. For the volume signal, for example, a numerical value of Vol indicating the magnitude of the volume or an amplification factor of the volume may be used.

センタch用残響除去手段708は、音量信号に基づいて、センタchの残響を削除す
るための処理を行う。ここでは、センタch用残響除去手段708は、センタchのフィ
ルタF_CHl、F_CHrに対して窓掛けを行う。窓掛け後のフィルタをF_WCHl
、F_WCHrとする。
Center channel dereverberation means 708 performs processing for deleting center channel reverberation based on the volume signal. Here, the center channel dereverberation unit 708 performs windowing on the center channel filters F_CHl and F_CHr. The filter after windowing is F_WCHl
, F_WCHr.

例えば、センタchの音量が閾値以上の場合、センタch用残響除去手段708は、フ
ィルタF_CHl、F_CHrの後半部分のデータをゼロにする窓関数を用いて窓掛けを
行う。このようにすることでノイズを減少することができ、自然な響きを得ることができ
る。また、所定時間までは一定であり、所定時間後、徐々に減少するような窓関数をセン
タch用残響除去手段708が用いてもよい。窓掛け後のフィルタF_WCHl、F_W
CHrを用いることで、セリフ部分の残響を抑制することができる。また、音量が閾値未
満の場合、窓掛けを行わなくてもよいが、便宜上矩形窓を用いて窓掛けを行ったものとす
る。
For example, when the sound volume of the center channel is equal to or higher than the threshold, the center channel dereverberation unit 708 performs windowing using a window function that zeroes the data in the latter half of the filters F_CHl and F_CHr. By doing so, noise can be reduced and natural sound can be obtained. Further, the center channel dereverberation means 708 may use a window function that is constant until a predetermined time and gradually decreases after the predetermined time. Filter F_WCHl, F_W after windowing
By using CHr, it is possible to suppress the reverberation of the dialogue portion. Also, if the sound volume is less than the threshold, windowing may not be performed, but for the sake of convenience, it is assumed that windowing is performed using a rectangular window.

さらに、セリフ音量に応じて、窓関数を変化させるようにしてもよい。セリフ音量が大
きくなるにつれて、窓の長さが長くなるような窓関数を用いることが可能である。或いは
、セリフ音量が大きくなるにつれて、窓の長さが短くなるような窓関数を用いることも可
能である。
Furthermore, the window function may be changed according to the speech volume. It is possible to use a window function such that the length of the window increases as the volume of the dialogue increases. Alternatively, it is possible to use a window function in which the length of the window becomes shorter as the speech volume increases.

音源ファイル701には、5.1chの再生信号が格納されている。5.1chの再生
信号は、畳み込み手段704に入力される。畳み込み手段704は、6個の再生信号に対
して、12個のフィルタを用いて畳み込み演算処理を行う。
A sound source file 701 stores a 5.1ch reproduction signal. The 5.1ch reproduced signal is input to convolution means 704 . Convolution means 704 performs convolution arithmetic processing on the six reproduced signals using 12 filters.

畳み込み手段704は、フィルタF_Hls、F_Hlo、F_WCHl、F_WCH
r、F_Hro、F_Hrs、F_SHls、F_SHlo、F_SHro、F_SHr
s、F_SWHl、F_SWHrを用いて、畳み込み演算を行う。図12は、5.1ch
の再生信号の場合の畳み込み演算とセリフ音量調整を説明するための図である。
The convolution means 704 includes filters F_Hls, F_Hlo, F_WCHl, F_WCH
r, F_Hro, F_Hrs, F_SHls, F_SHlo, F_SHro, F_SHr
A convolution operation is performed using s, F_SWHl, and F_SWHr. FIG. 12 shows the 5.1ch
FIG. 10 is a diagram for explaining the convolution operation and dialogue volume adjustment in the case of the reproduction signal of .

左前方chの再生信号をL(t)、センタchの再生信号をC(t)、右前方chの再
生信号をR(t)とする。左後方chの再生信号をSL(t)、右後方チャネルの再生信
号をSR(t)、サブウーファーchの再生信号をLFE(t)とする。そして、それぞ
れの再生信号には、対応するフィルタを畳み込む。例えば、センタchの再生信号C(t
)には、フィルタF_WCHl、F_WCHrがそれぞれ畳み込まれている。
Let L(t) be the reproduction signal of the left front channel, C(t) be the reproduction signal of the center channel, and R(t) be the reproduction signal of the right front channel. Let SL(t) be the reproduced signal of the left rear channel, SR(t) be the reproduced signal of the right rear channel, and LFE(t) be the reproduced signal of the subwoofer channel. Then, each reproduced signal is convoluted with a corresponding filter. For example, the reproduction signal C(t
) are convoluted with filters F_WCHl and F_WCHr, respectively.

そして、加算器24は、フィルタF_Hls、F_WCHl、F_Hro、F_SHl
s、F_SHro、F_SWHlが畳み込まれた6つの畳み込み信号を加算して、加算信
号HRl(t)を生成する。加算器24は、加算信号HRl(t)をフィルタ部41(図
1参照)に出力する。加算器25は、フィルタF_Hlo、F_WCHr、F_Hrs、
F_SHlo、F_SHrs、F_SWHrが畳み込まれた畳み込み信号を加算して、加
算信号HRr(t)を生成する。加算器25は、加算信号HRr(t)をフィルタ部42
(図1参照)に出力する。再生手段705は、加算信号HRl(t)、HRr(t)にそ
れぞれ逆フィルタLinv,Rinvを畳み込む。そして、逆フィルタが畳み込まれた加
算信号HRl(t)、HRr(t)がヘッドホン43から出力される。
Adder 24 then adds filters F_Hls, F_WCHl, F_Hro, F_SHl
The six convolved signals with s, F_SHro, and F_SWHl are summed to generate summed signal HRl(t). The adder 24 outputs the addition signal HRl(t) to the filter section 41 (see FIG. 1). Adder 25 adds filters F_Hlo, F_WCHr, F_Hrs,
The convolved signals with F_SHlo, F_SHrs, and F_SWHr are added to generate summed signal HRr(t). The adder 25 passes the addition signal HRr(t) to the filter section 42
(See FIG. 1). The reproducing means 705 convolves the summed signals HRl(t) and HRr(t) with the inverse filters Linv and Rinv, respectively. Then, the added signals HRl(t) and HRr(t) convoluted with the inverse filters are output from the headphone 43 .

ここで、フィルタF_WCHl、F_WCHrが畳み込まれた畳み込み信号は、可変増
幅器721を介して、加算器24、25に入力されている。セリフ音量制御手段711は
、入力された音量に応じて、可変増幅器721の振幅増幅率を変化させる。これにより、
センタchによるセリフ音量をユーザUの好みに応じて調整することができる。よって、
頭外定位処理をより適切に行うことができる。
実施の形態4.
実施の形態4では、頭外定位受聴において、頭外定位処理装置100がユーザをよりリ
ラックスさせるための処理を行っている。例えば、頭外定位処理装置100がフィルタの
ダイナミックレンジを圧縮したり、再生信号の供給方法を変更したりすることで、BGM
(Back-Ground Music)のように聴こえる様な処理を行っている。
例1.
例1では、フィルタの高周波数帯域を圧縮することで、フィルタが生成されている。具
体的には、フィルタ生成装置が、測定した空間音響伝達特性のそれぞれに対して、ローパ
スフィルタ(LPF)をかけている。例えば、2kHzをカットオフ周波数とするLPF
をかけた例を図13に示す。図13には、フィルタF_HlsにLPFをかける処理前後
の音圧レベルを示している。LPFをかけたフィルタを用いて頭外定位処理を行うことで
、ユーザUはよりリラックスすることができる。
例2.
例2では、フィルタ生成装置が、各フィルタにおいて、直接音の振幅を変えたものを残
響成分として付加している。具体的には、フィルタ生成装置が、測定された伝達特性の直
接音信号を切り出し、直接音信号の振幅を変えた信号を残響成分として、直接音信号の後
に付加することでフィルタが生成されている。図14は、図10に示した収音信号に対し
て、残響成分を付加した後のフィルタF_Hlsを示すものである。図10では、7個の
残響成分D1~D7が追加されている。それぞれの残響成分は、直接音信号の振幅を個別
に調整したものである。なお、追加する残響成分の数は、特に限定されるものではない。
このようなフィルタを用いて頭外定位処理を行うことで、ユーザUはよりリラックスする
ことができる。
Here, convoluted signals obtained by convoluting the filters F_WCH1 and F_WCHr are input to the adders 24 and 25 via the variable amplifier 721 . The dialogue volume control means 711 changes the amplitude amplification factor of the variable amplifier 721 according to the input volume. This will
The speech volume by the center channel can be adjusted according to user U's preference. Therefore,
Out-of-head localization processing can be performed more appropriately.
Embodiment 4.
In Embodiment 4, the out-of-head localization processing apparatus 100 performs processing to make the user more relaxed in out-of-head localization listening. For example, the out-of-head localization processing device 100 compresses the dynamic range of the filter or changes the method of supplying the reproduced signal, thereby
(Back-Ground Music).
Example 1.
In example 1, the filter is generated by compressing the high frequency band of the filter. Specifically, the filter generator applies a low-pass filter (LPF) to each of the measured spatial acoustic transfer characteristics. For example, an LPF with a cutoff frequency of 2 kHz
is shown in FIG. FIG. 13 shows the sound pressure levels before and after applying the LPF to the filter F_Hls. By performing the out-of-head localization process using the LPF-applied filter, the user U can be more relaxed.
Example 2.
In Example 2, the filter generation device adds a reverberation component obtained by changing the amplitude of the direct sound in each filter. Specifically, the filter generation device cuts out the direct sound signal with the measured transfer characteristics, and adds a signal obtained by changing the amplitude of the direct sound signal as a reverberation component after the direct sound signal to generate the filter. there is FIG. 14 shows the filter F_Hls after adding the reverberation component to the collected sound signal shown in FIG. In FIG. 10, seven reverberation components D1-D7 are added. Each reverberation component is a separate adjustment of the amplitude of the direct sound signal. Note that the number of reverberation components to be added is not particularly limited.
By performing out-of-head localization processing using such a filter, the user U can be more relaxed.

上記処理のうちの一部又は全部は、コンピュータプログラムによって実行されてもよい
。上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-t
ransitory computer readable medium)を用いて格
納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様
々なタイプの実体のある記録媒体(tangible storage medium)
を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルデ
ィスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディス
ク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、
半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)
、EPROM(Erasable PROM)、フラッシュROM、RAM(Rando
m Access Memory))を含む。また、プログラムは、様々なタイプの一時
的なコンピュータ可読媒体(transitory computer readabl
e medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可
読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は
、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュ
ータに供給できる。
A part or all of the above processes may be executed by a computer program. The programs described above may be stored on various types of non-transitory computer-readable media (non-t
stored using a random computer readable medium) and delivered to a computer. Non-transitory computer readable media include various types of tangible storage media.
including. Examples of non-transitory computer-readable media include magnetic recording media (eg, flexible discs, magnetic tapes, hard disk drives), magneto-optical recording media (eg, magneto-optical discs), CD-ROMs (Read Only Memory), CD-Rs, CD-R/W,
Semiconductor memory (e.g., mask ROM, PROM (Programmable ROM)
, EPROM (Erasable PROM), Flash ROM, RAM (Rando
m Access Memory)). Programs may also be stored on various types of transitory computer readable media.
e medium) to the computer. Examples of transitory computer-readable media include electrical signals, optical signals, and electromagnetic waves. Transitory computer-readable media can deliver the program to the computer via wired channels, such as wires and optical fibers, or wireless channels.

以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発
明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能
であることは言うまでもない。
The invention made by the present inventor has been specifically described above based on the embodiments, but the present invention is not limited to the above embodiments, and various modifications can be made without departing from the scope of the invention. Needless to say.

U ユーザ
1 被測定者
10 頭外定位処理部
11 畳み込み演算部
12 畳み込み演算部
21 畳み込み演算部
22 畳み込み演算部
24 加算器
25 加算器
41 フィルタ部
42 フィルタ部
43 ヘッドホン
200 測定装置
201 処理装置
211 測定信号生成部
212 収音信号取得部
213 フィルタ生成部
511 座席端末
521 搭乗席
U User 1 Subject 10 Out-of-Head Localization Processor 11 Convolution Calculator 12 Convolution Calculator 21 Convolution Calculator 22 Convolution Calculator 24 Adder 25 Adder 41 Filter 42 Filter 43 Headphone 200 Measurement Device 201 Processing Device 211 Measurement Signal generation unit 212 Collected sound signal acquisition unit 213 Filter generation unit 511 Seat terminal 521 Boarding seat

Claims (5)

ユーザが座席に着席する前に、前記ユーザの耳に装着されたマイクを用いて、伝達特性を測定する測定装置と、
前記伝達特性に応じたフィルタを用いて頭外定位処理を行う頭外定位処理装置と、
前記ユーザの識別情報に基づいて、前記伝達特性に応じたフィルタを、前記頭外定位処理装置に送信するサーバと、を備えた頭外定位処理システム。
A measuring device that measures transfer characteristics using a microphone attached to the ear of the user before the user sits on the seat;
an out-of-head localization processing device that performs out-of-head localization processing using a filter according to the transfer characteristics;
an out-of-head localization processing system, comprising: a server that transmits a filter corresponding to the transfer characteristics to the out-of-head localization processing device based on the identification information of the user.
複数の前記座席と複数の頭外定位処理装置とが対応付けて設置されており、
前記サーバは前記識別情報を参照して、前記ユーザの座席を特定し、特定した前記座席に対応する前記頭外定位処理装置に、前記フィルタを送信する請求項1に記載の頭外定位処理システム。
a plurality of seats and a plurality of out-of-head stereotactic processing devices are installed in association with each other;
2. The out-of-head localization processing system according to claim 1, wherein the server identifies the seat of the user by referring to the identification information, and transmits the filter to the out-of-head localization processing device corresponding to the identified seat. .
前記ユーザが試聴を行った後に、前記ユーザによる支払いを受け付ける請求項1、又は2に記載の頭外定位処理システム。 3. The out-of-head localization processing system according to claim 1, wherein payment by the user is accepted after the user performs trial listening. 前記ユーザが装着したヘッドホン又はイヤホンから前記マイクまでの外耳道伝達特性を測定し、
スピーカから前記マイクまでの空間音響伝達特性に対応する第1の特性データと、前記外耳道伝達特性に対応する第2の特性データとを1セットとして、複数セット分を格納するデータベースを参照することで、前記ユーザの前記外耳道伝達特性に基づいて、前記ユーザの前記空間音響伝達特性に応じたフィルタを取得する請求項1~3のいずれか1項に記載の頭外定位処理システム。
measuring the ear canal transfer characteristics from the headphones or earphones worn by the user to the microphone;
By referring to a database that stores a plurality of sets of first characteristic data corresponding to spatial sound transfer characteristics from a speaker to the microphone and second characteristic data corresponding to the ear canal transfer characteristics as one set. 4. The out-of-head localization processing system according to any one of claims 1 to 3, wherein a filter corresponding to said spatial sound transfer characteristics of said user is acquired based on said ear canal transfer characteristics of said user.
ユーザが座席に着席する前に、前記ユーザの耳に装着されたマイクを用いて、伝達特性をするステップと、
前記ユーザの識別情報に基づいて、前記座席に設置された頭外定位処理装置に前記伝達特性に応じたフィルタを送信するステップと、
前記頭外定位処理装置が、再生信号に対して前記フィルタを用いた頭外定位処理を行うステップと、
前記識別情報に対応する前記ユーザに対して、前記頭外定位処理された再生信号をヘッドホン又はイヤホンから出力するステップと、を含む頭外定位処理方法。
before the user is seated in the seat, using a microphone worn in the user's ear to perform a transfer characteristic;
a step of transmitting a filter corresponding to the transfer characteristic to an out-of-head localization processing device installed in the seat based on the identification information of the user;
a step in which the out-of-head localization processing device performs out-of-head localization processing on the reproduced signal using the filter;
and outputting the reproduced signal after the out-of-head localization processing from headphones or earphones to the user corresponding to the identification information.
JP2021194105A 2018-09-28 2021-11-30 Out-of-head localization system and out-of-head localization method Active JP7188545B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021194105A JP7188545B2 (en) 2018-09-28 2021-11-30 Out-of-head localization system and out-of-head localization method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018183579A JP6988758B2 (en) 2018-09-28 2018-09-28 Out-of-head localization processing system, filter generator, method, and program
JP2021194105A JP7188545B2 (en) 2018-09-28 2021-11-30 Out-of-head localization system and out-of-head localization method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2018183579A Division JP6988758B2 (en) 2018-09-28 2018-09-28 Out-of-head localization processing system, filter generator, method, and program

Publications (2)

Publication Number Publication Date
JP2022024154A JP2022024154A (en) 2022-02-08
JP7188545B2 true JP7188545B2 (en) 2022-12-13

Family

ID=87888694

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021194105A Active JP7188545B2 (en) 2018-09-28 2021-11-30 Out-of-head localization system and out-of-head localization method

Country Status (1)

Country Link
JP (1) JP7188545B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001285998A (en) 2000-03-29 2001-10-12 Oki Electric Ind Co Ltd Out-of-head sound image localization device
US20100241256A1 (en) 2006-05-20 2010-09-23 Personics Holdings Inc. Method of modifying audio content
JP2017028525A (en) 2015-07-23 2017-02-02 株式会社Jvcケンウッド Out-of-head localization processing apparatus, out-of-head localization processing method, and program
JP2017060040A (en) 2015-09-17 2017-03-23 株式会社Jvcケンウッド Out-of-head localization processing apparatus and out-of-head localization processing method
JP2018050222A (en) 2016-09-23 2018-03-29 株式会社Jvcケンウッド Filter generation device, filter generation method, and program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001285998A (en) 2000-03-29 2001-10-12 Oki Electric Ind Co Ltd Out-of-head sound image localization device
US20100241256A1 (en) 2006-05-20 2010-09-23 Personics Holdings Inc. Method of modifying audio content
JP2017028525A (en) 2015-07-23 2017-02-02 株式会社Jvcケンウッド Out-of-head localization processing apparatus, out-of-head localization processing method, and program
JP2017060040A (en) 2015-09-17 2017-03-23 株式会社Jvcケンウッド Out-of-head localization processing apparatus and out-of-head localization processing method
WO2017046984A1 (en) 2015-09-17 2017-03-23 株式会社Jvcケンウッド Out-of-head localization processing apparatus and out-of-head localization processing method
JP2018050222A (en) 2016-09-23 2018-03-29 株式会社Jvcケンウッド Filter generation device, filter generation method, and program

Also Published As

Publication number Publication date
JP2022024154A (en) 2022-02-08

Similar Documents

Publication Publication Date Title
JP4921470B2 (en) Method and apparatus for generating and processing parameters representing head related transfer functions
US10706869B2 (en) Active monitoring headphone and a binaural method for the same
CN107925814B (en) Method and apparatus for generating an enhanced sound impression
KR102810592B1 (en) System and method for processing audio between multiple audio spaces
US10757522B2 (en) Active monitoring headphone and a method for calibrating the same
CN101416235A (en) Apparatus and method for processing data
US11438721B2 (en) Out-of-head localization system, filter generation device, method, and program
US10555108B2 (en) Filter generation device, method for generating filter, and program
US10582325B2 (en) Active monitoring headphone and a method for regularizing the inversion of the same
CN109155896A (en) System and method for improving audio virtualization
US10142760B1 (en) Audio processing mechanism with personalized frequency response filter and personalized head-related transfer function (HRTF)
JP2021036661A (en) Autonomous audio system for seat headrest, seat headrest, and associated vehicle
CN116405837A (en) A virtual surround method and system for converting stereo sound to multi-channel sound
CN109923877A (en) Apparatus and method for weighting stereo audio signals
JP7188545B2 (en) Out-of-head localization system and out-of-head localization method
WO2023183745A1 (en) Audio crosstalk cancellation and stereo widening
TWI855354B (en) Apparatus and method for supplying sound in a space
US20250380107A1 (en) System for determining customized audio
CN119856514A (en) Real sense sound audio output device for intercom communication

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221114

R150 Certificate of patent or registration of utility model

Ref document number: 7188545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150