JP7679367B2

JP7679367B2 - クラウドバイトストリームアライメント方式

Info

Publication number: JP7679367B2
Application number: JP2022523594A
Authority: JP
Inventors: クリスティアンチス，; ティモシーレイモンドバンゴーテム，; ジャビルカナスヴァラピルモイダニー，
Original assignee: ハーマンインターナショナルインダストリーズインコーポレイテッド
Priority date: 2019-12-26
Filing date: 2020-12-23
Publication date: 2025-05-19
Anticipated expiration: 2040-12-23
Also published as: US12114023B2; KR20220119000A; CN114747197A; EP4082179A4; WO2021133865A1; EP4082179A1; JP2023508627A; US20220353554A1; KR102927845B1

Description

本開示は、クラウドコンポーネントで処理され、クラウドコンポーネントとエンドデバイスとの間で再同期される信号を選択するための方法に関する。

エコーノイズキャンセルリダクション（ＥＣＮＲ）は、テレフォニー、会議、音声認識、モバイルデバイス、及びスマートスピーカーシステムのパフォーマンスを向上させる。これは、ほんの数例を挙げると、オーディオノイズカップリングが車両オーディオシステムからのノイズ、エンジンノイズ、ロードノイズ、空調システムからのノイズ、風騒音、ハンズフリー電話会話からの音声、及びその他のキャビンノイズを含み得る車両環境におけるハンズフリーオーディオに特に当てはまる。このように音声を処理するための計算コンポーネントは、その機能を実行するために入力ストリーム及び出力ストリームの両方を必要とする。入力ストリームと出力ストリームとの間に限定されたずれだけが許容され得る。例えば、車両の同じ場所に配置されたＥＣＮＲシステム内では、これらのオーディオストリームの配信／受信に関連するスピーカーストリームとマイクロフォンストリームとの間の５ｍｓの遅延は管理可能である。ＥＣＮＲまたはその他の処理がクラウドで実行されるとき、ストリームがネットワークを通じてクラウドベースプロセッサに伝送されるため、これらのストリームの配信／受信は、車両で通常発生するものよりも大幅に遅延し得る。処理コンポーネントをクラウドに移動することによって生じるレイテンシーは、より大きくなるだけでなく、変化もするため、例えば、クラウドベースＥＣＮＲブロックによって処理されるオーディオ信号の決定が複雑になる。

ＥＣＮＲがエコー及びノイズを検出及びキャンセルする機能を実行できるように、クラウドベースＥＣＮＲに出入りするストリームの時間のずれを解決する必要がある。

本発明の主題は、ネットワークを通じて、車両、インターネットプロトコル電話、またはインテリジェントスピーカー等から送信されるコンテンツによって生じるレイテンシーの補償を調整するためのオーディオストリームを選択して、クラウドのＥＣＮＲブロック、または車両の外部に位置するいくつかの他のコンピューティング環境で処理するための方法に関する。また、クラウドのＥＣＮＲブロックによって処理される音声信号は車両のエンドデバイスに返送される。処理される適切なオーディオ信号の選択は、ループバック方式、タイムスタンプ（ＴＳ）方式、またはピング方式を使用して実現し得る。ピング方式では、着信オーディオ信号及び発信オーディオ信号をＥＣＮＲブロックにおいて選択して、処理することも可能になる。
本明細書は、例えば、以下の項目も提供する。
（項目１）
オーディオシステムで発信され、エンドデバイスで再生されるオーディオ信号のクラウドベースのエコーノイズキャンセル低減（ＥＣＮＲ）の方法であって、
前記オーディオシステムのマイクロフォンで、アップリンクオーディオ信号を受信するステップと、
ネットワークを通じて、前記アップリンクオーディオ信号をクラウドベースＥＣＮＲに伝送するステップと、
前記ＥＣＮＲからコンテンツクラウドに前記アップリンクオーディオ信号を伝送するステップと、
前記ＥＣＮＲにおいて、ダウンリンクオーディオ信号を前記コンテンツクラウドから受信するステップと、
前記アップリンクオーディオ信号及びダウンリンクオーディオ信号をバッファリング及び順序付けするステップと、
前記バッファから、適切なアップリンクオーディオ信号を識別するステップと、
前記ネットワークを通じて、前記エンドデバイスのスピーカーで再生される適切なアップリンクオーディオ信号を伝送するステップと、
を含む、前記方法。
（項目２）
前記適切なアップリンクオーディオ信号を識別するステップは、さらに、
前記ネットワークを通じて、前記ダウンリンクオーディオ信号を前記アップリンクオーディオ信号とともに前記ＥＣＮＲにループバックするステップと、
前記ＥＣＮＲに出入りする前記バッファリング及び順序付けされたオーディオ信号から、前記ループバックされたダウンリンクオーディオ信号と一致する前記オーディオ信号を前記適切なアップリンクオーディオ信号として選択するステップと、
を含む、項目１に記載の方法。
（項目３）
前記ダウンリンクオーディオ信号のタイムスタンプをさらに含み、前記適切なアップリンクオーディオ信号を識別するステップは、さらに、
前記アップリンクオーディオ信号を前記ダウンリンクオーディオ信号の前記タイムスタンプと組み合わせるステップと、
前記ＥＣＮＲに出入りする前記バッファリング及び順序付けされたオーディオ信号から、前記ダウンリンクオーディオ信号の前記タイムスタンプと一致する前記オーディオ信号を前記適切なアップリンクオーディオ信号として選択するステップと、
を含む、項目１に記載の方法。
（項目４）
処理する前記適切なアップリンクオーディオ信号を識別するステップは、さらに、
前記オーディオシステムと前記クラウドとの間でピングをループして、時間遅延を測定するステップと、
前記ピングを前記アップリンクオーディオ信号で連続的に調整するステップと、
前記ＥＣＮＲに出入りする前記バッファリング及び順序付けされたオーディオ信号から、前記ピングの前記時間遅延と一致する前記オーディオ信号を前記適切なアップリンクオーディオ信号として選択するステップと、
を含む、項目１に記載の方法。
（項目５）
前記ＥＣＮＲにおいてダウンリンクオーディオ信号を受信するステップは、さらに、
前記ピングを前記ダウンリンクオーディオ信号で連続的に調整するステップと、
前記ＥＣＮＲにおいて、前記ダウンリンクオーディオ信号を処理するステップと、
処理されたダウンリンクオーディオ信号を前記オーディオシステムに伝送するステップと、
を含む、項目４に記載の方法。
（項目６）
オーディオ信号のエコーノイズをキャンセルするためのシステムであって、
マイクロフォン及びラウドスピーカーを有するオーディオシステムと、
前記マイクロフォンにおいて受信されたアップリンクオーディオ信号と、
クラウドベースプロセッサと、
前記オーディオシステムと前記クラウドベースプロセッサとの間で前記アップリンクオーディオ信号を伝送するための、前記オーディオシステムと前記クラウドベースプロセッサとの間の通信リンクと、を備え、
前記クラウドベースプロセッサは適切なアップリンクオーディオ信号を前記アップリンクオーディオ信号から識別及び選択し、前記クラウドベースプロセッサは、エコーノイズキャンセル低減のために前記適切なアップリンクオーディオ信号を処理し、
前記適切なアップリンクオーディオ信号は、前記オーディオシステムに返送され、前記ラウドスピーカーで再生される、前記システム。
（項目７）
前記アップリンク信号でループバックされるコンテンツクラウドで生成されるダウンリンクオーディオ信号をさらに含み、前記適切なアップリンクオーディオ信号は、前記ループバックされたダウンリンクオーディオ信号と一致するオーディオ信号を検出することによって選択される、項目６に記載のシステム。
（項目８）
ダウンリンクオーディオ信号と、
前記ダウンリンクオーディオ信号のタイムスタンプと、をさらに含み、
前記適切なアップリンクオーディオ信号は、さらに、組み合わされたアップリンクオーディオ信号を前記ダウンリンクオーディオ信号の前記タイムスタンプと一致させる前記オーディオ信号を含む、項目６に記載のシステム。
（項目９）
ダウンリンクオーディオ信号と、
時間遅延を測定するためのピングと、をさらに含み、
前記ピングは、前記オーディオシステムと前記クラウドベースプロセッサとの間でループされ、前記アップリンクオーディオ信号で連続的に調整され、
前記適切なアップリンクオーディオ信号は、前記ピングの前記時間遅延に一致する前記オーディオ信号であると識別される、項目６に記載のシステム。
（項目１０）
前記ピングは前記ダウンリンクオーディオ信号と連続的に調整され、前記適切なアップリンクオーディオ信号は、前記ピングの前記時間遅延に一致する前記オーディオ信号であると識別される、項目９に記載のシステム。

アップリンクオーディオストリーム及びダウンリンクオーディオストリームのクラウドベースＥＣＮＲのためのオーディオサンプルを選択するための方法のフロー図である。車両のオーディオシステムとクラウドベースＥＣＮＲブロックとの間を流れるデータストリームを示すシステムのブロック図である。車両のオーディオシステムと、タイムスタンプ（ＴＳ）を組み込んでいるクラウドベースＥＣＮＲブロックとの間を流れるデータストリームを示すシステムのブロック図である。車両のオーディオシステムと、ピングループを組み込んでいるクラウドベースＥＣＮＲブロックとの間を流れるデータストリームを示すシステムのブロック図である。

図の要素及びステップは、単純及び明確にするために示され、必ずしもいずれかの特定の順序に従って提供されていない。例えば、同時にまたは異なる順序で行われ得るステップは、本開示の実施形態の理解を改善することを助けるために図に示される。

本開示の様々な態様が特定の例示的な実施形態を参照して説明されているが、本開示は、係る実施形態、及び追加の修正、適用に限定されず、実施形態は、本開示から逸脱することなく実施され得る。図では、同じ参照符号を使用して、同じ構成要素を示す。当業者は、本明細書に記載された様々な構成要素が、本開示の範囲から変わることなく変更され得ることを認識している。

本明細書に説明されるサーバ、レシーバ、またはデバイスのいずれかの１つ以上は、様々なプログラミング言語及び／または技術を使用して作成されたコンピュータプログラムからコンパイルまたは解釈され得るコンピュータ実行可能命令を含む。概して、プロセッサ（マイクロプロセッサ等）は、例えば、メモリ、コンピュータ可読媒体等から命令を受信し、命令を実行する。処理ユニットは、ソフトウェアプログラムの命令を実行することが可能である非一時的コンピュータ可読ストレージ媒体を含む。コンピュータ可読記憶媒体は、限定ではないが、電子記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁気記憶デバイス、半導体記憶デバイス、またはそれらのいずれかの適切な組み合わせであり得る。本明細書のいずれかの１つ以上のデバイスは、ファームウェアに依存し得、ファームウェアは、オペレーティングシステムとの互換性、改善及び追加機能、セキュリティアップデート等を確実にするために、時々更新を必要とし得る。接続サーバ及びネットワークサーバ、レシーバ、またはデバイスは、限定ではないが、ＳＡＴＡ、Ｗｉ－Ｆｉ、ライトニングコネクタ、ＵＳＢ、イーサネット（登録商標）、ＵＦＳ、５Ｇ等を含み得る。１つ以上のサーバ、レシーバ、またはデバイスは、ほんの数例を挙げると、専用オペレーティングシステム、グラフィックス、音声、無線ネットワーク等のインターフェース用の複数のソフトウェアプログラム及び／またはプラットフォームを使用して動作し得、アプリケーションを可能にし、車両コンポーネント、システムのハードウェア、ならびにスマートフォン、タブレット、及び他のシステム等の外部デバイスを統合する。

図１は、オーディオ信号のクラウドベースのエコーノイズキャンセル低減（ＥＣＮＲ）のための方法１００のフロー図を示す。本明細書の説明は、ネットワークを通じて、クラウドプロバイダーと、テレフォニー及びコンテンツクラウドプロバイダーとに接続される車両ベースのオーディオシステムに適用される。しかしながら、本発明の主題は、車載用途に限定されず、また、スマートスピーカー、ＩＰ会議システム等にも適用され得ることに留意されたい。いずれの場合も、オーディオ信号処理はクラウドで実行される。音声、エコー、及びノイズ信号は、例えば、車室内のマイクロフォンによって受信される（１０２）。処理されるアップリンクオーディオサンプルは、受信された音声、エコー、及びノイズ信号から作成される（１０４）。処理されるアップリンクオーディオサンプルは、ネットワークを通じてクラウドに伝送される（１０６）。クラウド内で、処理されるアップリンクオーディオサンプルは順序付けされ、タイムスタンプが付けられ、バッファリングされる。

この時点までのプロセス全体を通じて、アップリンクオーディオがクラウドに伝送されるときにレイテンシーが生じる。このレイテンシーは変化し、ネットワーク速度、信号の移動距離、及びその他の要因の影響を受ける。したがって、バッファから、処理される適切なアップリンクオーディオサンプルが識別され（１１０）、選択され、処理（１１２）のためにＥＣＮＲブロックに送信される。方法２００、３００、及び４００のいずれか１つを使用して、ＥＣＮＲに出入りするオーディオストリームの時間のずれを解決し、ＥＣＮＲで処理される適切なアップリンクオーディオサンプルを識別し得る。方法２００は、処理される適切なアップリンクオーディオサンプルを識別するステップ１１０にループバック方式を適用し、図２に示されるシステムを参照して本明細書で後述する。方法３００は、タイムスタンプ方式を、処理される適切なアップリンクオーディオサンプルを識別するステップ１１０に適用し、図３に示されるシステムを参照して本明細書で後述する。方法４００は、処理される適切なアップリンクオーディオサンプルを識別するステップ１１０にピング方式を適用し、図４に示されるシステムを参照して本明細書で後述する。

再び図１を参照すると、処理される適切なアップリンクオーディオサンプルがＥＣＮＲブロックによって識別され（１１０）、処理され（１１２）、処理されたアップリンクオーディオサンプルは、テレフォニー及びコンテンツクラウドに伝送される（１１４）。ダウンリンクオーディオサンプルは、テレフォニー及びコンテンツクラウドから受信される（１１６）。ダウンリンクオーディオサンプルは、タイムスタンプが付けられ、再び追加の時間遅延を伴って、ネットワークを通じて伝送され（１１８）、そのダウンリンクオーディオサンプルは、スピーカー（例えば、車両のオーディオシステムのスピーカー）で出力される（１２０）。

オーディオ計算コンポーネントは、その機能を実行するために出力ストリーム及び入力ストリームの両方を必要とする。多くの場合、ストリーム間の限定された時間のずれだけが許容される。クラウドベースプロセッサ等で処理がリモートで行われ、ストリームの配信及び／または受信がクラウドベースプロセッサから数百マイル離れた車両で行われるとき、この調整を実現することは困難である。

図２は、オーディオシステム２０２（車両オーディオシステム、スマートスピーカー、またはＩＰ会議システム等）と、クラウドベースＥＣＮＲ２０４との間を流れるオーディオデータストリームを示すシステム２００のブロック図である。ループバックオーディオ２１４は、図１の方法によって使用され、バッファ、シーケンサー、及び時間調整ブロック２１８から、クラウドベースＥＣＮＲ２０４で処理される適切なアップリンクオーディオサンプル２２０を識別するステップ１１０に適用される。アップリンクオーディオ信号２２２は、マイクロフォン２２４で受信された音声、エコー、及びノイズ信号から作成される。ダウンリンクオーディオ信号２０６は、テレフォニー及びコンテンツクラウド２０８からネットワーク２１０を通じてオーディオシステム２０２に返送され、ダウンリンクオーディオ信号２０６は、スピーカー２１２で出力され、ループバックされ（２１４）、ネットワーク２１０を通じて、クラウド２１６に、処理されるアップリンクオーディオサンプルとともにルーティングされる。図２に示される方法２００では、ループバックされるダウンリンクオーディオ信号２１４と一緒にアップリンクオーディオ信号２２２は両方とも時間的に調整され、ネットワーク２１０を通じて送信される。

オーディオ信号２２２、２１４が処理のためにクラウド２１６に到着するとき、選択される前に、それらのオーディオ信号は、時間基準２１９に関して、ブロック２１８でバッファリングされ、順序付けられ、タイムスタンプが付けられる。ループバック時間に従って、処理される適切なアップリンクオーディオサンプル２２０は識別され、次に、バッファから選択される。選択されたアップリンクオーディオサンプルは、ＥＣＮＲ２０４で処理される。処理された信号２２６はテレフォニー及びコンテンツクラウド２０８に伝送され、ダウンリンクオーディオ２０６はＥＣＮＲ２０４に戻され、ダウンリンクオーディオ２０６は、ブロック２１８でタイムスタンプが付けられ、ネットワーク２１０を通じて伝送され、オーディオシステム２０２のスピーカー２１２で再生される。

図３は、オーディオシステム３０２（車両オーディオシステム、スマートスピーカー、またはＩＰ会議システム等）と、クラウドベースＥＣＮＲブロック３０４との間を流れるオーディオデータストリームを示すシステム３００のブロック図である。図３に示されるタイムスタンプシステムは、図１の方法によって使用され、ブロック３１８のバッファから、クラウドベースＥＣＮＲブロック３０４で処理される適切なアップリンクオーディオサンプル３２０を識別するステップ１１０に適用される。アップリンクオーディオ信号３２２は、マイクロフォン３２４によって受信された音声、エコー、及びノイズ信号から作成され、タイムスタンプが付けられる（３１４）。アップリンク信号のタイムスタンプＴｕは、ネットワーク３１０を通じて伝送されるアップリンクオーディオ信号３２２に追加される。

ダウンリンクオーディオ信号３０６は、テレフォニー及びコンテンツクラウド３０８からネットワーク３１０を通じて車両オーディオシステム３０２に返送され、ダウンリンクオーディオ信号３０６はスピーカー３１２で出力される。また、ダウンリンクオーディオサンプルは、タイムスタンプが付けられる（３１４）。ダウンリンク信号タイムスタンプＴｄは、アップリンク信号タイムスタンプＴｕ及びネットワーク３１０を通じて伝送されるアップリンクオーディオ信号３２２と組み合わされる。

アップリンクオーディオ信号３２２ならびにタイムスタンプＴｕ及びＴｄがクラウド３１６に到着するとき、それらは、選択される前に、時間基準３１９に関して再びブロック３１８でバッファリングされ、順序付けられ、タイムスタンプが付けられる。処理される適切なアップリンクオーディオサンプル３２０は、ＥＣＮＲブロック３０４で処理されるタイムスタンプＴｕ、Ｔｄを時間基準Ｔｒと調整することによって、ブロック３１８でバッファから識別及び選択される。処理された信号３２６は、テレフォニー及びコンテンツクラウド３０８に伝送され、ダウンリンクオーディオ信号３０６は、再度、ＥＣＮＲブロック３０４に戻され、ネットワーク３１０を通じて伝送され、オーディオシステム３０２のスピーカー３１２で再生される前に、ブロック３１８でタイムスタンプが付けられる。

図３を参照して説明したタイムスタンプ方式は、ダウンリンクオーディオ信号の全体ではなく、ダウンリンクオーディオ信号に関連するタイムスタンプＴｄだけが、ネットワーク３１０を通じてループバックされ、伝送されるという利点をもたらす。これは、ストリーミングされるデータがより少ないという点で有利である。これは、図２を参照して説明したループバック方式よりも速く、より費用効果の高い方式で伝送される。

図４は、オーディオシステム４０２（車両オーディオシステム、スマートスピーカー、またはＩＰ会議システム等）と、クラウドベースＥＣＮＲブロック４０４との間を流れるオーディオデータストリームを示すシステム４００のブロック図である。図４に示されるピングループシステムは、図１の方法によって使用され、バッファから（４１８）、クラウドベースＥＣＮＲ４０４で処理される適切なアップリンクオーディオサンプル４２０を識別するステップに適用される。

アップリンクオーディオ信号４２２は、オーディオシステム４０２でマイクロフォン４２４によって受信された音声、エコー、及びノイズ信号から作成される。ピング４３０は、オーディオシステム４０２のピングクライアント４２８と、クラウド４１６のブロック４１８のバッファとの間で、ネットワーク４１０を通じてループされる。上記のようにオーディオ信号にタイムスタンプを付ける代わりに、アップリンクオーディオ信号４２２をクラウド４１６に送信するのにかかる時間は、ブロック４１８のバッファから、ＥＣＮＲブロック４０４で処理されるオーディオ信号４２０を識別及び選択するために使用される時間遅延の量である。処理された信号４２６は、テレフォニー及びコンテンツクラウド４０８に伝送され、ダウンリンクオーディオ信号４０６は、再度、ＥＣＮＲブロック４０４に戻され、ネットワーク４１０を通じて伝送され、オーディオシステム４０２のスピーカー４１２で再生される前に、ブロック４１８でタイムスタンプが付けられる。

ダウンリンクオーディオ信号４０６は、テレフォニー及びコンテンツクラウド４０８からネットワーク４１０を通じて車両オーディオシステム４０２に返送され、ダウンリンクオーディオ信号４０６はスピーカー４１２で出力される。ピングループ方式の明確な利点は、レイテンシーの変化に対応するためにピングを連続的に調整し得ることである。また、ピングはユニバーサルである。ピングはクラウドプロバイダーに固有ではない。したがって、ピングはアップリンクオーディオ信号及びダウンリンクオーディオ信号の時間のずれを解決するために使用され得る。したがって、ダウンリンクオーディオ信号４０６をスピーカー４１２で再生するために、ネットワーク４１０を通じてオーディオシステム４０２に戻す前に、ＥＣＮＲは、処理されるアップリンク信号４２０のような方式でダウンリンク信号をクリーンアップし得る。

前述の明細書では、特定の例示的な実施形態を参照して本開示を説明してきた。しかしながら、様々な修正及び変更は、特許請求の範囲に記載される本開示の範囲を逸脱することなくなされ得る。本明細書及び図は限定的ではなく例示的であり、修正は本開示の範囲内に含まれることが意図される。したがって、本開示の範囲は、単に説明された例によってではなく、特許請求の範囲及びその法的均等物によって決定されるべきである。

例えば、いずれかの方法または工程の請求項で列挙されるステップは、いずれかの順序で実行され得、特許請求の範囲に提示される特定の順序に限定されない。平均化は、信号ノイズの影響を最小限にするために、フィルタを用いて実施され得る。さらに、いずれかの機器の請求項で列挙される構成要素及び／または要素は組み立てられ得、またはそうでなければ、様々な順列で動作可能に構成され得るため、特許請求の範囲で列挙される特定の構成に限定されない。

利益、他の利点、及び問題に対する解決策は例示的な実施形態に関して上記に説明されている。しかしながら、いずれかの利益、利点、問題に対する解決策、あるいはいずれかの特定の利益、利点、もしくは解決策を発生させ得る、またはより顕著にし得るいずれかの要素は、請求項のいずれかまたは全ての重大な、必要または本質的な特徴または構成要素として解釈されない。

「含む（ｃｏｍｐｒｉｓｅ）」、「含む（ｃｏｍｐｒｉｓｅｓ）」、「含む（ｃｏｍｐｒｉｓｉｎｇ）」、「有する（ｈａｖｉｎｇ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」、「含む（ｉｎｃｌｕｄｅｓ）」という用語、またはそれらのいずれかの変形は、非排他的な包含を言及することを意図しており、それにより、要素の一覧を含むプロセス、方法、物品、構成、または装置は、列挙されるそれらの要素だけを含むだけではなく、明示的に列挙されていない、またはそのようなプロセス、方法、物品、構成、または装置に固有ではない他の要素を含み得る。本開示の実践において使用される上述の構造、配置、用途、比率、要素、材料、または構成要素の他の組み合わせ及び／または修正は、具体的に列挙されていないものに加えて、本開示の一般的な原理から逸脱することなく、特定の環境、製造仕様、設計パラメータ、または他の動作要件に、変更され得る、またはそうでなければ、特別に適応し得る。

Claims

オーディオシステムで発信され、エンドデバイスで再生されるオーディオ信号のクラウドベースエコーノイズキャンセル低減（ＥＣＮＲ）の方法であって、前記方法は、
前記オーディオシステムのマイクロフォンで、アップリンクオーディオ信号を受信するステップと、
ネットワークを通じて、前記アップリンクオーディオ信号をクラウドベースＥＣＮＲに伝送するステップと、
前記ＥＣＮＲからコンテンツクラウドに前記アップリンクオーディオ信号を伝送するステップと、
前記ＥＣＮＲにおいて、ダウンリンクオーディオ信号を前記コンテンツクラウドから受信するステップと、
前記クラウドベースＥＣＮＲ内のバッファ及びシーケンサーブロックで、前記アップリンクオーディオ信号及び前記ダウンリンクオーディオ信号をバッファリング及び順序付けすることにより、バッファリング及び順序付けされたオーディオ信号を生成するステップと、
前記バッファ及びシーケンサーブロックから、適切なアップリンクオーディオ信号を識別するステップであって、前記適切なアップリンクオーディオ信号は、前記ダウンリンクオーディオ信号と時間的に調整されたアップリンクオーディオ信号である、ステップと、
前記ネットワークを通じて、前記エンドデバイスのスピーカーで再生される前記適切なアップリンクオーディオ信号を伝送するステップと、
前記ネットワークを通じて、前記ダウンリンクオーディオ信号を前記アップリンクオーディオ信号とともに前記ＥＣＮＲにループバックするステップと、
前記ＥＣＮＲに出入りする前記バッファリング及び順序付けされたオーディオ信号から、前記ループバックされたダウンリンクオーディオ信号と一致する前記オーディオ信号を前記適切なアップリンクオーディオ信号として選択するステップと、
を含む、方法。
オーディオシステムで発信され、エンドデバイスで再生されるオーディオ信号のクラウドベースエコーノイズキャンセル低減（ＥＣＮＲ）の方法であって、前記方法は、
前記オーディオシステムのマイクロフォンで、バッファリング及び順序付けされタイムスタンプが付けられたアップリンクオーディオ信号を受信するステップと、
ネットワークを通じて、前記アップリンクオーディオ信号をクラウドベースＥＣＮＲに伝送するステップと、
前記ＥＣＮＲにおいて、ダウンリンクオーディオ信号をコンテンツクラウドから受信するステップと、
前記クラウドベースＥＣＮＲで、基準タイムスタンプを用いて再度、前記アップリンクオーディオ信号及び前記ダウンリンクオーディオ信号に対してバッファリング及び順序付けしタイムスタンプを付けることにより、バッファリング及び順序付けされタイムスタンプが付けられたオーディオ信号を生成するステップと、
前記クラウドベースＥＣＮＲのバッファから、適切なアップリンクオーディオ信号を識別するステップであって、前記適切なアップリンクオーディオ信号は、前記ダウンリンクオーディオ信号と時間的に調整されたアップリンクオーディオ信号である、ステップと、
前記アップリンクオーディオ信号を前記ダウンリンクオーディオ信号の前記タイムスタンプと組み合わせるステップと、
前記ＥＣＮＲに出入りする前記バッファリング及び順序付けされタイムスタンプが付けられたオーディオ信号から、前記ダウンリンクオーディオ信号の前記タイムスタンプと一致する前記オーディオ信号を前記適切なアップリンクオーディオ信号として選択するステップと、
前記クラウドベースＥＣＮＲから前記コンテンツクラウドに前記適切なアップリンクオーディオ信号を伝送するステップと、
前記ネットワークを通じて、前記エンドデバイスのスピーカーで再生される前記ダウンリンクオーディオ信号を伝送するステップと、
を含む、方法。
オーディオシステムで発信され、エンドデバイスで再生されるオーディオ信号のクラウドベースエコーノイズキャンセル低減（ＥＣＮＲ）の方法であって、前記方法は、
前記オーディオシステムのマイクロフォンで、アップリンクオーディオ信号を受信するステップと、
ネットワークを通じて、前記アップリンクオーディオ信号をクラウドベースＥＣＮＲに伝送するステップと、
前記ＥＣＮＲからコンテンツクラウドに前記アップリンクオーディオ信号を伝送するステップと、
前記ＥＣＮＲにおいて、ダウンリンクオーディオ信号を前記コンテンツクラウドから受信するステップと、
前記クラウドベースＥＣＮＲ内のバッファ及びシーケンサーブロックで、前記アップリンクオーディオ信号及び前記ダウンリンクオーディオ信号をバッファリング及び順序付けすることにより、バッファリング及び順序付けされたオーディオ信号を生成するステップと、
前記バッファ及びシーケンサーブロックから、適切なアップリンクオーディオ信号を識別するステップであって、前記適切なアップリンクオーディオ信号は、前記ダウンリンクオーディオ信号と時間的に調整されたアップリンクオーディオ信号である、ステップと、
前記ネットワークを通じて、前記エンドデバイスのスピーカーで再生される前記適切なアップリンクオーディオ信号を伝送するステップと、
を含み、
処理する前記適切なアップリンクオーディオ信号を識別するステップは、さらに、
前記オーディオシステムと前記クラウドベースＥＣＮＲとの間でピングをループして、時間遅延を測定するステップと、
前記ピングを前記アップリンクオーディオ信号で連続的に調整するステップと、
前記ＥＣＮＲに出入りする前記バッファリング及び順序付けされたオーディオ信号から、前記ピングの前記時間遅延と一致する前記オーディオ信号を前記適切なアップリンクオーディオ信号として選択するステップと、
を含む、方法。
前記ＥＣＮＲにおいてダウンリンクオーディオ信号を受信するステップは、さらに、
前記ピングを前記ダウンリンクオーディオ信号で連続的に調整するステップと、
前記ＥＣＮＲにおいて、前記ダウンリンクオーディオ信号を処理するステップと、
処理されたダウンリンクオーディオ信号を前記オーディオシステムに伝送するステップと、
を含む、請求項３に記載の方法。
オーディオ信号のエコーノイズをキャンセルするためのシステムであって、前記システムは、
マイクロフォン及びラウドスピーカーを有するオーディオシステムと、
前記マイクロフォンにおいて受信されたアップリンクオーディオ信号と、
前記アップリンクオーディオ信号でループバックされるコンテンツクラウドで生成されるダウンリンクオーディオ信号と、
クラウドベースプロセッサと、
前記オーディオシステムと前記クラウドベースプロセッサとの間で前記アップリンクオーディオ信号を伝送するための、前記オーディオシステムと前記クラウドベースプロセッサとの間の通信リンクと、を備え、
前記クラウドベースプロセッサは適切なアップリンクオーディオ信号を前記アップリンクオーディオ信号から識別及び選択し、前記適切なアップリンクオーディオ信号は、前記ダウンリンクオーディオ信号と時間的に調整されたものであり、前記クラウドベースプロセッサは、エコーノイズキャンセル低減のために前記適切なアップリンクオーディオ信号を処理し、
前記適切なアップリンクオーディオ信号は、前記オーディオシステムに返送され、前記ラウドスピーカーで再生される、システム。
前記適切なアップリンクオーディオ信号は、前記ループバックされたダウンリンクオーディオ信号と一致するオーディオ信号を検出することによって選択される、請求項５に記載のシステム。
ダウンリンクオーディオ信号と、
前記ダウンリンクオーディオ信号のタイムスタンプと、をさらに含み、
前記適切なアップリンクオーディオ信号は、さらに、組み合わされたアップリンクオーディオ信号を前記ダウンリンクオーディオ信号の前記タイムスタンプと一致させる前記オーディオ信号を含み、前記組み合わされたアップリンクオーディオ信号は、（ａ）前記アップリンクオーディオ信号のタイムスタンプと（ｂ）前記アップリンクオーディオ信号との組み合わせを含む、請求項５に記載のシステム。
ダウンリンクオーディオ信号と、
時間遅延を測定するためのピングと、をさらに含み、
前記ピングは、前記オーディオシステムと前記クラウドベースプロセッサとの間でループされ、前記アップリンクオーディオ信号で連続的に調整され、
前記適切なアップリンクオーディオ信号は、前記ピングの前記時間遅延に一致する前記オーディオ信号であると識別される、請求項５に記載のシステム。
前記ピングは前記ダウンリンクオーディオ信号で連続的に調整され、前記適切なアップリンクオーディオ信号は、前記ピングの前記時間遅延に一致する前記オーディオ信号であると識別される、請求項８に記載のシステム。