JP7635234B2 - 連合混合モデル - Google Patents
連合混合モデル Download PDFInfo
- Publication number
- JP7635234B2 JP7635234B2 JP2022534677A JP2022534677A JP7635234B2 JP 7635234 B2 JP7635234 B2 JP 7635234B2 JP 2022534677 A JP2022534677 A JP 2022534677A JP 2022534677 A JP2022534677 A JP 2022534677A JP 7635234 B2 JP7635234 B2 JP 7635234B2
- Authority
- JP
- Japan
- Prior art keywords
- machine learning
- learning model
- processing device
- parameters
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/098—Distributed learning, e.g. federated learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本出願は、その内容全体が参照により本明細書に組み込まれている、2019年12月13日に出願されたギリシャ仮特許出願第20190100556号の利益および優先権を主張するものである。
をリモート処理デバイスから受信するステップであって、それぞれの各機械学習モデルkについて、グローバルに更新された機械学習モデルパラメータwk t+τが、ローカルに更新された機械学習モデルパラメータws,k t+τに少なくとも部分的に基づく、ステップを含む。
ニューラルネットワークは、相互接続されたノードの層として構成される。一般に、ノード(またはニューロン)は、計算が行われる場所である。たとえば、ノードは、入力データを増幅するかまたは減衰させる重み(または係数)のセットと入力データを組み合わせてもよい。したがって、入力信号の増幅または減衰は、ネットワークが学習しようとしているタスクに関する様々な入力への相対的重要性の割当てと見なされてもよい。一般に、各入力-重み積が加算(または累積)され、次いで、信号がネットワーク内をさらに進行すべきかどうかおよびどのくらい進行すべきかを判定するために、この和がノードの活性化関数を通過させられる。
機械学習モデルは、ニューラルネットワーク(たとえば、ディープニューラルネットワークおよび畳み込みニューラルネットワーク)、回帰(たとえば、ロジスティックまたは線形)、決定木(木のランダムフォレストを含む)、サポートベクターマシン、カスケード型分類器などの多数の形態を有する。ニューラルネットワークについては、本明細書全体にわたって、本明細書で説明する方法についての1つの例示的な適用例として説明するが、これらの同じ方法が同様に他の種類の機械学習モデルに適用されてもよい。
混合モデルは、観測されたデータセットが個々の観測情報が属する部分母集団を特定する必要なしにデータの母集団全体内の部分母集団の存在を表すための確率モデルである。したがって、混合モデルは、観測情報の母集団全体内の観測情報の確率分布を表す混合分布に対応する。混合モデルは、部分母集団特定情報なしで、併合された母集団に関する観測情報のみが与えられた場合に部分母集団の特性に関する統計的推論を行うために使用されてもよい。
従来の機械学習は、集中データ収集および処理アーキテクチャを利用する。それに対して、連合機械学習は、機械学習プロセスを複数のデバイスに分散させ、各デバイスは、集中データセットとして共有可能でない場合があるデバイス自体の連合データセットを有する。したがって、連合機械学習は、スマートフォンなどの様々な「エッジ」処理デバイスが、個々のエッジ処理デバイス上でトレーニングデータを使用するが、個々のデバイスデータを共有せずに、共有機械学習モデルを協働で学習するのを可能にする。その代わりに、エッジ処理デバイスは、処理デバイス自体のローカルモデル最適化手順から得られる、重みおよびバイアスなどのモデルパラメータを共有するにすぎない。したがって、データをネットワークを介して集中レポジトリに転送する必要がなく、データ伝送コストが低減し、一方データセキュリティおよび機密性が向上する。
図1は、例示的な連合学習アーキテクチャ100を示す。
図1に関して説明するデータ104A~104Cなどの連合機械学習に使用される連合データの非IID特性を解消するには、最尤最適化法をK個の異なる予測モデルまたは「エキスパート」の混合体に拡張してもよい。各エキスパートは結合データ空間(たとえば、すべての連合データ空間を組み合わせたデータ空間)内の領域をモデル化することが予想される。そうするには、K個の個々の予測モデルの混合体から観測データ(たとえば、図1のモバイルデバイス102A~102Cによって生成されたデータ)が作成されたと仮定されてもよい。したがって、たとえば、モバイルデバイス102A上のモデル106Cは、連合混合モデル学習のコンテキストにおける複数のK個の混合モデルコンポーネント(たとえば、エキスパート)を備える単一のモデルと見なされてもよい。有利には、連合混合モデルは、このモデルを使用するアプリケーションに入力を与えそのアプリケーションから出力を受信するための単一のモデルとして働く。
データ点(ys,i,xs,i)についてエキスパートkが選択されるより情報の多い事前分布p(zs,i)を許容するように数式(1)についての定式化をさらに拡張してもよい。ここで、下付き文字sおよびiはそれぞれ、数式(1)に関して説明したようにシャードおよびシャード内のデータ点を列挙する。直感的には、特定の機械学習モデルについて分類(または回帰)タスクを実行するのに最も適したエキスパートkをすべてのK個のエキスパートから選択すべきである。一実施形態では、エキスパートkの予測にどれほどの重みを加えるべきかに関する決定は、たとえば、セットK内の各エキスパートkに等しい確率を割り当てるのではなく、入力xs,iを見ることによって下すことができる。
図3は、たとえば、図1のモバイルデバイス102A~102Cなどのエッジデバイス上で連合混合モデルデータを処理する例示的な方法300を示す。
図4は、サーバデバイス(たとえば、図1のグローバルモデルコーディネータ108)などの集中デバイス上で連合混合モデルデータを処理する例示的な方法400を示す。
図5は、例示的な電子デバイス500を示す。電子デバイス500は、図3および図4に関する方法を含む、本明細書で説明する方法を実行するように構成されてもよい。
条項1: データを処理する方法であって、処理デバイスにおいて、複数の機械学習モデルの各機械学習モデルについてグローバルパラメータのセットを受信するステップと、複数の機械学習モデルのそれぞれの各機械学習モデルについて、機械学習モデル出力を生成するために、処理デバイスにおいて、処理デバイス上にローカルに記憶されたデータをそれぞれの機械学習モデルを用いてグローバルパラメータのセットに従って処理するステップと、処理デバイスにおいて、機械学習モデル出力に関するユーザフィードバックを受信するステップと、ローカルに更新された機械学習モデルパラメータを生成するために、処理デバイスにおいて、機械学習モデル出力および機械学習モデル出力に関連するユーザフィードバックに基づいてそれぞれの機械学習モデルの最適化を実行するステップと、ローカルに更新された機械学習モデルパラメータをリモート処理デバイスに送信するステップと、複数の機械学習モデルの各機械学習モデルについて、グローバルに更新された機械学習モデルパラメータのセットをリモート処理デバイスから受信するステップであって、それぞれの各機械学習モデルについてのグローバルに更新された機械学習モデルパラメータのセットが、ローカルに更新された機械学習モデルパラメータに少なくとも部分的に基づく、ステップとを含む方法。
前述の説明は、本明細書で説明する様々な実施形態を任意の当業者が実践できるようにするために提供される。以下に説明する例は、特許請求の範囲に記載された範囲、適用可能性、または実施形態を限定するものではない。これらの実施形態への様々な修正は当業者に容易に明らかになり、本明細書で定義される一般原理は他の実施形態に適用されてもよい。たとえば、本開示の範囲から逸脱することなく、説明する要素の機能および構成において変更が行われてもよい。様々な例は、適宜に、様々な手順またはコンポーネントを省略してよく、置換してよく、または追加してもよい。たとえば、説明する方法は、説明する順序とは異なる順序で実行されてよく、様々なステップが、追加されてよく、省略されてよく、または組み合わせられてもよい。また、いくつかの例に関して説明する特徴は、いくつかの他の例において組み合わせられてよい。たとえば、本明細書に記載する任意の数の態様を使用して、装置が実装されてよく、または方法が実践されてよい。加えて、本開示の範囲は、本明細書に記載する開示の様々な態様に加えて、またはそれらの態様以外の、他の構造、機能性、または構造および機能性を使用して実践されるような装置または方法を対象とするものである。本明細書で開示する本開示のいずれの態様も、特許請求の範囲の1つまたは複数の要素によって具現され得ることを理解されたい。
102A~102C モバイルデバイス
104A~104C ローカルデータストア
106A~106C ローカル機械学習モデルインスタンス
108 グローバル機械学習モデルコーディネータ
500 電子デバイス
502 中央演算処理装置(CPU)
504 グラフィックス処理ユニット(GPU)
506 デジタル信号プロセッサ(DSP)
508 ニューラル処理ユニット(NPU)
510 マルチメディア処理ブロック
512 ワイヤレス接続ブロック
514 アンテナ
516 センサプロセッサ
518 画像信号プロセッサ(ISP)
520 ナビゲーションプロセッサ
522 入力および/または出力デバイス
524 メモリ
524A 送信コンポーネント
524B 受信コンポーネント
524C 処理コンポーネント
524D 判定コンポーネント
524E 出力コンポーネント
524F トレーニングコンポーネント
524G 推論コンポーネント
524H 最適化コンポーネント
600 マルチプロセッサ処理システム
601、603、605 プロセッサ
607 グローバルメモリ
Claims (24)
- データを処理する方法であって、
処理デバイスにおいて、複数の機械学習モデルの各機械学習モデルについてのグローバルパラメータのセットを受信するステップと、
前記複数の機械学習モデルのそれぞれの各機械学習モデルについて、
前記処理デバイスにおいて、機械学習モデル出力を生成するために、前記グローバルパラメータのセットに従ってそれぞれの機械学習モデルを用いて前記処理デバイス上にローカルに記憶されたデータを処理するステップと、
前記処理デバイスにおいて、前記機械学習モデル出力に関するユーザフィードバックを受信するステップと、
前記処理デバイスにおいて、かつリモート処理デバイスにローカルに更新された機械学習モデルパラメータを送信する前に、前記ローカルに更新された機械学習モデルパラメータを生成するために、前記機械学習モデル出力および前記機械学習モデル出力に関連する前記ユーザフィードバックに基づいて前記それぞれの機械学習モデルの最適化を実行するステップと、
前記ローカルに更新された機械学習モデルパラメータを前記リモート処理デバイスに送信するステップと、
前記リモート処理デバイスから、前記複数の機械学習モデルの各機械学習モデルについてのグローバルに更新された機械学習モデルパラメータのセットを受信するステップであって、
それぞれの各機械学習モデルについての前記グローバルに更新された機械学習モデルパラメータのセットが、前記ローカルに更新された機械学習モデルパラメータに少なくとも部分的に基づく、ステップと
を含む、方法。 - 前記複数の機械学習モデルのそれぞれの各機械学習モデルについての前記グローバルに更新された機械学習モデルパラメータのセットは、第2の処理デバイスのローカルに更新された機械学習モデルパラメータに少なくとも部分的に基づく、請求項1に記載の方法。
- 前記ユーザフィードバックは、前記機械学習モデル出力の正しさの指示を含む、請求項1に記載の方法。
- 前記処理デバイス上にローカルに記憶される前記データは、画像データ、オーディオデータ、またはビデオデータのうちの1つである、請求項1に記載の方法。
- 前記処理デバイスは、スマートフォンまたはモノのインターネットデバイスの一方である、請求項1に記載の方法。
- 前記処理デバイスにおいて、前記処理デバイス上にローカルに記憶された前記データを前記機械学習モデルを用いて処理するステップは、1つまたは複数のニューラル処理ユニットによって少なくとも部分的に実行される、請求項1に記載の方法。
- 前記処理デバイスにおいて、前記機械学習モデルの前記最適化を実行するステップは、1つまたは複数のニューラル処理ユニットによって少なくとも部分的に実行される、請求項1に記載の方法。
- 処理デバイスであって、
コンピュータ実行可能命令を含むメモリと、
前記コンピュータ実行可能命令を実行するための1つまたは複数のプロセッサであって、前記処理デバイスに、
複数の機械学習モデルの各機械学習モデルについてのグローバルパラメータのセットを受信することと、
前記複数の機械学習モデルのそれぞれの各機械学習モデルについて、
機械学習モデル出力を生成するために、前記グローバルパラメータのセットに従ってそれぞれの機械学習モデルを用いて処理デバイス上にローカルに記憶されたデータを処理することと、
機械学習モデル出力に関するユーザフィードバックを受信することと、
リモート処理デバイスにローカルに更新された機械学習モデルパラメータを送信する前に、前記ローカルに更新された機械学習モデルパラメータを生成するために、前記機械学習モデル出力および前記機械学習モデル出力に関連する前記ユーザフィードバックに基づいて前記それぞれの機械学習モデルの最適化を実行することと、
前記ローカルに更新された機械学習モデルパラメータをリモート処理デバイスに送信することと、
前記複数の機械学習モデルの各機械学習モデルについてのグローバルに更新された機械学習モデルパラメータのセットを前記リモート処理デバイスから受信することであって、
それぞれの各機械学習モデルについての前記グローバルに更新された機械学習モデルパラメータのセットが、前記ローカルに更新された機械学習モデルパラメータに少なくとも部分的に基づく、受信することと
を行わせるように構成される1つまたは複数のプロセッサと
を備える、処理デバイス。 - 前記複数の機械学習モデルのそれぞれの各機械学習モデルについての前記グローバルに更新された機械学習モデルパラメータのセットは、第2の処理デバイスのローカルに更新された機械学習モデルパラメータに少なくとも部分的に基づく、請求項8に記載の処理デバイス。
- 前記ユーザフィードバックは、前記機械学習モデル出力の正しさの指示を含む、請求項8に記載の処理デバイス。
- 前記処理デバイスは、スマートフォンまたはモノのインターネットデバイスの一方である、請求項8に記載の処理デバイス。
- 前記1つまたは複数のプロセッサのうちの1つは、前記処理デバイス上にローカルに記憶された前記データを前記機械学習モデルを用いて処理するように構成されるニューラル処理ユニットである、請求項8に記載の処理デバイス。
- 前記1つまたは複数のプロセッサのうちの1つは、前記機械学習モデルの前記最適化を実行するように構成されるニューラル処理ユニットである、請求項8に記載の処理デバイス。
- データを処理する方法であって、
複数の機械学習モデルのそれぞれの各機械学習モデルについて、
複数のリモート処理デバイスのそれぞれの各リモート処理デバイスについて、
サーバから前記それぞれのリモート処理デバイスに、前記それぞれの機械学習モデルについてのグローバルモデルパラメータの初期セットを送信するステップと、
前記それぞれのリモート処理デバイスから前記サーバにおいて、前記それぞれの機械学習モデルについてのモデルパラメータの更新済みセットを受信するステップと、
前記複数の機械学習モデルのそれぞれの各機械学習モデルについて、前記それぞれの機械学習モデルについての重み付けパラメータによってパラメータ化された対応する密度推定量を判定するステップであって、
前記重み付けパラメータが、前記機械学習モデルについてのパラメータのセットを更新するために使用されている入力に基づいて決定される、ステップと、
前記サーバにおいて、グローバルモデルパラメータの更新済みセットを生成するために、前記複数のリモート処理デバイスの各リモート処理デバイスから受信されたモデルパラメータの前記更新済みセットに基づき、かつ前記密度推定量にさらに基づいて前記それぞれの機械学習モデルの最適化を実行するステップと、
前記サーバから前記複数のリモート処理デバイスの各リモート処理デバイスに、前記複数の機械学習モデルの各機械学習モデルについてのグローバルモデルパラメータの前記更新済みセットを送信するステップと
を含む、方法。 - 前記サーバにおいて、前記それぞれの機械学習モデルの前記最適化を実行するステップは、前記それぞれの機械学習モデルについてのグローバルモデルパラメータの前記初期セットの各モデルパラメータについての有効勾配を算出するステップを含む、請求項14に記載の方法。
- 前記それぞれの機械学習モデルについての事前混合重みを決定するステップをさらに含む、請求項14に記載の方法。
- 前記複数のリモート処理デバイスはスマートフォンを含むか、
前記複数のリモート処理デバイスはモノのインターネットデバイスを含む、
請求項14に記載の方法。 - 前記複数の機械学習モデルのそれぞれの各機械学習モデルはニューラルネットワークモデルである、請求項14に記載の方法。
- 前記複数の機械学習モデルのそれぞれの各機械学習モデルは同じネットワーク構造を備える、請求項18に記載の方法。
- 処理デバイスであって、
コンピュータ実行可能命令を含むメモリと、
前記コンピュータ実行可能命令を実行する1つまたは複数のプロセッサであって、前記処理デバイスに、
複数の機械学習モデルのそれぞれの各機械学習モデルについて、
複数のリモート処理デバイスのそれぞれの各リモート処理デバイスについて、
前記それぞれの機械学習モデルについてのグローバルモデルパラメータの初期セットを前記それぞれのリモート処理デバイスに送信することと、
前記それぞれの機械学習モデルについてのモデルパラメータの更新済みセットを前記それぞれのリモート処理デバイスから受信することと、
前記複数の機械学習モデルのそれぞれの各機械学習モデルについて、前記それぞれの機械学習モデルについての重み付けパラメータによってパラメータ化された対応する密度推定量を判定することであって、
前記重み付けパラメータが、前記機械学習モデルについてのパラメータのセットを更新するために使用されている入力に基づいて決定される、ことと、
グローバルモデルパラメータの更新済みセットを生成するために前記複数のリモート処理デバイスの各リモート処理デバイスから受信されたモデルパラメータの前記更新済みセットに基づき、かつ前記密度推定量にさらに基づいて前記それぞれの機械学習モデルの最適化を実行することと、
前記複数の機械学習モデルの各機械学習モデルについてのグローバルモデルパラメータの前記更新済みセットを前記複数のリモート処理デバイスの各リモート処理デバイスに送信することと
を行わせるように構成される1つまたは複数のプロセッサと
を備える、処理デバイス。 - 前記1つまたは複数のプロセッサは、前記それぞれの機械学習モデルの前記最適化を実行するために、前記処理デバイスに、前記それぞれの機械学習モデルについてのグローバルモデルパラメータの前記初期セットの各モデルパラメータについての有効勾配を算出させるようにさらに構成される、請求項20に記載の処理デバイス。
- 前記1つまたは複数のプロセッサは、前記処理デバイスに、前記複数の機械学習モデルのそれぞれの各機械学習モデルについて、前記それぞれの機械学習モデルについての事前混合重みを決定させるようにさらに構成される、請求項20に記載の処理デバイス。
- 前記複数の機械学習モデルのそれぞれの各機械学習モデルはニューラルネットワークモデルである、請求項20に記載の処理デバイス。
- 前記複数の機械学習モデルのそれぞれの各機械学習モデルは同じネットワーク構造を備える、請求項23に記載の処理デバイス。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GR20190100556 | 2019-12-13 | ||
| GR20190100556 | 2019-12-13 | ||
| PCT/US2020/064889 WO2021119601A1 (en) | 2019-12-13 | 2020-12-14 | Federated mixture models |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2023505973A JP2023505973A (ja) | 2023-02-14 |
| JP2023505973A5 JP2023505973A5 (ja) | 2023-12-08 |
| JP7635234B2 true JP7635234B2 (ja) | 2025-02-25 |
Family
ID=74175956
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022534677A Active JP7635234B2 (ja) | 2019-12-13 | 2020-12-14 | 連合混合モデル |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US20230036702A1 (ja) |
| EP (1) | EP4073714A1 (ja) |
| JP (1) | JP7635234B2 (ja) |
| KR (1) | KR20220112766A (ja) |
| CN (1) | CN114787824B (ja) |
| BR (1) | BR112022011012A2 (ja) |
| WO (1) | WO2021119601A1 (ja) |
Families Citing this family (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20210312336A1 (en) * | 2020-04-03 | 2021-10-07 | International Business Machines Corporation | Federated learning of machine learning model features |
| US11842260B2 (en) * | 2020-09-25 | 2023-12-12 | International Business Machines Corporation | Incremental and decentralized model pruning in federated machine learning |
| US11790039B2 (en) * | 2020-10-29 | 2023-10-17 | EMC IP Holding Company LLC | Compression switching for federated learning |
| CN113516249B (zh) * | 2021-06-18 | 2023-04-07 | 重庆大学 | 基于半异步的联邦学习方法、系统、服务器及介质 |
| US11777812B2 (en) * | 2021-06-25 | 2023-10-03 | Qualcomm Technologies, Inc. | Zone-based federated learning |
| CN113435537B (zh) * | 2021-07-16 | 2022-08-26 | 同盾控股有限公司 | 基于Soft GBDT的跨特征联邦学习方法、预测方法 |
| US11443245B1 (en) * | 2021-07-22 | 2022-09-13 | Alipay Labs (singapore) Pte. Ltd. | Method and system for federated adversarial domain adaptation |
| JPWO2023032637A1 (ja) * | 2021-08-31 | 2023-03-09 | ||
| JP7566707B2 (ja) * | 2021-09-15 | 2024-10-15 | 株式会社東芝 | 学習システムおよび方法 |
| US20230110602A1 (en) * | 2021-10-13 | 2023-04-13 | International Business Machines Corporation | Federated learning model lineage |
| US20230110975A1 (en) * | 2021-10-13 | 2023-04-13 | International Business Machines Corporation | Recommending model contributions based on federated learning lineage |
| US20230117768A1 (en) * | 2021-10-15 | 2023-04-20 | Kiarash SHALOUDEGI | Methods and systems for updating optimization parameters of a parameterized optimization algorithm in federated learning |
| CN114004363B (zh) * | 2021-10-27 | 2024-05-31 | 支付宝(杭州)信息技术有限公司 | 联合更新模型的方法、装置及系统 |
| WO2023088531A1 (en) * | 2021-11-16 | 2023-05-25 | Huawei Technologies Co., Ltd. | Management entity, network element, system, and methods for supporting anomaly detection for communication networks |
| CH719269B1 (de) * | 2021-12-17 | 2024-04-15 | Palantir Technologies Inc | Verfahren zur Identifizierung eines Zielobjekts und Modell- und Sensororchestrierungssystem |
| CN116418686A (zh) * | 2021-12-31 | 2023-07-11 | 华为技术有限公司 | 模型的数据处理方法及装置 |
| CN114781540B (zh) * | 2022-05-09 | 2025-02-07 | 国网智能电网研究院有限公司 | 基于电力物联网的全局模型生成方法、装置、设备及介质 |
| WO2023230767A1 (zh) * | 2022-05-30 | 2023-12-07 | 华为技术有限公司 | 模型训练系统、模型训练方法、训练设备和训练节点 |
| EP4296909A1 (de) * | 2022-06-22 | 2023-12-27 | Siemens Aktiengesellschaft | Individuelle testmodelle für generalisierte maschinelle lernmodelle |
| KR102573880B1 (ko) * | 2022-07-21 | 2023-09-06 | 고려대학교 산학협력단 | 다중-너비 인공신경망에 기반한 연합 학습 시스템 및 연합 학습 방법 |
| KR102684383B1 (ko) * | 2022-12-22 | 2024-07-12 | 서울과학기술대학교 산학협력단 | 블록체인 기반 부분 모델 동기화 방법 |
| EP4649443A1 (en) * | 2023-01-14 | 2025-11-19 | Radiusal, Inc. | Automatic item recognition from captured images during assisted checkout |
| KR20240114646A (ko) * | 2023-01-17 | 2024-07-24 | 숭실대학교산학협력단 | 파라미터 부분 공유에 기초한 개인화 연합 학습 방법 및 장치 |
| CN116597672B (zh) * | 2023-06-14 | 2024-02-13 | 南京云创大数据科技股份有限公司 | 基于多智能体近端策略优化算法的区域信号灯控制方法 |
| CN116975683B (zh) * | 2023-06-27 | 2025-10-10 | 中国科学技术大学 | 一种基于用户分簇和模型分层的个性化联邦学习方法 |
| US20250077948A1 (en) * | 2023-08-29 | 2025-03-06 | Dell Products L.P. | In-Field Radio Frequency Impairment Compensation |
| KR20250036337A (ko) * | 2023-09-07 | 2025-03-14 | 감바랩스(주) | 음성과 음향 인식을 위한 인공 신경망 모델 학습 장치 및 추론 시스템 |
| US12602214B2 (en) * | 2023-09-20 | 2026-04-14 | Accenture Global Solutions Limited | Dynamic evaluation and improvement of energy efficiency of computer code |
| CN117009095B (zh) * | 2023-10-07 | 2024-01-02 | 湘江实验室 | 一种隐私数据处理模型生成方法、装置、终端设备及介质 |
| CN117408330B (zh) * | 2023-12-14 | 2024-03-15 | 合肥高维数据技术有限公司 | 面向非独立同分布数据的联邦知识蒸馏方法及装置 |
| CN117575291B (zh) * | 2024-01-15 | 2024-05-10 | 湖南科技大学 | 基于边缘参数熵的联邦学习的数据协同管理方法 |
| KR20260021147A (ko) * | 2024-08-05 | 2026-02-13 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017519282A (ja) | 2014-05-12 | 2017-07-13 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 分散モデル学習 |
| WO2018085643A1 (en) | 2016-11-04 | 2018-05-11 | Google Llc | Mixture of experts neural networks |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20150324690A1 (en) * | 2014-05-08 | 2015-11-12 | Microsoft Corporation | Deep Learning Training System |
| US10354184B1 (en) * | 2014-06-24 | 2019-07-16 | Amazon Technologies, Inc. | Joint modeling of user behavior |
| US10402469B2 (en) * | 2015-10-16 | 2019-09-03 | Google Llc | Systems and methods of distributed optimization |
| WO2018033890A1 (en) * | 2016-08-19 | 2018-02-22 | Linear Algebra Technologies Limited | Systems and methods for distributed training of deep learning models |
| US20180089587A1 (en) * | 2016-09-26 | 2018-03-29 | Google Inc. | Systems and Methods for Communication Efficient Distributed Mean Estimation |
| US20180285759A1 (en) * | 2017-04-03 | 2018-10-04 | Linkedin Corporation | Online hyperparameter tuning in distributed machine learning |
| US11727301B2 (en) * | 2017-07-21 | 2023-08-15 | Sap Se | Exploiting local inter-task relationships in adaptive multi-task learning |
| US11328210B2 (en) * | 2017-12-29 | 2022-05-10 | Micron Technology, Inc. | Self-learning in distributed architecture for enhancing artificial neural network |
| US11836576B2 (en) * | 2018-04-13 | 2023-12-05 | International Business Machines Corporation | Distributed machine learning at edge nodes |
| US11836643B2 (en) * | 2019-03-08 | 2023-12-05 | Nec Corporation | System for secure federated learning |
| EP3798934A1 (en) * | 2019-09-27 | 2021-03-31 | Siemens Healthcare GmbH | Method and system for scalable and decentralized incremental machine learning which protects data privacy |
| US12164677B2 (en) * | 2022-12-08 | 2024-12-10 | Capital One Services, Llc | Methods and systems for federated learning utilizing customer synthetic data models |
-
2020
- 2020-12-14 EP EP20839191.2A patent/EP4073714A1/en active Pending
- 2020-12-14 JP JP2022534677A patent/JP7635234B2/ja active Active
- 2020-12-14 KR KR1020227018464A patent/KR20220112766A/ko active Pending
- 2020-12-14 WO PCT/US2020/064889 patent/WO2021119601A1/en not_active Ceased
- 2020-12-14 BR BR112022011012A patent/BR112022011012A2/pt unknown
- 2020-12-14 US US17/756,957 patent/US20230036702A1/en active Pending
- 2020-12-14 CN CN202080084734.6A patent/CN114787824B/zh active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017519282A (ja) | 2014-05-12 | 2017-07-13 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | 分散モデル学習 |
| WO2018085643A1 (en) | 2016-11-04 | 2018-05-11 | Google Llc | Mixture of experts neural networks |
Non-Patent Citations (1)
| Title |
|---|
| Li Huang et al.,"Patient Clustering Improves Efficiency of Federated Machine Learning to predict mortality and hospital stay time using distributed Electronic Medical Records",arXiv.org [online],arXiv:1903.09296v1,米国,Cornell University,2019年03月,[検索日 2024.09.17], インターネット:<URL: https://arxiv.org/abs/1903.09296v1> |
Also Published As
| Publication number | Publication date |
|---|---|
| EP4073714A1 (en) | 2022-10-19 |
| JP2023505973A (ja) | 2023-02-14 |
| WO2021119601A1 (en) | 2021-06-17 |
| BR112022011012A2 (pt) | 2022-08-16 |
| KR20220112766A (ko) | 2022-08-11 |
| CN114787824B (zh) | 2026-04-17 |
| US20230036702A1 (en) | 2023-02-02 |
| CN114787824A (zh) | 2022-07-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7635234B2 (ja) | 連合混合モデル | |
| JP7706544B2 (ja) | スパース性を誘導する連合機械学習 | |
| US11132604B2 (en) | Nested machine learning architecture | |
| US11144812B2 (en) | Mixed machine learning architecture | |
| US20190073580A1 (en) | Sparse Neural Network Modeling Infrastructure | |
| US11375176B2 (en) | Few-shot viewpoint estimation | |
| US20140279741A1 (en) | Scalable online hierarchical meta-learning | |
| Liau et al. | Stochastic multi-armed bandits in constant space | |
| Xue et al. | SUGAR: Efficient subgraph-level training via resource-aware graph partitioning | |
| US20240362468A1 (en) | Hybrid generative artificial intelligence models | |
| US11632305B2 (en) | Method and system for link prediction in large multiplex networks | |
| US20210264274A1 (en) | Secret sharing with a neural cryptosystem | |
| US20240249133A1 (en) | Systems, apparatuses, methods, and non-transitory computer-readable storage devices for training artificial-intelligence models using adaptive data-sampling | |
| EP4487261A1 (en) | Federated learning with training metadata | |
| JP6900576B2 (ja) | 移動状況認識モデル学習装置、移動状況認識装置、方法、及びプログラム | |
| US20250200358A1 (en) | Hybrid generative artificial intelligence models | |
| EP4689997A1 (en) | Speculative decoding in autoregressive generative artificial intelligence models | |
| Nguyen et al. | Performance analysis of data parallelism technique in machine learning for human activity recognition using LSTM | |
| US20260044747A1 (en) | Hyperparameter optimization using partitioned machine learning models | |
| US20240346203A1 (en) | Method and system for synthetic event series generation | |
| Munir et al. | Learning fast and slow: Towards inclusive federated learning | |
| Shen et al. | Hierarchical and heterogeneous federated learning via a learning-on-model paradigm | |
| Archambeau et al. | Incremental variational inference for latent dirichlet allocation | |
| US20250077624A1 (en) | Directed graph generation with diffusion kernels | |
| US20260128895A1 (en) | Enhanced distributed zero-knowledge proof generation |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231130 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231130 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241007 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241121 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250114 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250212 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7635234 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |