JP6992064B2 - 擬似リカレントニューラルネットワークに基づくエンコーダ‐デコーダモデル - Google Patents
擬似リカレントニューラルネットワークに基づくエンコーダ‐デコーダモデル Download PDFInfo
- Publication number
- JP6992064B2 JP6992064B2 JP2019523049A JP2019523049A JP6992064B2 JP 6992064 B2 JP6992064 B2 JP 6992064B2 JP 2019523049 A JP2019523049 A JP 2019523049A JP 2019523049 A JP2019523049 A JP 2019523049A JP 6992064 B2 JP6992064 B2 JP 6992064B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- decoder
- encoder
- time series
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/44—Statistical methods, e.g. probability models
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/10—Interfaces, programming languages or software development kits, e.g. for simulating neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1815—Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
- Machine Translation (AREA)
- Complex Calculations (AREA)
- Error Detection And Correction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本出願は、2016年11月4日に出願された米国仮特許出願第62/417,333号「QUASI-RECURRENT NEURAL NETWORKS」(Atty. Docket No. SALE 1180-1/1946PROV)の利益を主張する。この優先仮出願はすべての目的に対しここで参照により援用される。
開示される技術はディープニューラルネットワークを使用する自然言語処理(NLP)に一般に関し、詳細にはNLPタスクにおける計算効率を増加させる擬似リカレントニューラルネットワーク(QRNN)に関する。
長短期記憶(LSTM)などのゲート付きバリアントを含むリカレントニューラルネットワーク(RNN)は、シーケンスモデル化タスクに対するディープラーニング手法では標準のモデルアーキテクチャになっている。RNNは、訓練可能なパラメータを有する関数を隠れ状態に繰り返し適用する。
図2は、QRNN畳み込み層200の動作の一実装を示す。図2は、入力シーケンス
QRNNプーリング層は様々なQRNNプーリング関数を実現する。QRNNプーリング関数は、対応するQRNN畳み込み層により提供される1つ以上のゲートベクトルにより制御される。ゲートベクトルは、複数の時間ステップウィンドウにわたり状態ベクトルを混合すると同時に、状態ベクトルの各要素に対して独立して動作する。実装において、QRNNプーリング関数は、LSTMセルの要素ごとゲートから構築される。他の実装において、QRNNプーリング関数は、入力ゲートなし(no input gate、NIG)バリアント、忘却ゲートなし(no forget gate、NFG)バリアント、出力ゲートなし(no output gate、NOG)バリアント、入力活性化関数なし(no input activation function、NIAF)バリアント、出力活性化関数なし(no output activation function、NOAF)バリアント、結合入力忘却ゲート(coupled input-forget gate、CIFG)バリアント、及びフルゲートリカレント(full gate recurrent、FGR)バリアントなどの、LSTMのバリアントに基づいて構築される。さらに他の実装において、QRNNプーリング関数は、ゲート付きリカレントユニット(gated recurrent unit、GRU)、又は任意の他タイプのRNN、又は任意の他の従来の若しくは将来開発されるニューラルネットワークの動作に基づいて構築される。
単一のゲートベクトルを使用する、「f‐プーリング」と本明細書において呼ばれるQRNNプーリング関数の一実装を定義する以下の数式を考える。
ctは現在の状態ベクトルであり、
ftは現在の忘却状態ベクトルであり、
ct-1は前の状態ベクトルであり、
ztは現在の活性化状態ベクトルであり、
いくつかの実装において、忘却ゲートベクトルに追加で出力ゲートベクトルを使用するQRNNプーリング関数は「fo‐プーリング」と本明細書において呼ばれ、以下の数式により定義される。
htは現在の隠れ状態ベクトルであり、
otは現在の出力状態ベクトルであり、
ctは現在の状態ベクトルであり、
複数のゲートベクトルを使用する、「ifo‐プーリング」と本明細書において呼ばれるQRNNプーリング関数の一実装を定義する以下の数式を考える。
ctは現在の状態ベクトルであり、
ftは現在の忘却状態ベクトルであり、
ct-1は前の状態ベクトルであり、
itは現在の入力状態ベクトルであり、
ztは現在の活性化状態ベクトルであり、
QRNNプーリング層は、f‐プーリング、fo‐プーリング、及びifo‐プーリングなどの1つ以上のQRNNプーリング関数を使用して、m個の時系列ウィンドウの各々について状態ベクトルを算出する。各状態ベクトルは複数の要素を含む。状態ベクトルの各要素は「特徴和(feature sum)」と本明細書において呼ばれる。状態ベクトルの各特徴和は、状態ベクトル内の対応する順序位置により識別される。
c1 1,...,c1 100
ここで、上付き文字は、特定の状態ベクトル内の所与の特徴和の順序位置を識別し、下付き文字は、特定の状態ベクトルと、延長上ではさらに特定の時系列ウィンドウとを識別する。
z1 1,...,z1 100
ここで、上付き文字は、特定の活性化ベクトル内の所与の特徴値の順序位置を識別し、下付き文字は、特定の活性化ベクトルと、延長上ではさらに特定の時系列ウィンドウとを識別する。
f1 1,...,f1 100
ここで、上付き文字は、特定の忘却ゲートベクトル内の所与の特徴値の順序位置を識別し、下付き文字は、特定の忘却ゲートベクトルと、延長上ではさらに特定の時系列ウィンドウとを識別する。
i1 1,...,i1 100
ここで、上付き文字は、特定の入力ゲートベクトル内の所与の特徴値の順序位置を識別し、下付き文字は、特定の入力ゲートベクトルと、延長上ではさらに特定の時系列ウィンドウとを識別する。
o1 1,...,o1 100
ここで、上付き文字は、特定の出力ゲートベクトル内の所与の特徴値の順序位置を識別し、下付き文字は、特定の出力ゲートベクトルと、延長上ではさらに特定の時系列ウィンドウとを識別する。
ct jは現在の状態ベクトルct内のj順序位置における特徴和であり、
ft jは現在の忘却ゲートベクトルft内のj順序位置における特徴値であり、
ct-1 jは前の状態ベクトルct-1内のj順序位置における特徴値であり、
zt jは現在の活性化ベクトルzt内のj順序位置における特徴値であり、
・は乗算を表す。
ct jは現在の状態ベクトルct内のj順序位置における特徴和であり、
ft jは現在の忘却ゲートベクトルft内のj順序位置における特徴値であり、
ct-1 jは前の状態ベクトルct-1内のj順序位置における特徴値であり、
it jは現在の入力ゲートベクトルit内のj順序位置における特徴値であり、
zt jは現在の活性化ベクトルzt内のj順序位置における特徴値であり、
・は乗算を表す。
図9は、ニューラルネットワークのシーケンス対シーケンス(sequence-to-sequence)モデル化において計算効率を増加させるQRNNエンコーダ‐デコーダモデル900の一実装である。モデル900は、QRNNエンコーダ及びQRNNデコーダを含む。QRNNエンコーダは、1つ以上のエンコーダ畳み込み層(902、906など)及び1つ以上のエンコーダプーリング層(904、908など)を含む。少なくとも1つのエンコーダ畳み込み層(902など)が、エンコーダ入力ベクトルの時系列を受信し、時系列ウィンドウについてエンコードされた畳み込みベクトルを同時に出力する。さらに、少なくとも1つのエンコーダプーリング層(904又は908など)が、時系列ウィンドウについてエンコードされた畳み込みベクトルを受信し、現在の時系列ウィンドウについてのエンコードされた状態ベクトル内の特徴和の順序付けられたセットを同時に累算し、時系列ウィンドウの中の各々連続した時系列ウィンドウについてエンコードされた状態ベクトル(922a、922b、又は922cなど)を順次出力する。
QRNNは、3つの異なる自然言語処理(NLP)タスク、すなわちドキュメントレベルセンチメント分類、言語モデル化、及びキャラクタに基づくニューラルネットワーク機械翻訳において、等しい状態ベクトルサイズのLSTMに基づくモデルを上回ると同時に、計算速度を劇的に改善する。状態ベクトルを使用して異なるNLPタスクを実行するこれらのステップは、QRNN100の分類器(例えば、分類器806)又はQRNNエンコーダ‐デコーダモデル900の翻訳器950により具現化される。
擬似リカレントニューラルネットワーク(QRNN)のためのシステム、方法、及び製造品を我々は説明する。実装の1つ以上の特徴が、基本の実装と組み合わせられてよい。相互排他的でない実装は、結合可能であることが教示される。実装の1つ以上の特徴が、他の実装と組み合わせられてよい。本開示は、これらの選択肢をユーザに周期的に注意する。これらの選択肢を繰り返す記載の、いくつかの実装からの省略は、前のセクションにおいて教示された組み合わせを制限するものとみなされるべきでない。これらの記載は、以後参照により以下の実装の各々にここで援用される。
一実装において、開示される技術は、擬似リカレントニューラルネットワーク(略称QRNN)システムを提示する。QRNNシステムは、多数の並列処理コア上で動作する。QRNNシステムは、ニューラルネットワークに基づくシーケンス分類タスクの訓練及び推論段階の間の計算速度を増加させる。
一実装において、開示される技術は、擬似リカレントニューラルネットワーク(略称QRNN)システムを提示する。QRNNシステムは、多数の並列処理コア上で動作する。QRNNシステムは、ソース言語シーケンスをターゲット言語シーケンスに翻訳するニューラルネットワークに基づくシーケンス対シーケンス機械翻訳タスクの訓練及び推論段階の間の計算速度を増加させる。
図15は、擬似リカレントニューラルネットワーク(QRNN)100を実現するために使用できるコンピュータシステム1500の簡略ブロック図である。コンピュータシステム1500は、バスサブシステム1522を介して複数の周辺デバイスと通信する少なくとも1つの中央処理ユニット(CPU)1524を含む。これらの周辺デバイスは、例えばメモリデバイス及びファイルストレージサブシステム1518を含むストレージサブシステム1510、ユーザインターフェース入力デバイス1520、ユーザインターフェース出力デバイス1528、及びネットワークインターフェースサブシステム1526を含んでよい。入力及び出力デバイスは、コンピュータシステム1500とのユーザ相互作用を可能にする。ネットワークインターフェースサブシステム1526は、他のコンピュータシステム内の対応するインターフェースデバイスへのインターフェースを含む、外部ネットワークへのインターフェースを提供する。
Claims (26)
- 複数の並列処理コア上で動作する、ソース言語シーケンスをターゲット言語シーケンスに翻訳するニューラルネットワークに基づくシーケンス対シーケンス機械翻訳タスクの訓練及び推論段階の間の計算速度を増加させる擬似リカレントニューラルネットワーク(QRNN)システムであって、
少なくとも1つのエンコーダ畳み込み層と少なくとも1つのエンコーダプーリング層と少なくとも1つのエンコーダ出力ゲートとを含むQRNNエンコーダであって、
前記エンコーダ畳み込み層は、
ソース言語ベクトルの複数の時系列の中のソース言語ベクトルの時系列のセット上のエンコーダ時系列ウィンドウ内のソース言語ベクトルの並列畳み込みのためのエンコーダ畳み込みフィルタバンク、及び
前記並列畳み込みに基づいて前記エンコーダ時系列ウィンドウの各々について前記エンコーダの畳み込みベクトルを同時に出力するエンコーダ畳み込みベクトル生成器
を含み、
前記エンコーダプーリング層は、前記エンコーダの前記畳み込みベクトルの成分の特徴値を順序位置ごとベースで同時に累算することにより各々連続したエンコーダ時系列ウィンドウについて順次生成される前記エンコーダの各状態ベクトル内の特徴和の順序付けられたセットの並列累算のための累算器を含み、
前記エンコーダ出力ゲートは、前記エンコーダの状態ベクトルに出力ゲートベクトルを適用し、それにより前記エンコーダの隠れ状態ベクトルを生成するエンコーダ隠れ状態生成器を含む、
QRNNエンコーダと、
少なくとも1つのデコーダ畳み込み層と少なくとも1つのデコーダプーリング層と少なくとも1つの注目器とを含むQRNNデコーダであって、
前記デコーダ畳み込み層は、
デコーダ入力ベクトルの複数の時系列の中のデコーダ入力ベクトルの時系列のセット上のデコーダ時系列ウィンドウ内のデコーダ入力ベクトルの並列畳み込みのためのデコーダ畳み込みフィルタバンクであり、
最初のデコーダ時系列ウィンドウにおいて、前記デコーダ畳み込みフィルタバンクは、翻訳開始トークンである単一のデコーダ入力ベクトルのみを畳み込み、
連続したデコーダ時系列ウィンドウにおいて、前記デコーダ畳み込みフィルタバンクは、前記翻訳開始トークンと前に発行されたターゲット言語ベクトルとを含む前記デコーダ入力ベクトルを畳み込む、畳み込みフィルタバンク、及び
前記並列畳み込みに基づいて前記デコーダ時系列ウィンドウの各々について前記デコーダの畳み込みベクトルを同時に出力するデコーダ畳み込みベクトル生成器
を含み、
前記デコーダプーリング層は、前記デコーダの前記畳み込みベクトルの成分の特徴値を順序位置ごとベースで同時に累算することにより各々連続したデコーダ時系列ウィンドウについて順次生成される前記デコーダの各状態ベクトル内の特徴和の順序付けられたセットの並列累算のための累算器を含み、
前記注目器は、
前記エンコーダの前記隠れ状態ベクトルと前記デコーダの状態ベクトルとの間のペアごと類似度スコアを決定する状態比較器、
前記エンコーダ時系列ウィンドウに沿って生成された指数関数的に正規化された類似度スコアシーケンスによりスケーリングされた前記エンコーダの前記隠れ状態ベクトルの凸結合として前記エンコーダの前記隠れ状態ベクトルの文脈サマリを作成するエンコーディングミキサ、
前記文脈サマリ及び前記デコーダの前記状態ベクトルを線形に射影するパーセプトロン、
前記線形に射影された文脈サマリ及び前記デコーダの状態ベクトルを結合する連結器、及び
前記結合された線形に射影された文脈サマリ及び前記デコーダの状態ベクトルに出力ゲートベクトルを適用し、それにより前記デコーダの隠れ状態ベクトルを生成するデコーダ出力ゲート、
を含む、QRNNデコーダと、
前記デコードされた隠れ状態ベクトルに基づいてターゲット言語ベクトルを発行することにより前記シーケンス対シーケンス機械翻訳タスクを実行する翻訳器と、
を含むQRNNシステム。 - 各畳み込みベクトルは、活性化ベクトル内の特徴値に1つ以上のゲートベクトル内の特徴値を要素ごとの順序位置ベースでパラメータとしてそれぞれ適用するために、前記活性化ベクトル内及び前記ゲートベクトル内の前記特徴値を含む、請求項1に記載のQRNNシステム。
- 各特徴和は、現在の時系列ウィンドウについて出力された活性化ベクトル内の所与の順序位置における特徴値と、前記現在の時系列ウィンドウについて出力された1つ以上のゲートベクトル内の前記所与の順序位置における1つ以上の特徴値と、前の時系列ウィンドウについて累算された状態ベクトル内の前記所与の順序位置における特徴和とに依存して前記累算器により累算される、請求項1乃至2のうちいずれか1項に記載のQRNNシステム。
- 最後のエンコーダ時系列ウィンドウについて前記エンコーダ隠れ状態生成器により生成された前記エンコーダの最後の隠れ状態ベクトルを用いて前記デコーダプーリング層への各入力を補足する補足器、をさらに含む請求項1乃至3のうちいずれか1項に記載のQRNNシステム。
- 前記状態比較器は、前記エンコーダの前記隠れ状態ベクトルと前記デコーダの状態ベクトルとの間のペアごと類似度スコアを決定するためにドット積を使用する、請求項1乃至4のうちいずれか1項に記載のQRNNシステム。
- 前記ソース言語シーケンス及び前記ターゲット言語シーケンスはワードレベルシーケンスである、請求項1乃至5のうちいずれか1項に記載のQRNNシステム。
- 前記ソース言語シーケンス及び前記ターゲット言語シーケンスはキャラクタレベルシーケンスである、請求項1乃至6のうちいずれか1項に記載のQRNNシステム。
- ゲートベクトルが忘却ゲートベクトルであり、
各プーリング層は、前の時系列ウィンドウについて累算された前記状態ベクトルからの情報と現在の時系列ウィンドウについての前記活性化ベクトルからの情報との累算を制御するための、前記現在の時系列ウィンドウについての忘却ゲートベクトルを含む、請求項2に記載のQRNNシステム。 - ゲートベクトルが入力ゲートベクトルであり、
各プーリング層は、現在の時系列ウィンドウについての前記活性化ベクトルからの情報の累算を制御するための、前記現在の時系列ウィンドウについての入力ゲートベクトルを含む、請求項2に記載のQRNNシステム。 - ゲートベクトルが出力ゲートベクトルであり、
各プーリング層は、現在の時系列ウィンドウについての前記状態ベクトルからの情報の累算を制御するための、前記現在の時系列ウィンドウについての出力ゲートベクトルを含む、請求項2に記載のQRNNシステム。 - 前記現在の時系列ウィンドウについての前記忘却ゲートベクトル内の所与の順序位置におけるそれぞれの特徴値が1であるよう要求することにより各畳み込み層及び各プーリング層を正則化し、それにより、前記前の時系列ウィンドウについて同時に累算された前記状態ベクトル内の所与の順序位置におけるそれぞれの特徴和に一致する前記現在の時系列ウィンドウについての前記状態ベクトル内の前記所与の順序位置における特徴和のランダムサブセットを生成する正則化器、をさらに含む請求項8に記載のQRNNシステム。
- 複数の並列処理コア上で動作する、ソース言語シーケンスをターゲット言語シーケンスに翻訳するニューラルネットワークに基づくシーケンス対シーケンス機械翻訳タスクの訓練及び推論段階の間の計算速度を増加させる擬似リカレントニューラルネットワーク(QRNN)システムであって、
QRNNエンコーダであって、ソース言語ベクトルの複数の時系列の中のソース言語ベクトルの時系列のセット上のエンコーダ時系列ウィンドウ内のソース言語ベクトルの並列畳み込みのための少なくとも1つのエンコーダ畳み込み層であり、それにより前記エンコーダ時系列ウィンドウの各々について前記QRNNエンコーダの畳み込みベクトルを同時に出力する、エンコーダ畳み込み層と、各々連続したエンコーダ時系列ウィンドウについて順次生成される前記エンコーダの各状態ベクトル内の特徴和の順序付けられたセットの並列累算のための少なくとも1つのエンコーダプーリング層と、前記エンコーダの状態ベクトルに出力ゲートベクトルを適用し、それにより前記エンコーダの隠れ状態ベクトルを生成するエンコーダ隠れ状態生成器と、を含むQRNNエンコーダと、
QRNNデコーダであって、デコーダ入力ベクトルの複数の時系列の中のデコーダ入力ベクトルの時系列のセット上のデコーダ時系列ウィンドウ内のデコーダ入力ベクトルの並列畳み込みのための少なくとも1つのデコーダ畳み込み層であり、それにより前記デコーダ時系列ウィンドウの各々について前記QRNNデコーダの畳み込みベクトルを同時に出力する、デコーダ畳み込み層と、各々連続したデコーダ時系列ウィンドウについて順次生成される前記デコーダの各状態ベクトル内の特徴和の順序付けられたセットの並列累算のための少なくとも1つのデコーダプーリング層と、を含むQRNNデコーダと、
前記エンコーダの前記隠れ状態ベクトルの文脈サマリを前記デコーダの状態ベクトルと結合することにより前記デコーダの隠れ状態ベクトルを作成する注目器と、
前記デコードされた隠れ状態ベクトルに基づいてターゲット言語ベクトルを発行することにより前記シーケンス対シーケンス機械翻訳タスクを実行する翻訳器と、
を含むQRNNシステム。 - 最初のデコーダ時系列ウィンドウにおいて、翻訳開始トークンである単一のデコーダ入力ベクトルのみを畳み込むデコーダ畳み込みフィルタバンク、をさらに含む請求項12に記載のQRNNシステム。
- 最初のデコーダ時系列ウィンドウにおいて、前記デコーダ畳み込みフィルタバンクは、翻訳開始トークンである単一のデコーダ入力ベクトルのみを畳み込む、請求項13に記載のQRNNシステム。
- 前記注目器は、前記エンコーダの前記隠れ状態ベクトルと前記デコーダの前記隠れ状態ベクトルとの間のペアごと類似度スコアを決定する状態比較器をさらに含む、請求項13乃至14のうちいずれか1項に記載のQRNNシステム。
- 前記注目器は、前記エンコーダ時系列ウィンドウに沿って生成された指数関数的に正規化された類似度スコアシーケンスによりスケーリングされた前記エンコーダの前記隠れ状態ベクトルの凸結合として前記エンコーダの前記隠れ状態ベクトルの前記文脈サマリを作成するエンコーディングミキサをさらに含む、請求項13乃至15のうちいずれか1項に記載のQRNNシステム。
- 前記注目器は、前記文脈サマリ及び前記デコーダの前記状態ベクトルを線形に射影するパーセプトロンをさらに含む、請求項13乃至16のうちいずれか1項に記載のQRNNシステム。
- 前記注目器は、前記線形に射影された文脈サマリ及び前記デコーダの状態ベクトルを結合する連結器をさらに含む、請求項17に記載のQRNNシステム。
- 前記注目器は、前記結合された線形に射影された文脈サマリ及び前記デコーダの状態ベクトルに出力ゲートベクトルを適用し、それにより前記デコーダの前記隠れ状態ベクトルを生成するデコーダ出力ゲートをさらに含む、請求項18に記載のQRNNシステム。
- ソース言語シーケンスをターゲット言語シーケンスに翻訳するニューラルネットワークに基づくシーケンス対シーケンス機械翻訳タスクの訓練及び推論段階の間の計算速度を増加させる、コンピュータにより実現される方法であって、
エンコーダを使用して、ソース言語ベクトルの複数の時系列の中のソース言語ベクトルの時系列のセット上のエンコーダ時系列ウィンドウ内のソース言語ベクトルを並列に畳み込んで、前記エンコーダ時系列ウィンドウの各々について前記エンコーダの畳み込みベクトルを同時に出力するステップと、各々連続したエンコーダ時系列ウィンドウについて順次生成される前記エンコーダの各状態ベクトル内の特徴和の順序付けられたセットを並列に累算するステップと、前記エンコーダの状態ベクトルに出力ゲートベクトルを適用して前記エンコーダの隠れ状態ベクトルを生成するステップと、
デコーダを使用して、デコーダ入力ベクトルの複数の時系列の中のデコーダ入力ベクトルの時系列のセット上のデコーダ時系列ウィンドウ内のデコーダ入力ベクトルを並列に畳み込んで、前記デコーダ時系列ウィンドウの各々について前記デコーダの畳み込みベクトルを同時に出力するステップと、各々連続したデコーダ時系列ウィンドウについて順次生成される前記デコーダの各状態ベクトル内の特徴和の順序付けられたセットを並列に累算するステップと、
前記エンコーダの前記隠れ状態ベクトルの文脈サマリを前記デコーダの前記状態ベクトルと結合することにより前記デコーダの隠れ状態ベクトルを作成するステップと、
前記デコードされた隠れ状態ベクトルに基づいてターゲット言語ベクトルを発行することにより前記シーケンス対シーケンス機械翻訳タスクを実行するステップと、
を含む方法。 - 複数の並列処理コア上で動作する、ニューラルネットワークに基づくシーケンス対シーケンス分類タスクの訓練及び推論段階の間の計算速度を増加させる擬似リカレントニューラルネットワーク(QRNN)システムであって、
少なくとも1つのエンコーダ畳み込み層と少なくとも1つのエンコーダプーリング層と少なくとも1つのエンコーダ出力ゲートとを含むQRNNエンコーダであって、
前記エンコーダ畳み込み層は、
エンコーダ入力ベクトルの複数の時系列の中のエンコーダ入力ベクトルの時系列のセット上のエンコーダ時系列ウィンドウ内のエンコーダ入力ベクトルの並列畳み込みのためのエンコーダ畳み込みフィルタバンク、及び
前記並列畳み込みに基づいて前記エンコーダ時系列ウィンドウの各々について前記エンコーダの畳み込みベクトルを同時に出力するエンコーダ畳み込みベクトル生成器
を含み、
前記エンコーダプーリング層は、前記エンコーダの前記畳み込みベクトルの成分の特徴値を順序位置ごとベースで同時に累算することにより各々連続したエンコーダ時系列ウィンドウについて順次生成される前記エンコーダの各状態ベクトル内の特徴和の順序付けられたセットの並列累算のための累算器を含み、
前記エンコーダ出力ゲートは、前記エンコーダの状態ベクトルに出力ゲートベクトルを適用し、それにより前記エンコーダの隠れ状態ベクトルを生成するエンコーダ隠れ状態生成器を含む、
QRNNエンコーダと、
少なくとも1つのデコーダ畳み込み層と少なくとも1つのデコーダプーリング層と少なくとも1つの注目器とを含むQRNNデコーダであって、
前記デコーダ畳み込み層は、
デコーダ入力ベクトルの複数の時系列の中のデコーダ入力ベクトルの時系列のセット上のデコーダ時系列ウィンドウ内のデコーダ入力ベクトルの並列畳み込みのためのデコーダ畳み込みフィルタバンクであり、
最初のデコーダ時系列ウィンドウにおいて、前記デコーダ畳み込みフィルタバンクは、翻訳開始トークンである単一のデコーダ入力ベクトルのみを畳み込み、
連続したデコーダ時系列ウィンドウにおいて、前記デコーダ畳み込みフィルタバンクは、前記翻訳開始トークンと前に発行されたターゲット言語ベクトルとを含む前記デコーダ入力ベクトルを畳み込む、畳み込みフィルタバンク、及び
前記並列畳み込みに基づいて前記デコーダ時系列ウィンドウの各々について前記デコーダの畳み込みベクトルを同時に出力するデコーダ畳み込みベクトル生成器
を含み、
前記デコーダプーリング層は、前記デコーダの前記畳み込みベクトルの成分の特徴値を順序位置ごとベースで同時に累算することにより各々連続したデコーダ時系列ウィンドウについて順次生成される前記デコーダの各状態ベクトル内の特徴和の順序付けられたセットの並列累算のための累算器を含み、
前記注目器は、
前記エンコーダの前記隠れ状態ベクトルと前記デコーダの状態ベクトルとの間のペアごと類似度スコアを決定する状態比較器、
前記エンコーダ時系列ウィンドウに沿って生成された指数関数的に正規化された類似度スコアシーケンスによりスケーリングされた前記エンコーダの前記隠れ状態ベクトルの凸結合として前記エンコーダの前記隠れ状態ベクトルの文脈サマリを作成するエンコーディングミキサ、
前記文脈サマリ及び前記デコーダの前記状態ベクトルを線形に射影するパーセプトロン、
前記線形に射影された文脈サマリ及び前記デコーダの状態ベクトルを結合する連結器、及び
前記結合された線形に射影された文脈サマリ及び前記デコーダの状態ベクトルに出力ゲートベクトルを適用し、それにより前記デコーダの隠れ状態ベクトルを生成するデコーダ出力ゲート、
を含む、QRNNデコーダと、
前記デコードされた隠れ状態ベクトルを使用してシーケンス対シーケンス分類タスクを実行する分類器と、
を含むQRNNシステム。 - 前記シーケンス対シーケンス分類タスクは機械翻訳である、請求項21に記載のQRNNシステム。
- 前記シーケンス対シーケンス分類タスクは発話認識である、請求項21に記載のQRNNシステム。
- 前記シーケンス対シーケンス分類タスクはテキスト・ツー・スピーチ合成である、請求項21に記載のQRNNシステム。
- 前記シーケンス対シーケンス分類タスクは質問応答である、請求項21に記載のQRNNシステム。
- 前記シーケンス対シーケンス分類タスクは抽象テキスト要約である、請求項21に記載のQRNNシステム。
Applications Claiming Priority (9)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201662418075P | 2016-11-04 | 2016-11-04 | |
| US201662417333P | 2016-11-04 | 2016-11-04 | |
| US62/418,075 | 2016-11-04 | ||
| US62/417,333 | 2016-11-04 | ||
| US15/420,801 US11080595B2 (en) | 2016-11-04 | 2017-01-31 | Quasi-recurrent neural network based encoder-decoder model |
| US15/420,710 | 2017-01-31 | ||
| US15/420,801 | 2017-01-31 | ||
| US15/420,710 US20180129937A1 (en) | 2016-11-04 | 2017-01-31 | Quasi-recurrent neural network |
| PCT/US2017/060051 WO2018085724A1 (en) | 2016-11-04 | 2017-11-03 | Quasi-recurrent neural network based encoder-decoder model |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020501231A JP2020501231A (ja) | 2020-01-16 |
| JP6992064B2 true JP6992064B2 (ja) | 2022-01-13 |
Family
ID=62064602
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019523049A Active JP6992064B2 (ja) | 2016-11-04 | 2017-11-03 | 擬似リカレントニューラルネットワークに基づくエンコーダ‐デコーダモデル |
| JP2019522910A Active JP6903752B2 (ja) | 2016-11-04 | 2017-11-03 | 擬似リカレントニューラルネットワーク |
| JP2021103993A Active JP7233475B2 (ja) | 2016-11-04 | 2021-06-23 | 擬似リカレントニューラルネットワーク |
Family Applications After (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019522910A Active JP6903752B2 (ja) | 2016-11-04 | 2017-11-03 | 擬似リカレントニューラルネットワーク |
| JP2021103993A Active JP7233475B2 (ja) | 2016-11-04 | 2021-06-23 | 擬似リカレントニューラルネットワーク |
Country Status (7)
| Country | Link |
|---|---|
| US (3) | US11080595B2 (ja) |
| EP (2) | EP3535700B1 (ja) |
| JP (3) | JP6992064B2 (ja) |
| CN (2) | CN109923559B (ja) |
| AU (3) | AU2017355537B2 (ja) |
| CA (2) | CA3040153C (ja) |
| WO (2) | WO2018085724A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021166073A (ja) * | 2016-11-04 | 2021-10-14 | セールスフォース ドット コム インコーポレイティッド | 擬似リカレントニューラルネットワーク |
Families Citing this family (164)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10339445B2 (en) * | 2016-10-10 | 2019-07-02 | Gyrfalcon Technology Inc. | Implementation of ResNet in a CNN based digital integrated circuit |
| US10360470B2 (en) * | 2016-10-10 | 2019-07-23 | Gyrfalcon Technology Inc. | Implementation of MobileNet in a CNN based digital integrated circuit |
| US10366328B2 (en) * | 2017-09-19 | 2019-07-30 | Gyrfalcon Technology Inc. | Approximating fully-connected layers with multiple arrays of 3x3 convolutional filter kernels in a CNN based integrated circuit |
| US10855550B2 (en) * | 2016-11-16 | 2020-12-01 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
| US10565305B2 (en) | 2016-11-18 | 2020-02-18 | Salesforce.Com, Inc. | Adaptive attention model for image captioning |
| KR102896234B1 (ko) * | 2016-12-16 | 2025-12-08 | 삼성전자주식회사 | 인식 방법 및 인식 장치 |
| US11354565B2 (en) | 2017-03-15 | 2022-06-07 | Salesforce.Com, Inc. | Probability-based guider |
| CA3206223A1 (en) | 2017-03-29 | 2018-10-04 | Google Llc | End-to-end text-to-speech conversion |
| US10997502B1 (en) | 2017-04-13 | 2021-05-04 | Cadence Design Systems, Inc. | Complexity optimization of trainable networks |
| US10565318B2 (en) | 2017-04-14 | 2020-02-18 | Salesforce.Com, Inc. | Neural machine translation with latent tree attention |
| US11386327B2 (en) | 2017-05-18 | 2022-07-12 | Salesforce.Com, Inc. | Block-diagonal hessian-free optimization for recurrent and convolutional neural networks |
| US10817650B2 (en) * | 2017-05-19 | 2020-10-27 | Salesforce.Com, Inc. | Natural language processing using context specific word vectors |
| CN107633842B (zh) * | 2017-06-12 | 2018-08-31 | 平安科技(深圳)有限公司 | 语音识别方法、装置、计算机设备及存储介质 |
| US11113599B2 (en) * | 2017-06-22 | 2021-09-07 | Adobe Inc. | Image captioning utilizing semantic text modeling and adversarial learning |
| JP2020527556A (ja) | 2017-07-10 | 2020-09-10 | エスアールアイ インターナショナルSRI International | がん治療用ペプチドサポリン複合体 |
| US10635858B2 (en) * | 2017-09-11 | 2020-04-28 | Nec Corporation | Electronic message classification and delivery using a neural network architecture |
| US11604956B2 (en) | 2017-10-27 | 2023-03-14 | Salesforce.Com, Inc. | Sequence-to-sequence prediction using a neural network model |
| US10592767B2 (en) | 2017-10-27 | 2020-03-17 | Salesforce.Com, Inc. | Interpretable counting in visual question answering |
| US11562287B2 (en) | 2017-10-27 | 2023-01-24 | Salesforce.Com, Inc. | Hierarchical and interpretable skill acquisition in multi-task reinforcement learning |
| US11928600B2 (en) | 2017-10-27 | 2024-03-12 | Salesforce, Inc. | Sequence-to-sequence prediction using a neural network model |
| US11170287B2 (en) | 2017-10-27 | 2021-11-09 | Salesforce.Com, Inc. | Generating dual sequence inferences using a neural network model |
| US10573295B2 (en) | 2017-10-27 | 2020-02-25 | Salesforce.Com, Inc. | End-to-end speech recognition with policy learning |
| US10542270B2 (en) | 2017-11-15 | 2020-01-21 | Salesforce.Com, Inc. | Dense video captioning |
| US11276002B2 (en) | 2017-12-20 | 2022-03-15 | Salesforce.Com, Inc. | Hybrid training of deep networks |
| US10776581B2 (en) | 2018-02-09 | 2020-09-15 | Salesforce.Com, Inc. | Multitask learning as question answering |
| US11227218B2 (en) | 2018-02-22 | 2022-01-18 | Salesforce.Com, Inc. | Question answering from minimal context over documents |
| US10929607B2 (en) | 2018-02-22 | 2021-02-23 | Salesforce.Com, Inc. | Dialogue state tracking using a global-local encoder |
| US11106182B2 (en) | 2018-03-16 | 2021-08-31 | Salesforce.Com, Inc. | Systems and methods for learning for domain adaptation |
| US10783875B2 (en) | 2018-03-16 | 2020-09-22 | Salesforce.Com, Inc. | Unsupervised non-parallel speech domain adaptation using a multi-discriminator adversarial network |
| US11062240B2 (en) * | 2018-03-30 | 2021-07-13 | Accenture Global Solutions Limited | Determining optimal workforce types to fulfill occupational roles in an organization based on occupational attributes |
| US11783167B1 (en) * | 2018-04-20 | 2023-10-10 | Perceive Corporation | Data transfer for non-dot product computations on neural network inference circuit |
| US10887182B1 (en) * | 2018-05-10 | 2021-01-05 | Hrl Laboratories, Llc | System and method for pairwise network alignment |
| US11600194B2 (en) | 2018-05-18 | 2023-03-07 | Salesforce.Com, Inc. | Multitask learning as question answering |
| US10909157B2 (en) * | 2018-05-22 | 2021-02-02 | Salesforce.Com, Inc. | Abstraction of text summarization |
| US11631009B2 (en) | 2018-05-23 | 2023-04-18 | Salesforce.Com, Inc | Multi-hop knowledge graph reasoning with reward shaping |
| CN108874978B (zh) * | 2018-06-08 | 2021-09-10 | 杭州一知智能科技有限公司 | 一基于分层适应性分段网络解决会议内容摘要任务的方法 |
| CN109447305B (zh) * | 2018-06-23 | 2021-09-07 | 四川大学 | 一种基于量子加权长短时记忆神经网络的趋势预测方法 |
| US12056594B2 (en) * | 2018-06-27 | 2024-08-06 | International Business Machines Corporation | Low precision deep neural network enabled by compensation instructions |
| CN118737132A (zh) * | 2018-07-13 | 2024-10-01 | 谷歌有限责任公司 | 端到端流关键词检出 |
| CN109035233B (zh) * | 2018-07-24 | 2021-09-21 | 西安邮电大学 | 视觉注意力网络系统及工件表面缺陷检测方法 |
| US10720151B2 (en) | 2018-07-27 | 2020-07-21 | Deepgram, Inc. | End-to-end neural networks for speech recognition and classification |
| CN109241377B (zh) * | 2018-08-30 | 2021-04-23 | 山西大学 | 一种基于深度学习话题信息增强的文本文档表示方法和装置 |
| US10970486B2 (en) | 2018-09-18 | 2021-04-06 | Salesforce.Com, Inc. | Using unstructured input to update heterogeneous data stores |
| US11436481B2 (en) | 2018-09-18 | 2022-09-06 | Salesforce.Com, Inc. | Systems and methods for named entity recognition |
| CN110929837B (zh) * | 2018-09-19 | 2024-05-10 | 北京搜狗科技发展有限公司 | 一种联想词预测方法及装置 |
| US11029694B2 (en) | 2018-09-27 | 2021-06-08 | Salesforce.Com, Inc. | Self-aware visual-textual co-grounded navigation agent |
| US10872601B1 (en) * | 2018-09-27 | 2020-12-22 | Amazon Technologies, Inc. | Natural language processing |
| US11514915B2 (en) | 2018-09-27 | 2022-11-29 | Salesforce.Com, Inc. | Global-to-local memory pointer networks for task-oriented dialogue |
| US11645509B2 (en) | 2018-09-27 | 2023-05-09 | Salesforce.Com, Inc. | Continual neural network learning via explicit structure learning |
| US11087177B2 (en) | 2018-09-27 | 2021-08-10 | Salesforce.Com, Inc. | Prediction-correction approach to zero shot learning |
| US10956704B2 (en) * | 2018-11-07 | 2021-03-23 | Advanced New Technologies Co., Ltd. | Neural networks for biometric recognition |
| CN109543180B (zh) * | 2018-11-08 | 2020-12-04 | 中山大学 | 一种基于注意力机制的文本情感分析方法 |
| CN109685252B (zh) * | 2018-11-30 | 2023-04-07 | 西安工程大学 | 基于循环神经网络和多任务学习模型的建筑能耗预测方法 |
| US10963652B2 (en) | 2018-12-11 | 2021-03-30 | Salesforce.Com, Inc. | Structured text translation |
| US11822897B2 (en) | 2018-12-11 | 2023-11-21 | Salesforce.Com, Inc. | Systems and methods for structured text translation with tag alignment |
| CN109815484B (zh) * | 2018-12-21 | 2022-03-15 | 平安科技(深圳)有限公司 | 基于交叉注意力机制的语义相似度匹配方法及其匹配装置 |
| CN111476039B (zh) * | 2019-01-04 | 2023-06-30 | 深圳永德利科技股份有限公司 | 智能车载系统的即时语言翻译方法及相关产品 |
| US11922323B2 (en) | 2019-01-17 | 2024-03-05 | Salesforce, Inc. | Meta-reinforcement learning gradient estimation with variance reduction |
| US11250842B2 (en) | 2019-01-27 | 2022-02-15 | Min Ku Kim | Multi-dimensional parsing method and system for natural language processing |
| US11568306B2 (en) | 2019-02-25 | 2023-01-31 | Salesforce.Com, Inc. | Data privacy protected machine learning systems |
| JP7293729B2 (ja) * | 2019-03-01 | 2023-06-20 | 富士フイルムビジネスイノベーション株式会社 | 学習装置、情報出力装置、及びプログラム |
| US11003867B2 (en) | 2019-03-04 | 2021-05-11 | Salesforce.Com, Inc. | Cross-lingual regularization for multilingual generalization |
| US11366969B2 (en) | 2019-03-04 | 2022-06-21 | Salesforce.Com, Inc. | Leveraging language models for generating commonsense explanations |
| US11580445B2 (en) | 2019-03-05 | 2023-02-14 | Salesforce.Com, Inc. | Efficient off-policy credit assignment |
| US11087092B2 (en) | 2019-03-05 | 2021-08-10 | Salesforce.Com, Inc. | Agent persona grounded chit-chat generation framework |
| US11120328B1 (en) * | 2019-03-15 | 2021-09-14 | Facebook, Inc. | Systems and methods for reducing power consumption of convolution operations for artificial neural networks |
| US10902289B2 (en) | 2019-03-22 | 2021-01-26 | Salesforce.Com, Inc. | Two-stage online detection of action start in untrimmed videos |
| CN109979432B (zh) * | 2019-04-02 | 2021-10-08 | 科大讯飞股份有限公司 | 一种方言翻译方法及装置 |
| CN110032633B (zh) * | 2019-04-17 | 2021-03-23 | 腾讯科技(深圳)有限公司 | 多轮对话处理方法、装置和设备 |
| US11281863B2 (en) | 2019-04-18 | 2022-03-22 | Salesforce.Com, Inc. | Systems and methods for unifying question answering and text classification via span extraction |
| US11334467B2 (en) | 2019-05-03 | 2022-05-17 | International Business Machines Corporation | Representing source code in vector space to detect errors |
| US11487939B2 (en) | 2019-05-15 | 2022-11-01 | Salesforce.Com, Inc. | Systems and methods for unsupervised autoregressive text compression |
| US11562251B2 (en) | 2019-05-16 | 2023-01-24 | Salesforce.Com, Inc. | Learning world graphs to accelerate hierarchical reinforcement learning |
| US11620572B2 (en) | 2019-05-16 | 2023-04-04 | Salesforce.Com, Inc. | Solving sparse reward tasks using self-balancing shaped rewards |
| US11604965B2 (en) | 2019-05-16 | 2023-03-14 | Salesforce.Com, Inc. | Private deep learning |
| US11775775B2 (en) | 2019-05-21 | 2023-10-03 | Salesforce.Com, Inc. | Systems and methods for reading comprehension for a question answering task |
| US11669712B2 (en) | 2019-05-21 | 2023-06-06 | Salesforce.Com, Inc. | Robustness evaluation via natural typos |
| US11687588B2 (en) | 2019-05-21 | 2023-06-27 | Salesforce.Com, Inc. | Weakly supervised natural language localization networks for video proposal prediction based on a text query |
| US11657269B2 (en) | 2019-05-23 | 2023-05-23 | Salesforce.Com, Inc. | Systems and methods for verification of discriminative models |
| CN110210024B (zh) * | 2019-05-28 | 2024-04-02 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、装置及存储介质 |
| CN110263916B (zh) * | 2019-05-31 | 2021-09-10 | 腾讯科技(深圳)有限公司 | 数据处理方法和装置、存储介质及电子装置 |
| CN110390952B (zh) * | 2019-06-21 | 2021-10-22 | 江南大学 | 基于双特征2-DenseNet并联的城市声音事件分类方法 |
| CN110197665B (zh) * | 2019-06-25 | 2021-07-09 | 广东工业大学 | 一种用于公安刑侦监听的语音分离与跟踪方法 |
| US20200410353A1 (en) * | 2019-06-25 | 2020-12-31 | Neuchips Corporation | Harmonic densely connecting method of block of convolutional neural network model and system thereof |
| CN112151003B (zh) * | 2019-06-27 | 2025-01-28 | 百度在线网络技术(北京)有限公司 | 并行语音合成方法、装置、设备以及计算机可读存储介质 |
| CN112151024B (zh) * | 2019-06-28 | 2023-09-22 | 声音猎手公司 | 用于生成语音音频的经编辑的转录的方法和装置 |
| CN110377918B (zh) * | 2019-07-15 | 2020-08-28 | 昆明理工大学 | 融合句法解析树的汉-越神经机器翻译方法 |
| US11836613B2 (en) * | 2019-07-17 | 2023-12-05 | International Business Machines Corporation | Neural programmer interpreters with modeled primitives |
| KR102205430B1 (ko) * | 2019-08-05 | 2021-01-20 | 에스케이텔레콤 주식회사 | 인공 신경망을 이용한 학습 방법 |
| CN110263923B (zh) * | 2019-08-12 | 2019-11-29 | 上海燧原智能科技有限公司 | 张量卷积计算方法及系统 |
| KR102232871B1 (ko) * | 2019-08-14 | 2021-03-26 | 펜타시큐리티시스템 주식회사 | Can 기반의 통신 네트워크에서 신호 검출 방법 및 장치 |
| US11615240B2 (en) | 2019-08-15 | 2023-03-28 | Salesforce.Com, Inc | Systems and methods for a transformer network with tree-based attention for natural language processing |
| US20210056220A1 (en) * | 2019-08-22 | 2021-02-25 | Mediatek Inc. | Method for improving confidentiality protection of neural network model |
| CN110797018B (zh) * | 2019-08-28 | 2022-03-25 | 腾讯科技(深圳)有限公司 | 语音识别方法及装置、介质和设备 |
| CN110728991B (zh) * | 2019-09-06 | 2022-03-01 | 南京工程学院 | 一种改进的录音设备识别算法 |
| US11568000B2 (en) | 2019-09-24 | 2023-01-31 | Salesforce.Com, Inc. | System and method for automatic task-oriented dialog system |
| US11599792B2 (en) | 2019-09-24 | 2023-03-07 | Salesforce.Com, Inc. | System and method for learning with noisy labels as semi-supervised learning |
| US11640527B2 (en) | 2019-09-25 | 2023-05-02 | Salesforce.Com, Inc. | Near-zero-cost differentially private deep learning with teacher ensembles |
| US11074438B2 (en) | 2019-10-01 | 2021-07-27 | Toyota Research Institute, Inc. | Disentangling human dynamics for pedestrian locomotion forecasting with noisy supervision |
| KR20210044056A (ko) | 2019-10-14 | 2021-04-22 | 삼성전자주식회사 | 중복 토큰 임베딩을 이용한 자연어 처리 방법 및 장치 |
| KR20210043995A (ko) * | 2019-10-14 | 2021-04-22 | 삼성전자주식회사 | 모델 학습 방법 및 장치, 및 시퀀스 인식 방법 |
| US11620515B2 (en) | 2019-11-07 | 2023-04-04 | Salesforce.Com, Inc. | Multi-task knowledge distillation for language model |
| CN110889509B (zh) * | 2019-11-11 | 2023-04-28 | 安徽超清科技股份有限公司 | 一种基于梯度动量加速的联合学习方法及装置 |
| US11347708B2 (en) | 2019-11-11 | 2022-05-31 | Salesforce.Com, Inc. | System and method for unsupervised density based table structure identification |
| US11288438B2 (en) | 2019-11-15 | 2022-03-29 | Salesforce.Com, Inc. | Bi-directional spatial-temporal reasoning for video-grounded dialogues |
| US11334766B2 (en) | 2019-11-15 | 2022-05-17 | Salesforce.Com, Inc. | Noise-resistant object detection with noisy annotations |
| US11922303B2 (en) | 2019-11-18 | 2024-03-05 | Salesforce, Inc. | Systems and methods for distilled BERT-based training model for text classification |
| US11481636B2 (en) | 2019-11-18 | 2022-10-25 | Salesforce.Com, Inc. | Systems and methods for out-of-distribution classification |
| US11487999B2 (en) | 2019-12-09 | 2022-11-01 | Salesforce.Com, Inc. | Spatial-temporal reasoning through pretrained language models for video-grounded dialogues |
| US11573957B2 (en) | 2019-12-09 | 2023-02-07 | Salesforce.Com, Inc. | Natural language processing engine for translating questions into executable database queries |
| US12086539B2 (en) | 2019-12-09 | 2024-09-10 | Salesforce, Inc. | System and method for natural language processing using neural network with cross-task training |
| US11256754B2 (en) | 2019-12-09 | 2022-02-22 | Salesforce.Com, Inc. | Systems and methods for generating natural language processing training samples with inflectional perturbations |
| US11416688B2 (en) | 2019-12-09 | 2022-08-16 | Salesforce.Com, Inc. | Learning dialogue state tracking with limited labeled data |
| CN110991619A (zh) * | 2019-12-09 | 2020-04-10 | Oppo广东移动通信有限公司 | 神经网络处理器、芯片和电子设备 |
| US11640505B2 (en) | 2019-12-09 | 2023-05-02 | Salesforce.Com, Inc. | Systems and methods for explicit memory tracker with coarse-to-fine reasoning in conversational machine reading |
| CN114503124A (zh) * | 2019-12-18 | 2022-05-13 | 谷歌有限责任公司 | 处理时间序列数据的多层次预测 |
| KR102315830B1 (ko) * | 2019-12-27 | 2021-10-22 | 한국과학기술원 | 반지도 학습 기반 단어 단위 감정 임베딩과 lstm 모델을 이용한 대화 내에서 발화의 감정 분류 방법 |
| US11669745B2 (en) | 2020-01-13 | 2023-06-06 | Salesforce.Com, Inc. | Proposal learning for semi-supervised object detection |
| CN111312285B (zh) * | 2020-01-14 | 2023-02-14 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种开头爆音检测方法及装置 |
| US11562147B2 (en) | 2020-01-23 | 2023-01-24 | Salesforce.Com, Inc. | Unified vision and dialogue transformer with BERT |
| US20210249105A1 (en) | 2020-02-06 | 2021-08-12 | Salesforce.Com, Inc. | Systems and methods for language modeling of protein engineering |
| CN111291940B (zh) * | 2020-03-02 | 2022-06-07 | 桂林电子科技大学 | 一种基于Attention深度学习模型的学生辍课预测方法 |
| CN111414749B (zh) * | 2020-03-18 | 2022-06-21 | 哈尔滨理工大学 | 基于深度神经网络的社交文本依存句法分析系统 |
| US11263476B2 (en) | 2020-03-19 | 2022-03-01 | Salesforce.Com, Inc. | Unsupervised representation learning with contrastive prototypes |
| US11328731B2 (en) | 2020-04-08 | 2022-05-10 | Salesforce.Com, Inc. | Phone-based sub-word units for end-to-end speech recognition |
| CN111222347B (zh) * | 2020-04-15 | 2020-07-28 | 北京金山数字娱乐科技有限公司 | 语句翻译模型的训练方法及装置、语句翻译方法及装置 |
| US12299982B2 (en) | 2020-05-12 | 2025-05-13 | Salesforce, Inc. | Systems and methods for partially supervised online action detection in untrimmed videos |
| US11669699B2 (en) | 2020-05-31 | 2023-06-06 | Saleforce.com, inc. | Systems and methods for composed variational natural language generation |
| US12265909B2 (en) | 2020-06-01 | 2025-04-01 | Salesforce, Inc. | Systems and methods for a k-nearest neighbor based mechanism of natural language processing models |
| US11720559B2 (en) | 2020-06-02 | 2023-08-08 | Salesforce.Com, Inc. | Bridging textual and tabular data for cross domain text-to-query language semantic parsing with a pre-trained transformer language encoder and anchor text |
| US12530560B2 (en) | 2020-06-03 | 2026-01-20 | Salesforce, Inc. | System and method for differential architecture search for neural networks |
| US11455146B2 (en) | 2020-06-22 | 2022-09-27 | Bank Of America Corporation | Generating a pseudo-code from a text summarization based on a convolutional neural network |
| US11393456B1 (en) * | 2020-06-26 | 2022-07-19 | Amazon Technologies, Inc. | Spoken language understanding system |
| US20220050877A1 (en) | 2020-08-14 | 2022-02-17 | Salesforce.Com, Inc. | Systems and methods for query autocompletion |
| US11934952B2 (en) | 2020-08-21 | 2024-03-19 | Salesforce, Inc. | Systems and methods for natural language processing using joint energy-based models |
| US11934781B2 (en) | 2020-08-28 | 2024-03-19 | Salesforce, Inc. | Systems and methods for controllable text summarization |
| CN112185352B (zh) * | 2020-08-31 | 2024-05-17 | 华为技术有限公司 | 语音识别方法、装置及电子设备 |
| CN114298289B (zh) * | 2020-09-21 | 2026-04-28 | 华为技术有限公司 | 一种数据处理的方法、数据处理设备及存储介质 |
| CN112183846B (zh) * | 2020-09-25 | 2022-04-19 | 合肥工业大学 | 基于模糊c均值聚类的tvf-emd-mcqrnn负荷概率预测方法 |
| IL301423A (en) * | 2020-10-02 | 2023-05-01 | Applied Brain Res Inc | Methods and systems for parallel computation in recurrently connected artificial neural networks |
| CN112259075A (zh) * | 2020-10-10 | 2021-01-22 | 腾讯科技(深圳)有限公司 | 语音信号处理方法、装置、电子设备和存储介质 |
| JP2023546145A (ja) | 2020-10-15 | 2023-11-01 | ドルビー・インターナショナル・アーベー | 正弦波活性化を用いるニューラル・ネットワーク・ベースのオーディオ処理のための方法及び装置 |
| CN112309405A (zh) * | 2020-10-29 | 2021-02-02 | 平安科技(深圳)有限公司 | 多种声音事件的检测方法、装置、计算机设备及存储介质 |
| US11829442B2 (en) | 2020-11-16 | 2023-11-28 | Salesforce.Com, Inc. | Methods and systems for efficient batch active learning of a deep neural network |
| CN112651170B (zh) * | 2020-12-14 | 2024-02-27 | 德清阿尔法创新研究院 | 一种纵向联邦学习场景中高效的特征贡献评估方法 |
| KR102587232B1 (ko) * | 2020-12-29 | 2023-10-12 | 인하대학교 산학협력단 | 인간 활동 인식을 위한 희소 특성 학습 방법 및 시스템 |
| CN113096206B (zh) * | 2021-03-15 | 2022-09-23 | 中山大学 | 基于注意力机制网络的人脸生成方法、装置、设备及介质 |
| CN112925896A (zh) * | 2021-04-04 | 2021-06-08 | 河南工业大学 | 一种基于联合解码的话题扩展情感对话生成方法 |
| CN113257239B (zh) * | 2021-06-15 | 2021-10-08 | 深圳市北科瑞声科技股份有限公司 | 语音识别方法、装置、电子设备及存储介质 |
| CN113919587A (zh) * | 2021-11-03 | 2022-01-11 | 中大检测(湖南)股份有限公司 | 基于神经网络的地质灾害的预测方法及系统 |
| CN116151316A (zh) * | 2021-11-15 | 2023-05-23 | 平头哥(上海)半导体技术有限公司 | 适用于类神经网络模型的计算系统及实现类神经网络模型的方法 |
| US12307743B2 (en) * | 2022-01-13 | 2025-05-20 | Nanjing University Of Posts And Telecommunications | Multiscale point cloud classification method and system |
| US12217001B2 (en) * | 2022-02-25 | 2025-02-04 | Optum Services (Ireland) Limited | Natural language processing techniques using multi-context self-attention machine learning frameworks |
| CN114757177B (zh) * | 2022-03-11 | 2024-09-27 | 广西电网有限责任公司 | 一种基于bart融合指针生成网络的文本摘要方法 |
| WO2023196014A1 (en) * | 2022-04-05 | 2023-10-12 | Innopeak Technology, Inc. | Object prior embedded network for query-agnostic image retrieval |
| CN117200933A (zh) * | 2022-05-25 | 2023-12-08 | 华为技术有限公司 | 一种信道编译码方法及装置 |
| CN117197599B (zh) * | 2022-05-27 | 2025-12-19 | 北京达佳互联信息技术有限公司 | 媒体信息处理方法、装置、设备及存储介质 |
| US12499676B2 (en) * | 2023-01-25 | 2025-12-16 | Qualcomm Incorporated | Recurrent neural networks for high resolution image and video processing |
| CN115905717B (zh) * | 2023-03-02 | 2023-05-09 | 中南大学 | 基于混合3d卷积融合评级与评论的景点推荐方法及装置 |
| CN116579385A (zh) * | 2023-04-19 | 2023-08-11 | 山东浪潮科学研究院有限公司 | Mt5语言模型优化方法及装置、介质、设备 |
| CN116543291B (zh) * | 2023-06-25 | 2026-01-27 | 福建亿榕信息技术有限公司 | 一种资源灵活配置的fpga实现cnn的方法 |
| CN117079273B (zh) * | 2023-07-17 | 2024-12-24 | 浙江工业大学 | 一种基于深度学习的浮游藻类微生物检测方法 |
| CN118194879B (zh) * | 2024-03-02 | 2025-03-04 | 深圳威科未来科技有限公司 | 一种通过流程图实现任务型ai对话系统的方法 |
| US12314378B1 (en) * | 2024-09-20 | 2025-05-27 | HiddenLayer, Inc. | Machine learning model parameter based encryption |
Family Cites Families (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6128606A (en) | 1997-03-11 | 2000-10-03 | At&T Corporation | Module for constructing trainable modular network in which each module inputs and outputs data structured as a graph |
| US7054850B2 (en) | 2000-06-16 | 2006-05-30 | Canon Kabushiki Kaisha | Apparatus and method for detecting or recognizing pattern by employing a plurality of feature detecting elements |
| KR100586841B1 (ko) * | 2003-12-15 | 2006-06-07 | 삼성전자주식회사 | 가변 딜레이 제어 방법 및 회로 |
| US9443141B2 (en) | 2008-06-02 | 2016-09-13 | New York University | Method, system, and computer-accessible medium for classification of at least one ICTAL state |
| US9836455B2 (en) | 2011-02-23 | 2017-12-05 | New York University | Apparatus, method and computer-accessible medium for explaining classifications of documents |
| US8873813B2 (en) | 2012-09-17 | 2014-10-28 | Z Advanced Computing, Inc. | Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities |
| CN103345581B (zh) * | 2013-07-04 | 2016-12-28 | 上海交通大学 | 基于在线自中心模型的动态网络分析系统及方法 |
| US10783900B2 (en) | 2014-10-03 | 2020-09-22 | Google Llc | Convolutional, long short-term memory, fully connected deep neural networks |
| US10409908B2 (en) | 2014-12-19 | 2019-09-10 | Google Llc | Generating parse trees of text segments using neural networks |
| US11080587B2 (en) * | 2015-02-06 | 2021-08-03 | Deepmind Technologies Limited | Recurrent neural networks for data item generation |
| WO2016145379A1 (en) * | 2015-03-12 | 2016-09-15 | William Marsh Rice University | Automated Compilation of Probabilistic Task Description into Executable Neural Network Specification |
| US20160283864A1 (en) | 2015-03-27 | 2016-09-29 | Qualcomm Incorporated | Sequential image sampling and storage of fine-tuned features |
| US9786036B2 (en) | 2015-04-28 | 2017-10-10 | Qualcomm Incorporated | Reducing image resolution in deep convolutional networks |
| CN104850845B (zh) * | 2015-05-30 | 2017-12-26 | 大连理工大学 | 一种基于非对称卷积神经网络的交通标志识别方法 |
| US20160350653A1 (en) | 2015-06-01 | 2016-12-01 | Salesforce.Com, Inc. | Dynamic Memory Network |
| US11113598B2 (en) | 2015-06-01 | 2021-09-07 | Salesforce.Com, Inc. | Dynamic memory network |
| US20170032280A1 (en) | 2015-07-27 | 2017-02-02 | Salesforce.Com, Inc. | Engagement estimator |
| US10282663B2 (en) | 2015-08-15 | 2019-05-07 | Salesforce.Com, Inc. | Three-dimensional (3D) convolution with 3D batch normalization |
| CN105844239B (zh) * | 2016-03-23 | 2019-03-29 | 北京邮电大学 | 一种基于cnn和lstm的暴恐视频检测方法 |
| US11080595B2 (en) | 2016-11-04 | 2021-08-03 | Salesforce.Com, Inc. | Quasi-recurrent neural network based encoder-decoder model |
| US10346721B2 (en) | 2017-11-01 | 2019-07-09 | Salesforce.Com, Inc. | Training a neural network using augmented training datasets |
-
2017
- 2017-01-31 US US15/420,801 patent/US11080595B2/en active Active
- 2017-01-31 US US15/420,710 patent/US20180129937A1/en not_active Abandoned
- 2017-11-03 JP JP2019523049A patent/JP6992064B2/ja active Active
- 2017-11-03 WO PCT/US2017/060051 patent/WO2018085724A1/en not_active Ceased
- 2017-11-03 CA CA3040153A patent/CA3040153C/en active Active
- 2017-11-03 EP EP17800682.1A patent/EP3535700B1/en active Active
- 2017-11-03 CN CN201780068556.6A patent/CN109923559B/zh active Active
- 2017-11-03 WO PCT/US2017/060049 patent/WO2018085722A1/en not_active Ceased
- 2017-11-03 EP EP17798367.3A patent/EP3535699A1/en not_active Ceased
- 2017-11-03 CA CA3040188A patent/CA3040188C/en active Active
- 2017-11-03 AU AU2017355537A patent/AU2017355537B2/en active Active
- 2017-11-03 AU AU2017355535A patent/AU2017355535B2/en active Active
- 2017-11-03 JP JP2019522910A patent/JP6903752B2/ja active Active
- 2017-11-03 CN CN201780068559.XA patent/CN109952580B/zh active Active
-
2020
- 2020-12-15 US US17/122,894 patent/US12198047B2/en active Active
-
2021
- 2021-02-25 AU AU2021201242A patent/AU2021201242B2/en active Active
- 2021-06-23 JP JP2021103993A patent/JP7233475B2/ja active Active
Non-Patent Citations (3)
| Title |
|---|
| Fandong Meng et al.,Encoding Source Language with Convolutional Network for Machine Translation[online],2015年06月08日,pp.1-12,https://arxiv.org/pdf/1503.01838,[検索日2020年 9月29日],インターネット |
| Ramesh Nallapati et al.,Abstractive Text Summarization using Sequence-to-sequence RNNs and Beyond,2016年08月26日,pp.1-12,https://arxiv.org/pdf/1602.06023,[検索日2020年 9月29日],インターネット |
| Zhen Zuo et al.,Convolutional Recurrent Neural Networks: Learning Spatial Dependencies for Image Representation,Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW),2015年,pp.18-26 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2021166073A (ja) * | 2016-11-04 | 2021-10-14 | セールスフォース ドット コム インコーポレイティッド | 擬似リカレントニューラルネットワーク |
| JP7233475B2 (ja) | 2016-11-04 | 2023-03-06 | セールスフォース インコーポレイテッド | 擬似リカレントニューラルネットワーク |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3535700A1 (en) | 2019-09-11 |
| AU2017355535B2 (en) | 2020-11-26 |
| AU2021201242B2 (en) | 2022-08-11 |
| US12198047B2 (en) | 2025-01-14 |
| WO2018085722A1 (en) | 2018-05-11 |
| CA3040153A1 (en) | 2018-05-11 |
| AU2017355537B2 (en) | 2021-02-18 |
| JP2020501231A (ja) | 2020-01-16 |
| US20210103816A1 (en) | 2021-04-08 |
| US11080595B2 (en) | 2021-08-03 |
| EP3535699A1 (en) | 2019-09-11 |
| JP7233475B2 (ja) | 2023-03-06 |
| US20180129937A1 (en) | 2018-05-10 |
| CA3040188C (en) | 2021-08-03 |
| CN109952580A (zh) | 2019-06-28 |
| JP2021166073A (ja) | 2021-10-14 |
| JP6903752B2 (ja) | 2021-07-14 |
| CA3040188A1 (en) | 2018-05-11 |
| CN109923559B (zh) | 2024-03-12 |
| AU2017355537A1 (en) | 2019-05-02 |
| CN109952580B (zh) | 2023-08-01 |
| US20180129931A1 (en) | 2018-05-10 |
| AU2017355535A1 (en) | 2019-05-02 |
| AU2021201242A1 (en) | 2021-03-11 |
| CA3040153C (en) | 2023-09-26 |
| CN109923559A (zh) | 2019-06-21 |
| WO2018085724A1 (en) | 2018-05-11 |
| EP3535700B1 (en) | 2026-03-04 |
| JP2019537134A (ja) | 2019-12-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6992064B2 (ja) | 擬似リカレントニューラルネットワークに基づくエンコーダ‐デコーダモデル | |
| Prabhumoye et al. | Exploring controllable text generation techniques | |
| JP6972265B2 (ja) | ポインタセンチネル混合アーキテクチャ | |
| Fan et al. | Bayesian attention modules | |
| JP2021501390A (ja) | テキスト意味論的コード化の方法および装置 | |
| Belanger et al. | A linear dynamical system model for text | |
| US20250156684A1 (en) | Parameter-Efficient Adapter for an Artificial Intelligence System | |
| WO2025184420A1 (en) | Hybrid neural networks with attention and recurrence | |
| Deng et al. | Convergence of two-layer regression with nonlinear units | |
| US20250252309A1 (en) | Hardware-friendly and parameter-efficient tuning of neural networks | |
| JP2024519265A (ja) | フィードフォワード空間変換ユニットを備えたニューラルネットワーク | |
| US20260093995A1 (en) | Differentially private stochastic gradient descent using optimized correlation matrices | |
| Saxena et al. | Compression of large LSTM networks for inference on space constraint systems | |
| US20250363376A1 (en) | Training a dual encoder with a correction model | |
| Liang | Experiments on the generalization and learning dynamics of deep neural networks | |
| WO2025255143A1 (en) | Generating task neural networks from larger neural networks using projections | |
| AU2026202630A1 (en) | Attention-based sequence transduction neural networks | |
| Groenland et al. | Efficient forward propagation of time-sequences in convolutional neural networks using deep shifting | |
| Ma | Irreversibility in Stochastic Dynamic Models and Efficient Bayesian Inference | |
| Genchi | Design compact and efficient recurrent neural networks for natural language processing tasks |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190726 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200928 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201013 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201216 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210601 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210622 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211109 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211208 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6992064 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |