JP7133003B2 - 画像翻訳方法及び装置、画像翻訳モデルトレーニング方法及び装置 - Google Patents
画像翻訳方法及び装置、画像翻訳モデルトレーニング方法及び装置 Download PDFInfo
- Publication number
- JP7133003B2 JP7133003B2 JP2020215551A JP2020215551A JP7133003B2 JP 7133003 B2 JP7133003 B2 JP 7133003B2 JP 2020215551 A JP2020215551 A JP 2020215551A JP 2020215551 A JP2020215551 A JP 2020215551A JP 7133003 B2 JP7133003 B2 JP 7133003B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- images
- domain
- translation
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/18—Image warping, e.g. rearranging pixels individually
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/149—Segmentation; Edge detection involving deformable models, e.g. active contour models
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
- Geometry (AREA)
Description
第7の態様によるコンピュータプログラムであって、前記コンピュータプログラムにおける命令が実行された場合に、本出願の実施例の上記画像翻訳方法又は上記画像翻訳モデルトレーニング方法が実行される。
元の画像を識別して、元の画像の属する第2のドメインを確定し、元の画像の属する第2のドメイン及びターゲット翻訳画像の属する第1のドメインに基づき、N種類のジェネレータからターゲットジェネレータを選択するステップをさらに含む。
元の画像を識別して、元の画像の属する第2のドメインを確定し、元の画像の属する第2のドメインに基づいてターゲットジェネレータを取得するステップと、をさらに含む。
Claims (27)
- 画像翻訳方法であって、
元の画像を含む画像翻訳リクエストを取得するステップと、
前記元の画像をダウンサンプリングして、前記元の画像に対応する縮小画像を生成するステップと、
前記縮小画像に基づき、前記元の画像に対応する前記元の画像と同じサイズの予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するステップと、
前記変形パラメータに基づいて前記元の画像を変形処理して変形画像を生成するステップと、
前記変形画像、前記予め翻訳された画像及び前記マスク画像を融合させてターゲット翻訳画像を生成するステップと、を含む、
ことを特徴とする画像翻訳方法。 - 前記縮小画像に基づき、前記元の画像に対応する、予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するステップは、
前記縮小画像を処理し、前記縮小画像が前記ターゲット翻訳画像の属するドメインである第1のドメインに翻訳される時の対応する第1の特徴ベクトルを確定するステップと、
前記第1の特徴ベクトルをアップサンプリングして、第2の特徴ベクトルを生成するステップと、
前記第2の特徴ベクトルに基づき、前記予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するステップと、を含む、
ことを特徴とする請求項1に記載の画像翻訳方法。 - 前記翻訳リクエストには前記ターゲット翻訳画像の属する第1のドメインも含まれ、画像翻訳リクエストが取得された後、
前記ターゲット翻訳画像の属する第1のドメインに基づき、ターゲットジェネレータを取得するステップをさらに含み、
前記縮小画像に基づき、前記元の画像に対応する、予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するステップは、
前記ターゲットジェネレータによって前記縮小画像を処理して、前記元の画像に対応する、予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するステップを含む、
ことを特徴とする請求項1に記載の画像翻訳方法。 - 前記ターゲット翻訳画像の属する第1のドメインに対応するジェネレータがN種類であり、Nが1よりも大きい整数である場合、画像翻訳リクエストが取得された後、
前記元の画像を識別して、前記元の画像の属する第2のドメインを確定するステップと、
前記元の画像の属する第2のドメイン及び前記ターゲット翻訳画像の属する第1のドメインに基づき、前記N種類のジェネレータから前記ターゲットジェネレータを選択するステップと、をさらに含む、
ことを特徴とする請求項3に記載の画像翻訳方法。 - 画像翻訳リクエストが取得された後、
前記元の画像を識別して、前記元の画像の属する第2のドメインを確定するステップと、
前記元の画像の属する第2のドメインに基づき、ターゲットジェネレータを取得するステップと、をさらに含み、
前記縮小画像に基づき、前記元の画像に対応する、予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するステップは、
前記ターゲットジェネレータによって前記縮小画像を処理して、前記元の画像に対応する、予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するステップを含む、
ことを特徴とする請求項1に記載の画像翻訳方法。 - 前記元の画像の属する第2のドメインに対応するジェネレータがN種類であり、Nが1よりも大きい整数である場合、画像翻訳リクエストが取得された後、
ターゲット翻訳画像の属する第1のドメインを取得するステップと、
前記ターゲット翻訳画像の属する第1のドメイン及び前記元の画像の属する第2のドメインに基づき、前記N種類のジェネレータから前記ターゲットジェネレータを選択するステップと、をさらに含む、
ことを特徴とする請求項5に記載の画像翻訳方法。 - 前記変形画像、前記予め翻訳された画像及び前記マスク画像を融合させてターゲット翻訳画像を生成するステップは、
前記マスク画像の各ピクセルポイントのピクセル値に基づき、前記予め翻訳された画像の第1の重み及び前記変形画像の第2の重みを確定するステップと、
前記第1の重み及び前記第2の重みに基づき、前記予め翻訳された画像の各ピクセルポイントのピクセル値と前記変形画像の各ピクセルポイントのピクセル値とを融合させて、前記ターゲット翻訳画像を生成するステップと、を含む、
ことを特徴とする請求項1に記載の画像翻訳方法。 - 前記元の画像をダウンサンプリングして、前記元の画像に対応する縮小画像を生成する前に、
現在の電子機器の属性パラメータを取得するステップと、
前記電子機器の属性パラメータに基づき、ダウンサンプリング係数を確定するステップと、をさらに含み、
前記元の画像をダウンサンプリングして、前記元の画像に対応する縮小画像を生成するステップは、
前記ダウンサンプリング係数に基づき、前記元の画像をダウンサンプリングして、前記元の画像に対応する縮小画像を生成するステップを含む、
ことを特徴とする請求項1に記載の画像翻訳方法。 - 画像翻訳モデルトレーニング方法であって、
第1のドメインに属する第1の画像セットと、第2のドメインに属する第2の画像セットとを含むトレーニングセットを取得するステップと、
前記第1の画像セット内の画像をそれぞれダウンサンプリングして、第1の縮小画像セットを生成するステップと、
第1の初期ジェネレータによって前記第1の縮小画像セット内の画像をそれぞれ処理して、第1の予め翻訳された画像セット、第1のマスク画像セット及び第1の変形パラメータセットを生成するステップであって、前記第1の変形パラメータセット内の各パラメータがそれぞれ前記第1の画像セット内の画像の各ピクセルポイントに対応するステップと、
前記第1の変形パラメータセットに基づいて前記第1の画像セット内の画像をそれぞれ変形処理し、第1の変形画像セットを取得するステップと、
前記第1の変形画像セット、前記第1の予め翻訳された画像セット及び前記第1のマスク画像セット内の対応する画像をそれぞれ融合させて、第3の画像セットを取得するステップと、
前記第3の画像セット内の画像及び第2の画像セット内の画像をそれぞれ第1の初期弁別器に入力して、前記第1の初期弁別器によって出力された、前記第3の画像セット内の画像がそれぞれ真の画像に属する第1の確率セットと、前記第2の画像セット内の画像がそれぞれ真の画像に属する第2の確率セットとを取得するステップと、
前記第1の確率セット及び前記第2の確率セットに基づき、前記第1の初期ジェネレータ及び前記第1の初期弁別器を修正して、第1のドメインに位置する画像を第2のドメインに位置する画像に翻訳させるための第1のドメインに属するターゲットジェネレータを生成するステップと、を含む、
ことを特徴とする画像翻訳モデルトレーニング方法。 - 第1の初期ジェネレータによって前記第1の縮小画像セット内の画像をそれぞれ処理して、第1の予め翻訳された画像セット、第1のマスク画像セット及び第1の変形パラメータセットを生成するステップは、
前記第1の縮小画像セット内の画像をそれぞれ処理して、縮小画像セット内の画像が前記第2のドメインに翻訳される時の対応する第1の特徴ベクトルセットを確定するステップと、
前記第1の特徴ベクトルセット内の第1の特徴ベクトルをそれぞれアップサンプリングして、第2の特徴ベクトルセットを生成するステップと、
前記第2の特徴ベクトルセット内の第2の特徴ベクトルに基づき、前記第1の予め翻訳された画像セット、前記第1のマスク画像セット及び第1の変形パラメータセットを生成するステップと、を含む、
ことを特徴とする請求項9に記載の画像翻訳モデルトレーニング方法。 - 前記第1の画像セット内の画像は、それぞれ前記第2の画像セット内の画像と逐一マッチングする、
ことを特徴とする請求項9に記載の画像翻訳モデルトレーニング方法。 - 第1の画像セット内の画像が前記第2の画像セット内の画像とマッチングしていない場合、前記第1の確率セット及び前記第2の確率セットに基づき、前記第1の初期ジェネレータ及び前記第1の初期弁別器を修正した後、
前記第3の画像セット内の画像をそれぞれダウンサンプリングして、第2の縮小画像セットを生成するステップと、
第2の初期ジェネレータによって前記第2の縮小画像セット内の画像をそれぞれ処理して、第2の予め翻訳された画像セット、第2のマスク画像セット及び第2の変形パラメータセットを生成するステップと、
前記第2の変形パラメータセットに基づいて前記第3の画像セット内の画像をそれぞれ変形処理して、第2の変形画像セットを取得するステップと、
前記第2の変形画像セット、第2の予め翻訳された画像セット及び前記第2のマスク画像セット内の対応する画像をそれぞれ融合させて、第4の画像セットを取得するステップと、
前記第4の画像セット内の画像及び第1の画像セット内の画像をそれぞれ第2の初期弁別器に入力して、前記第2の初期弁別器によって出力された、前記第4の画像セット内の画像がそれぞれ真の画像に属する第3の確率セットと、前記第1の画像セット内の画像がそれぞれ真の画像に属する第4の確率セットとを取得するステップと、
前記第3の確率セット及び前記第4の確率セットに基づき、前記第1の初期ジェネレータ、前記第2の初期ジェネレータ、前記第1の初期弁別器及び前記第2の初期弁別器を修正して、第1のドメインに位置する画像を第2のドメインに位置する画像に翻訳させるための第1のドメインに属するターゲットジェネレータと、第2のドメインに位置する画像を第1のドメインに位置する画像に翻訳させるための第2のドメインに属するターゲットジェネレータとを生成するステップと、をさらに含む、
ことを特徴とする請求項9に記載の画像翻訳モデルトレーニング方法。 - 画像翻訳装置であって、
元の画像を含む画像翻訳リクエストを取得するように構成される第1の取得モジュールと、
前記元の画像をダウンサンプリングして、前記元の画像に対応する縮小画像を生成するように構成される第1のサンプリングモジュールと、
前記縮小画像に基づき、前記元の画像に対応する前記元の画像と同じサイズの予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するように構成される第1の生成モジュールと、
前記変形パラメータに基づいて前記元の画像を変形処理して変形画像を取得するように構成される第1の処理モジュールと、
前記変形画像、前記予め翻訳された画像及び前記マスク画像を融合させてターゲット翻訳画像を生成するように構成される第1の融合モジュールと、を含む、
ことを特徴とする画像翻訳装置。 - 前記第1の生成モジュールは、
前記縮小画像を処理し、前記縮小画像が前記ターゲット翻訳画像の属するドメインである第1のドメインに翻訳される時の対応する第1の特徴ベクトルを確定するように構成される第1の処理ユニットと、
前記第1の特徴ベクトルをアップサンプリングして、第2の特徴ベクトルを生成するように構成される第1のサンプリングユニットと、
前記第2の特徴ベクトルに基づき、前記予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するように構成されるための第1の生成ユニットと、を含む、
ことを特徴とする請求項13に記載の画像翻訳装置。 - 前記画像翻訳リクエストには前記ターゲット翻訳画像の属する第1のドメインも含まれ、前記第1の取得モジュールは、画像翻訳リクエストを取得した後、さらに、
前記ターゲット翻訳画像の属する第1のドメインに基づき、ターゲットジェネレータを取得するように構成され、
前記第1の生成モジュールは、具体的には、
前記ターゲットジェネレータによって前記縮小画像を処理して、前記元の画像に対応する予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するように構成される、
ことを特徴とする請求項13に記載の画像翻訳装置。 - 前記ターゲット翻訳画像の属する第1のドメインに対応するジェネレータがN種類であり、Nが1よりも大きい整数である場合、前記第1の取得モジュールは、画像翻訳リクエストを取得した後、さらに、
前記元の画像を識別して、前記元の画像の属する第2のドメインを確定し、
前記元の画像の属する第2のドメイン及び前記ターゲット翻訳画像の属する第1のドメインに基づき、前記N種類のジェネレータから前記ターゲットジェネレータを選択するように構成される、
ことを特徴とする請求項15に記載の画像翻訳装置。 - 前記第1の取得モジュールは、画像翻訳リクエストを取得した後、さらに、
前記元の画像を識別して、前記元の画像の属する第2のドメインを確定し、
前記元の画像の属する第2のドメインに基づき、ターゲットジェネレータを取得するように構成され、
前記第1の生成モジュールは、具体的には、
前記ターゲットジェネレータによって前記縮小画像を処理して、前記元の画像に対応する予め翻訳された画像、マスク画像、及び前記元の画像の各ピクセルポイントに対応する変形パラメータを生成するように構成される、
ことを特徴とする請求項13に記載の画像翻訳装置。 - 前記元の画像の属する第2のドメインに対応するジェネレータがN種類であり、Nが1よりも大きい整数である場合、前記第1の取得モジュールは、画像翻訳リクエストを取得した後、さらに、
ターゲット翻訳画像の属する第1のドメインを取得し、
前記ターゲット翻訳画像の属する第1のドメイン及び前記元の画像の属する第2のドメインに基づき、前記N種類のジェネレータから前記ターゲットジェネレータを選択するように構成される、
ことを特徴とする請求項17に記載の画像翻訳装置。 - 前記第1の融合モジュールは、
前記マスク画像の各ピクセルポイントのピクセル値に基づき、予め翻訳された画像の第1の重み及び前記変形画像の第2の重みを確定するように構成される第1の確定ユニットと、
前記第1の重み及び前記第2の重みに基づき、前記予め翻訳された画像の各ピクセルポイントのピクセル値と前記変形画像の各ピクセルポイントのピクセル値とを融合させて、前記ターゲット翻訳画像を生成するように構成される第2の融合ユニットと、を含む、
ことを特徴とする請求項13~18のいずれかに記載の画像翻訳装置。 - 前記元の画像をダウンサンプリングして、前記元の画像に対応する縮小画像を生成する前に、前記第1のサンプリングモジュールは、さらに、
現在の電子機器の属性パラメータを取得し、
前記電子機器の属性パラメータに基づき、ダウンサンプリング係数を確定するように構成され、
前記第1のサンプリングモジュールは、具体的には、
前記ダウンサンプリング係数に基づき、前記元の画像をダウンサンプリングして、前記元の画像に対応する縮小画像を生成するように構成される、
ことを特徴とする請求項13~18のいずれかに記載の画像翻訳装置。 - 画像翻訳モデルトレーニング装置であって、
第1のドメインに属する第1の画像セットと、第2のドメインに属する第2の画像セットとを含むトレーニングセットを取得するように構成される第2の取得モジュールと、
前記第1の画像セット内の画像をそれぞれダウンサンプリングして、第1の縮小画像セットを生成するように構成される第2のサンプリングモジュールと、
第1の初期ジェネレータによって前記第1の縮小画像セット内の画像をそれぞれ処理して、第1の予め翻訳された画像セット、第1のマスク画像セット及び第1の変形パラメータセットを生成するように構成される第2の処理モジュールであって、前記第1の変形パラメータセット内の各パラメータがそれぞれ前記第1の画像セット内の画像の各ピクセルポイントに対応する第2の処理モジュールと、
前記第1の変形パラメータセットに基づいて前記第1の画像セット内の画像をそれぞれ変形処理し、第1の変形画像セットを取得するように構成される第3の処理モジュールと、
前記第1の変形画像セット、前記第1の予め翻訳された画像セット及び前記第1のマスク画像セット内の対応する画像をそれぞれ融合させて、第3の画像セットを取得するように構成される第2の融合モジュールと、
前記第3の画像セット内の画像及び前記第2の画像セット内の画像をそれぞれ第1の初期弁別器に入力して、前記第1の初期弁別器によって出力された、前記第3の画像セット内の画像がそれぞれ真の画像に属する第1の確率セットと、前記第2の画像セット内の画像がそれぞれ真の画像に属する第2の確率セットとを取得するように構成される第3の取得モジュールと、
前記第1の確率セット及び前記第2の確率セットに基づき、前記第1の初期ジェネレータ及び前記第1の初期弁別器を修正して、第1のドメインに位置する画像を第2のドメインに位置する画像に翻訳させるための第1のドメインに属するターゲットジェネレータを生成するように構成される第1の修正モジュールと、を含む、
ことを特徴とする画像翻訳モデルトレーニング装置。 - 前記第2の処理モジュールは、
前記第1の縮小画像セット内の画像をそれぞれ処理して、縮小画像セット内の画像が前記第2のドメインに翻訳される時の対応する第1の特徴ベクトルセットを確定するように構成される第2の処理ユニットと、
前記第1の特徴ベクトルセット内の第1の特徴ベクトルをそれぞれアップサンプリングして、第2の特徴ベクトルセットを生成するように構成される第2のサンプリングユニットと、
前記第2の特徴ベクトルセット内の第2の特徴ベクトルに基づき、前記第1の予め翻訳された画像セット、前記第1のマスク画像セット及び前記第1の変形パラメータセットを生成するように構成される第2の生成ユニットと、を含む、
ことを特徴とする請求項21に記載の画像翻訳モデルトレーニング装置。 - 前記第1の画像セット内の画像は、それぞれ前記第2の画像セット内の画像と逐一マッチングする、
ことを特徴とする請求項21に記載の画像翻訳モデルトレーニング装置。 - 第1の画像セット内の画像が前記第2の画像セット内の画像とマッチングしていない場合、前記画像翻訳モデルトレーニング装置は、
前記第3の画像セット内の画像をそれぞれダウンサンプリングして、第2の縮小画像セットを生成するように構成される第3のサンプリングモジュールと、
第2の初期ジェネレータによって前記第2の縮小画像セット内の画像をそれぞれ処理して、第2の予め翻訳された画像セット、第2のマスク画像セット及び第2の変形パラメータセットを生成するように構成される第4の処理モジュールと、
前記第2の変形パラメータセットに基づいて前記第3の画像セット内の画像をそれぞれ変形処理して、第2の変形画像セットを取得するように構成される第5の処理モジュールと、
前記第2の変形画像セット、第2の予め翻訳された画像セット及び前記第2のマスク画像セット内の対応する画像をそれぞれ融合させて、第4の画像セットを取得するように構成される第3の融合モジュールと、
前記第4の画像セット内の画像及び前記第1の画像セット内の画像をそれぞれ第2の初期弁別器に入力して、前記第2の初期弁別器によって出力された、前記第4の画像セット内の画像がそれぞれ真の画像に属する第3の確率セットと、前記第1の画像セット内の画像がそれぞれ真の画像に属する第4の確率セットとを取得するように構成される第4のモジュールと、
前記第3の確率セット及び前記第4の確率セットに基づき、前記第1の初期ジェネレータ、前記第2の初期ジェネレータ、前記第1の初期弁別器及び前記第2の初期弁別器を修正して、第1のドメインに位置する画像を第2のドメインに位置する画像に翻訳させるための第1のドメインに属するターゲットジェネレータと、第2のドメインに位置する画像を第1のドメインに位置する画像に翻訳させるための第2のドメインに属するターゲットジェネレータとを生成するように構成される第2の修正モジュールと、をさらに含む、
ことを特徴とする請求項21に記載の画像翻訳モデルトレーニング装置。 - 電子機器であって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続されたメモリとを含み、ここで、
前記メモリには前記少なくとも1つのプロセッサで実行可能な命令が記憶され、前記命令は、前記少なくとも1つのプロセッサが請求項1~8のいずれかに記載の方法又は請求項9~12のいずれかに記載の方法を実行するように、前記少なくとも1つのプロセッサによって実行される、
ことを特徴とする電子機器。 - コンピュータ命令を記憶している非一時的コンピュータ可読記憶媒体であって、
前記コンピュータ命令は、コンピュータに請求項1~8のいずれかに記載の方法又は請求項9~12のいずれかに記載のトレーニング方法を実行させる、
ことを特徴とする非一時的コンピュータ可読記憶媒体。 - コンピュータプログラムであって、
前記コンピュータプログラムにおける命令が実行された場合に、請求項1~8のいずれかに記載の方法又は請求項9~12のいずれかに記載のトレーニング方法が実行される、
ことを特徴とするコンピュータプログラム。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010484916.4 | 2020-06-01 | ||
| CN202010484916.4A CN111833239B (zh) | 2020-06-01 | 2020-06-01 | 图像的翻译方法和装置、图像翻译模型的训练方法和装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021190085A JP2021190085A (ja) | 2021-12-13 |
| JP7133003B2 true JP7133003B2 (ja) | 2022-09-07 |
Family
ID=72897504
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020215551A Active JP7133003B2 (ja) | 2020-06-01 | 2020-12-24 | 画像翻訳方法及び装置、画像翻訳モデルトレーニング方法及び装置 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US11508044B2 (ja) |
| EP (1) | EP3920129A1 (ja) |
| JP (1) | JP7133003B2 (ja) |
| KR (1) | KR102461043B1 (ja) |
| CN (1) | CN111833239B (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11461559B2 (en) * | 2020-01-28 | 2022-10-04 | Salesforce.Com, Inc. | Mechanism to facilitate image translation |
| CN114596241A (zh) * | 2020-12-02 | 2022-06-07 | 阿里巴巴集团控股有限公司 | 图像、视频处理方法、装置、设备和存储介质 |
| KR20230084967A (ko) * | 2021-12-06 | 2023-06-13 | 삼성전자주식회사 | 반도체 공정 이미지 생성기를 훈련시키는 방법 |
| CN119691370B (zh) * | 2025-02-21 | 2025-05-02 | 四川川核地质工程有限公司 | 一种基于大数据的地质灾害隐患数据分析方法及系统 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180247281A1 (en) | 2017-02-24 | 2018-08-30 | Mastercard International Incorporated | Systems and Methods for Managing Receipts for Payment Account Transactions |
| US20190295302A1 (en) | 2018-03-22 | 2019-09-26 | Northeastern University | Segmentation Guided Image Generation With Adversarial Networks |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6807290B2 (en) * | 2000-03-09 | 2004-10-19 | Microsoft Corporation | Rapid computer modeling of faces for animation |
| EP2059899A4 (en) * | 2005-12-30 | 2012-07-04 | Steven Kays | MODEL OF ADAPTATION TO ENGINEERING |
| US20150086127A1 (en) * | 2013-09-20 | 2015-03-26 | Samsung Electronics Co., Ltd | Method and image capturing device for generating artificially defocused blurred image |
| US9183616B2 (en) * | 2014-01-13 | 2015-11-10 | Arecont Vision, Llc. | System and method for obtaining super image resolution through optical image translation |
| AU2015202937A1 (en) * | 2015-05-29 | 2016-12-15 | Canon Kabushiki Kaisha | Systems and methods for registration of images |
| US9443316B1 (en) | 2015-07-21 | 2016-09-13 | Sony Corporation | Semi-automatic image segmentation |
| US20180247201A1 (en) | 2017-02-28 | 2018-08-30 | Nvidia Corporation | Systems and methods for image-to-image translation using variational autoencoders |
| US10339642B2 (en) * | 2017-03-30 | 2019-07-02 | Adobe Inc. | Digital image processing through use of an image repository |
| CN109711457A (zh) * | 2018-12-20 | 2019-05-03 | 江南大学 | 一种基于改进hu不变矩的快速图像匹配方法及其应用 |
| CN109978893B (zh) * | 2019-03-26 | 2023-06-20 | 腾讯科技(深圳)有限公司 | 图像语义分割网络的训练方法、装置、设备及存储介质 |
| CN110322416B (zh) * | 2019-07-09 | 2022-11-18 | 腾讯科技(深圳)有限公司 | 图像数据处理方法、装置以及计算机可读存储介质 |
| GB2586245B (en) * | 2019-08-13 | 2021-09-22 | Univ Of Hertfordshire Higher Education Corporation | Method and apparatus |
-
2020
- 2020-06-01 CN CN202010484916.4A patent/CN111833239B/zh active Active
- 2020-12-09 US US17/115,996 patent/US11508044B2/en active Active
- 2020-12-24 JP JP2020215551A patent/JP7133003B2/ja active Active
- 2020-12-24 KR KR1020200183269A patent/KR102461043B1/ko active Active
- 2020-12-28 EP EP20217425.6A patent/EP3920129A1/en not_active Withdrawn
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180247281A1 (en) | 2017-02-24 | 2018-08-30 | Mastercard International Incorporated | Systems and Methods for Managing Receipts for Payment Account Transactions |
| US20190295302A1 (en) | 2018-03-22 | 2019-09-26 | Northeastern University | Segmentation Guided Image Generation With Adversarial Networks |
Also Published As
| Publication number | Publication date |
|---|---|
| KR102461043B1 (ko) | 2022-10-28 |
| US20210374920A1 (en) | 2021-12-02 |
| JP2021190085A (ja) | 2021-12-13 |
| CN111833239A (zh) | 2020-10-27 |
| EP3920129A1 (en) | 2021-12-08 |
| CN111833239B (zh) | 2023-08-01 |
| KR20210148836A (ko) | 2021-12-08 |
| US11508044B2 (en) | 2022-11-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7133003B2 (ja) | 画像翻訳方法及び装置、画像翻訳モデルトレーニング方法及び装置 | |
| JP7317070B2 (ja) | 人顔の超解像度の実現方法、装置、電子設備、記憶媒体、及びプログラム | |
| JP7342062B2 (ja) | 画像処理方法、装置、電子機器及び記憶媒体 | |
| US11847164B2 (en) | Method, electronic device and storage medium for generating information | |
| CN111259671B (zh) | 文本实体的语义描述处理方法、装置及设备 | |
| US20210304438A1 (en) | Object pose obtaining method, and electronic device | |
| US11893708B2 (en) | Image processing method and apparatus, device, and storage medium | |
| KR102487260B1 (ko) | 이미지 처리 방법, 장치, 전자 기기 및 저장 매체 | |
| US11641446B2 (en) | Method for video frame interpolation, and electronic device | |
| CN116843833B (zh) | 三维模型生成方法、装置和电子设备 | |
| US11836836B2 (en) | Methods and apparatuses for generating model and generating 3D animation, devices and storage mediums | |
| CN111832745A (zh) | 数据增广的方法、装置及电子设备 | |
| JP7124153B2 (ja) | テキストコンテンツの認識方法、装置、電子機器及びコンピュータプログラム製品 | |
| KR102521013B1 (ko) | 이미지 번역 방법 및 장치, 이미지 번역 모델의 트레이닝 방법 및 장치 | |
| CN112529154B (zh) | 图像生成模型训练方法和装置、图像生成方法和装置 | |
| CN111339344B (zh) | 室内图像检索方法、装置及电子设备 | |
| CN111639655B (zh) | 图像局部信息生成方法、装置、电子设备和存储介质 | |
| CN117648419B (zh) | 图文对话方法、模型训练方法、装置和电子设备 | |
| CN119863535A (zh) | 基于大模型的图像生成及模型训练方法、装置和设备 | |
| KR20240117509A (ko) | 얼굴 비디오 생성 방법, 장치 및 전자 기기 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201224 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220301 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220531 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220823 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220826 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7133003 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |