JP6922005B2 - コンピュータビジョンのシステムおよび方法 - Google Patents
コンピュータビジョンのシステムおよび方法 Download PDFInfo
- Publication number
- JP6922005B2 JP6922005B2 JP2020007450A JP2020007450A JP6922005B2 JP 6922005 B2 JP6922005 B2 JP 6922005B2 JP 2020007450 A JP2020007450 A JP 2020007450A JP 2020007450 A JP2020007450 A JP 2020007450A JP 6922005 B2 JP6922005 B2 JP 6922005B2
- Authority
- JP
- Japan
- Prior art keywords
- branch
- image
- output
- convolution
- stage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/096—Transfer learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/20—Processor architectures; Processor configuration, e.g. pipelining
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/809—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30252—Vehicle exterior; Vicinity of vehicle
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biodiversity & Conservation Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
画像を受け取ることと、
第1の特徴マップを作るために共通の処理ステージを用いて前記画像を処理することと、
前記第1の特徴マップを並列処理ステージに入力することと、ここで前記第2の処理ステージは、第1の特徴マップを受け取る第1および第2の並列分岐を備え、
セマンティックセグメント化された画像を作るために第1および第2の分岐の出力を結合することとを備え、
共通の処理ステージは、ニューラルネットワークを備え、ニューラルネットワークは、第1の特徴マップを作るために分離可能(separable)な畳み込みを実行し、画像をダウンサンプリングするように構成された少なくとも1つの分離可能な畳み込みモジュールを有し、前記第1の分岐は、分離可能な畳み込みを実行するように構成された少なくとも1つの分離可能な畳み込みモジュールを備えるニューラルネットワークを備える、
画像をセグメント化する画像処理方法が提供される。
i)コンテキスト処理では、より複雑で抽象的な特徴を学習する必要があり、したがってより深いネットワークが必要である。しかし、より高解像度の入力は不要であり、ゆえにコンテキスト分岐上でより低解像度の入力を使用することによってモデルコストが低減される。
ii)境界処理では、高解像度入力の必要がある。しかし、大きい視野を見る必要はなく、ゆえに詳細分岐内で少数の層を使用することによってモデルコストが低減される。
iii)したがって、上で述べたように2つの異なる目的のために2つの分岐を動作させることは、全体的なモデルコストを下げる。
iv)第2の分岐は、スキップ接続と考えられることができ、発明者らは、第1および第2の分岐が、初期処理ステージを共有できることを理解した。
v)画像処理ネットワークが、少容量になるように設計された。
第1の特徴マップを作るための共通の処理ステージと、
並列処理ステージと、ここで前記第2の処理ステージは、第1の特徴マップを受け取る第1および第2の並列分岐を備え、
セマンティックセグメント化された画像を作るために第1および第2の分岐の出力を結合することと
を備え、共通の処理ステージはニューラルネットワークを備え、ニューラルネットワークは、第1の特徴マップを作るために、分離可能な畳み込みを実行し、画像をダウンサンプリングするように構成された少なくとも1つの分離可能な畳み込みモジュールを有し、前記第1の分岐は、分離可能な畳み込みを実行するように構成された少なくとも1つの分離可能な畳み込みモジュールを備えるニューラルネットワークを備え、
トレーニング方法は、
トレーニングデータを提供することと、ここでトレーニングデータは、画像および前記画像に関するセマンティックセグメント化された情報を備え、
入力として前記画像を使用し、出力としてセマンティックセグメント化された情報を使用して前記モデルをトレーニングすることとを備え、ここで2つのステージは一緒にトレーニングされる。
インターフェースとプロセッサと
を備え、
前記インターフェースは、画像入力を有し、第1の画像を受け取るように適応され、前記プロセッサは、
第1の特徴マップを作るために共通の処理ステージを用いて前記画像を処理し、
並列処理ステージに前記第1の特徴マップを入力し、前記第2の処理ステージは、第1の特徴マップを受け取る第1および第2の並列分岐を備え、
セマンティックセグメント化された画像を作るために第1および第2の分岐の出力を結合する
ように適応され、ここで、共通の処理ステージは、ニューラルネットワークを備え、ニューラルネットワークは、第1の特徴マップを作るために分離可能な畳み込みを実行し、画像をダウンサンプリングするように構成された少なくとも1つの分離可能な畳み込みモジュールを有し、前記第1の分岐は、分離可能な畳み込みを実行するように構成された少なくとも1つの分離可能な畳み込みモジュールを備えるニューラルネットワークを備える
画像をセグメント化する画像処理システムが提供される。
Conv2d 1/1
(1×1×c×t*c個のパラメータ)
(h×w×1×1×c×t*c個の動作)
Conv2d 3/s
(3×3×t*c×c’個のパラメータ)
(h/s×w/s×3×3×t*c×c’個の動作)
Conv2d 1/1
(1×1×c×t*c個のパラメータ)
(h×w×1×1×c×t*c個の動作)
DWConv 3/s
(3×3×1×t*c個のパラメータ)
(h/s×w/s×3×3×1×t*c個の動作)
Conv2d 1/1
(1×1×t*c×c’個のパラメータ)
(h/s×w/s×1×1×t*c×c’個の動作)
Claims (19)
- 画像を受け取ることと、
第1の特徴マップを作るために共通の処理ステージを用いて前記画像を処理することと、
前記第1の特徴マップを受け取る第1および第2の並列分岐を備える並列処理ステージに前記第1の特徴マップを入力することと、
セマンティックセグメント化された画像を作るために前記第1および第2の分岐の出力を融合ステージで結合することと、
を備え、
前記融合ステージは、前記第1の分岐の前記出力をアップサンプリングすることと、前記第1の分岐の前記アップサンプリングされた出力を前記第2の分岐の前記出力に加算することと、を備え、前記第1の分岐の前記アップサンプリングされた出力は、前記第2の分岐の前記出力への加算の前に深さ方向畳み込みを受け、
前記共通の処理ステージは、ニューラルネットワークを備え、前記ニューラルネットワークは、第1の特徴マップを作るために分離可能な畳み込みを実行し、前記画像をダウンサンプリングするように構成された少なくとも1つの分離可能な畳み込みモジュールを有し、前記第1の分岐は、分離可能な畳み込みを実行するように構成された少なくとも1つの分離可能な畳み込みモジュールを備えるニューラルネットワークを備える、
画像をセグメント化する画像処理方法。 - 第2の分岐は、前記第1の特徴マップが前記第1の分岐の前記出力と結合されることを可能にするためにスキップ接続として機能する、請求項1に記載の画像処理方法。
- 前記第1および第2の分岐からの前記出力は、1つのステージのみで結合される、請求項1または2に記載の画像処理方法。
- 前記第1の分岐内の層の数は、前記共通の処理ステージ内の層の数より多い、請求項1から3のいずれかに記載の画像処理方法。
- 前記加算することは、アップサンプリングされ、深さ方向畳み込みされた前記第1の分岐の出力と前記第2の分岐との対応する値を加算することを備える、請求項1から4のいずれかに記載の画像処理方法。
- 前記融合ステージにおける前記深さ方向畳み込みは、1より大きい膨張係数を用いて実行される、請求項1に記載の画像処理方法。
- 前記第1の分岐のアップサンプリングされた出力は、1より大きい膨張係数を有する深さ方向畳み込みを受け、前記第2の分岐の前記出力は、加算の前に2次元畳み込みを受ける、請求項6に記載の画像処理方法。
- 前記第1および第2の分岐の前記結合された出力は、分類器によって処理される、請求項1から7のいずれかに記載の画像処理方法。
- 前記第1の分岐のステージ内の前記分離可能な畳み込みモジュールは、深さ方向畳み込みモジュールである、請求項1から8のいずれかに記載の画像処理方法。
- 前記第1の分岐内の前記分離可能な畳み込みモジュールは、深さ方向の分離可能な畳み込みモジュールである、請求項1から9のいずれかに記載の画像処理方法。
- 前記第1の分岐内の前記分離可能な畳み込みモジュールは、ボトルネックアーキテクチャモジュールである、請求項1から10のいずれかに記載の画像処理方法。
- 複数のボトルネック残差アーキテクチャモジュールが存在する、請求項11に記載の画像処理方法。
- 前記複数のボトルネック残差アーキテクチャモジュールの後にピラミッドプーリングモジュールが設けられる、請求項12に記載の画像処理方法。
- モデルをトレーニングする方法であって、前記モデルは、画像をセマンティックセグメント化するモデルであり、前記モデルは、
第1の特徴マップを作るための共通の処理ステージと、
前記第1の特徴マップを受け取る第1および第2の並列分岐を備える並列処理ステージと、
セマンティックセグメント化された画像を作るために前記第1および第2の分岐の出力を結合する融合ステージと、
を備え、
前記融合ステージは、前記第1の分岐の前記出力をアップサンプリングすることと、前記第1の分岐の前記アップサンプリングされた出力を前記第2の分岐の前記出力に加算することと、を備え、前記第1の分岐の前記アップサンプリングされた出力は、前記第2の分岐の前記出力への加算の前に深さ方向畳み込みを受け、
前記共通の処理ステージはニューラルネットワークを備え、前記ニューラルネットワークは、第1の特徴マップを作るために、分離可能な畳み込みを実行し、前記画像をダウンサンプリングするように構成された少なくとも1つの分離可能な畳み込みモジュールを有し、前記第1の分岐は、分離可能な畳み込みを実行するように構成された少なくとも1つの分離可能な畳み込みモジュールを備えるニューラルネットワークを備え、
前記トレーニングする方法は、
トレーニングデータを提供することと、ここで前記トレーニングデータは、画像および前記画像に関するセマンティックセグメント化された情報を備え、
入力として前記画像を使用し、出力として前記セマンティックセグメント化された情報を使用して前記モデルをトレーニングすることと、ここで前記共通の処理ステージおよび前記並列処理ステージは一緒にトレーニングされる、
を含む、方法。 - トレーニング中にフィルタの個数を適応させることと、より重要性の低いフィルタを破棄するためにその個数を減らすこととをさらに備える、請求項14に記載の方法。
- 前記共通の処理ステージおよび/または第1の処理分岐ステージに対して少なくとも1つの追加出力を加えるためにトレーニング中に前記モデルを適応させることをさらに備え、前記方法は、入力として前記画像を使用してトレーニングすることと、前記出力と前記少なくとも1つの追加出力との両方での前記セマンティックセグメント化された情報の両方との比較によって損失を決定することと、両方の出力からの前記決定された損失を使用することによってトレーニング中に重みを更新することとをさらに備える、請求項14に記載の方法。
- インターフェースとプロセッサと
を備え、
前記インターフェースは、画像入力を有し、画像を受け取るように適応され、
前記プロセッサは、
第1の特徴マップを作るために共通の処理ステージを用いて前記画像を処理し、
前記第1の特徴マップを受け取る第1および第2の並列分岐を備える並列処理ステージに前記第1の特徴マップを入力し、
セマンティックセグメント化された画像を作るために前記第1および第2の分岐の出力を融合ステージで結合するように適応され、
前記融合ステージは、前記第1の分岐の前記出力をアップサンプリングすることと、前記第1の分岐の前記アップサンプリングされた出力を前記第2の分岐の前記出力に加算することと、を備え、前記第1の分岐の前記アップサンプリングされた出力は、前記第2の分岐の前記出力への加算の前に深さ方向畳み込みを受け、
前記共通の処理ステージは、ニューラルネットワークを備え、前記ニューラルネットワークは、第1の特徴マップを作るために分離可能な畳み込みを実行し、前記画像をダウンサンプリングするように構成された少なくとも1つの分離可能な畳み込みモジュールを有し、前記第1の分岐は、分離可能な畳み込みを実行するように構成された少なくとも1つの分離可能な畳み込みモジュールを備えるニューラルネットワークを備える、
画像をセグメント化する画像処理システム。 - 車両の検出システムであって、前記検出システムは、画像を受け取り、前記画像をセグメント化することによって前記画像から物体を決定するように適応された、請求項17の画像処理システムを含む、検出システム。
- 請求項1から16のいずれかの方法をコンピュータに実行させるように適応されたコンピュータ可読命令を担持する非一時的キャリアメディア。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GB1900883.8 | 2019-01-22 | ||
| GB1900883.8A GB2580671B (en) | 2019-01-22 | 2019-01-22 | A computer vision system and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020119568A JP2020119568A (ja) | 2020-08-06 |
| JP6922005B2 true JP6922005B2 (ja) | 2021-08-18 |
Family
ID=65656010
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020007450A Active JP6922005B2 (ja) | 2019-01-22 | 2020-01-21 | コンピュータビジョンのシステムおよび方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US11315253B2 (ja) |
| JP (1) | JP6922005B2 (ja) |
| GB (1) | GB2580671B (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20250238894A1 (en) * | 2023-03-06 | 2025-07-24 | Boe Technology Group Co., Ltd. | Image super-resolution method, device, and storage medium |
Families Citing this family (42)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20220156554A1 (en) * | 2019-06-04 | 2022-05-19 | Northeastern University | Lightweight Decompositional Convolution Neural Network |
| US11704555B2 (en) * | 2019-06-24 | 2023-07-18 | Baidu Usa Llc | Batch normalization layer fusion and quantization method for model inference in AI neural network engine |
| KR102780560B1 (ko) * | 2020-01-21 | 2025-03-12 | 삼성디스플레이 주식회사 | 잔상 방지 방법 및 이를 포함하는 표시 장치 |
| CN111261283B (zh) * | 2020-01-21 | 2023-05-09 | 浙江理工大学 | 基于金字塔型卷积层的心电信号深度神经网络建模方法 |
| US11947989B2 (en) * | 2020-02-14 | 2024-04-02 | SparkCognition, Inc. | Process flow for model-based applications |
| CN111488887B (zh) * | 2020-04-09 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像处理方法、装置 |
| CN111340141A (zh) * | 2020-04-20 | 2020-06-26 | 天津职业技术师范大学(中国职业培训指导教师进修中心) | 一种基于深度学习的作物幼苗与杂草检测方法及系统 |
| US11657279B2 (en) * | 2020-06-16 | 2023-05-23 | National Taiwan University Of Science And Technology | Electronic device and method for document segmentation |
| CN112329610B (zh) * | 2020-11-03 | 2024-07-12 | 中科九度(北京)空间信息技术有限责任公司 | 一种基于边缘注意力机制融合网络的高压线检测方法 |
| EP4300440B1 (en) | 2020-11-09 | 2025-12-31 | Samsung Electronics Co., Ltd. | IMAGE SEGMENTATION METHOD AND APPARATUS |
| CN112633402B (zh) * | 2020-12-30 | 2024-05-03 | 南京大学 | 一种实现动态计算的高精度高比例的分类模型及分类方法 |
| KR20220100476A (ko) * | 2021-01-08 | 2022-07-15 | 주식회사 모아이스 | 골프 스윙에 관한 정보를 추정하기 위한 방법, 디바이스 및 비일시성의 컴퓨터 판독 가능한 기록 매체 |
| CN112837320B (zh) * | 2021-01-29 | 2023-10-27 | 华中科技大学 | 一种基于并行空洞卷积的遥感影像语义分割方法 |
| CN112966624B (zh) * | 2021-03-16 | 2025-02-25 | 北京主线科技有限公司 | 一种车道线检测方法、装置、电子设备和存储介质 |
| CN113128345A (zh) * | 2021-03-22 | 2021-07-16 | 深圳云天励飞技术股份有限公司 | 多任务属性识别方法及设备、计算机可读存储介质 |
| KR20220132375A (ko) * | 2021-03-23 | 2022-09-30 | 현대모비스 주식회사 | 차량 영상의 화소를 분류하는 행렬 곱셈 가속기에 최적화된 임베디드 의미 분할 네트워크 장치 |
| BR112023018634A2 (pt) * | 2021-03-25 | 2023-10-10 | Qualcomm Inc | Aprendizado residual difundido |
| CN113269734B (zh) * | 2021-05-14 | 2023-04-07 | 成都市第三人民医院 | 一种基于元学习特征融合策略的肿瘤图像检测方法及装置 |
| CN113420641B (zh) * | 2021-06-21 | 2024-06-14 | 梅卡曼德(北京)机器人科技有限公司 | 图像数据处理方法、装置、电子设备和存储介质 |
| CN113688864B (zh) * | 2021-07-14 | 2022-05-27 | 淮阴工学院 | 一种基于分裂注意力的人-物交互关系分类方法 |
| KR102687000B1 (ko) * | 2021-07-30 | 2024-07-22 | 주식회사 마크애니 | 이미지에 표시된 대상체의 색상 검출 방법 및 장치 |
| CN115705633B (zh) * | 2021-08-05 | 2026-01-23 | 中移(成都)信息通信科技有限公司 | 模型训练方法、装置及存储介质 |
| CN113743524A (zh) * | 2021-09-14 | 2021-12-03 | 哈尔滨理工大学 | 一种基于双通道特征融合的图像语义分割方法 |
| CN114022354B (zh) * | 2021-09-18 | 2025-06-10 | 原力图新(重庆)科技有限公司 | 图像处理方法、电子设备及计算机程序产品 |
| CN113947144B (zh) * | 2021-10-15 | 2022-05-17 | 北京百度网讯科技有限公司 | 用于对象检测的方法、装置、设备、介质和程序产品 |
| US12488576B2 (en) * | 2021-12-07 | 2025-12-02 | X Development Llc | Hierarchical context in risk assessment using machine learning |
| US12333798B2 (en) * | 2022-03-16 | 2025-06-17 | Maxar Space Llc | Convolutional neural network (CNN) for automatic target recognition in a satellite |
| CN114581671B (zh) * | 2022-04-24 | 2024-09-06 | 湖南师范大学 | 一种图像的语义分割方法、装置及计算机可读存储介质 |
| WO2024096938A2 (en) * | 2022-07-22 | 2024-05-10 | Numerica Corporation | Multi-target detection using convex sparsity prior |
| CN115376024B (zh) * | 2022-08-02 | 2025-09-09 | 国网江苏省电力有限公司盐城供电分公司 | 一种输电线路电力配件语义分割方法 |
| CN115661636B (zh) * | 2022-09-27 | 2025-09-05 | 西安电子科技大学 | 基于特征分离卷积神经网络的sar图像目标检测方法 |
| CN115761238B (zh) * | 2022-12-19 | 2024-09-17 | 桂林电子科技大学 | 基于多分支深度可分离空洞卷积的实时语义分割方法 |
| CN116030348B (zh) * | 2023-01-10 | 2024-10-25 | 淮阴工学院 | 一种基于LS-YOLOv5网络的绿豆叶斑病病斑检测方法及装置 |
| CN116563315A (zh) * | 2023-03-28 | 2023-08-08 | 上海师范大学 | 一种医学图像腺体分割方法 |
| CN116935099A (zh) * | 2023-06-19 | 2023-10-24 | 中国移动通信集团有限公司研究院 | 图像处理方法、装置、电子设备及可读存储介质 |
| CN116994243B (zh) * | 2023-07-31 | 2024-04-02 | 安徽省农业科学院农业经济与信息研究所 | 一种轻量级农业害虫检测方法及系统 |
| US20250063261A1 (en) * | 2023-08-18 | 2025-02-20 | Tobii Technologies Limited | Demosaicing module for an image signal processing pipeline |
| CN117593639B (zh) * | 2023-11-21 | 2024-05-28 | 北京天鼎殊同科技有限公司 | 公路及其附属物的提取方法、装置、设备及介质 |
| CN117456191B (zh) * | 2023-12-15 | 2024-03-08 | 武汉纺织大学 | 一种基于三分支网络结构的复杂环境下语义分割方法 |
| CN118212416B (zh) * | 2024-04-08 | 2025-02-25 | 天津理工大学 | 一种用于自动驾驶的交通场景图像实时语义分割方法 |
| CN120496063B (zh) * | 2025-04-30 | 2026-01-06 | 梧州学院 | 一种适用于水稻茎秆截面小维管束检测方法 |
| CN120912600B (zh) * | 2025-10-09 | 2026-02-06 | 南昌华翔汽车内外饰件有限公司 | 车辆塑料件的检测方法、系统、存储介质及计算机 |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7444383B2 (en) | 2000-06-17 | 2008-10-28 | Microsoft Corporation | Bounded-deferral policies for guiding the timing of alerting, interaction and communications using local sensory information |
| EP2256667B1 (en) | 2009-05-28 | 2012-06-27 | Honda Research Institute Europe GmbH | Driver assistance system or robot with dynamic attention module |
| JP5716343B2 (ja) | 2010-10-01 | 2015-05-13 | トヨタ自動車株式会社 | 車両の物体認識システム |
| US9499197B2 (en) | 2014-10-15 | 2016-11-22 | Hua-Chuang Automobile Information Technical Center Co., Ltd. | System and method for vehicle steering control |
| US20180225554A1 (en) | 2017-02-06 | 2018-08-09 | Honda Motor Co., Ltd. | Systems and methods of a computational framework for a driver's visual attention using a fully convolutional architecture |
| WO2018170393A2 (en) * | 2017-03-17 | 2018-09-20 | Portland State University | Frame interpolation via adaptive convolution and adaptive separable convolution |
| CN108510473A (zh) * | 2018-03-09 | 2018-09-07 | 天津工业大学 | 结合深度可分离卷积与通道加权的fcn视网膜图像血管分割 |
| CN109101878B (zh) * | 2018-07-01 | 2020-09-29 | 浙江工业大学 | 一种用于秸秆燃值估计的图像分析系统及图像分析方法 |
| US11600006B2 (en) * | 2018-10-26 | 2023-03-07 | Here Global B.V. | Deep neural network architecture for image segmentation |
| US10769744B2 (en) * | 2018-10-31 | 2020-09-08 | Kabushiki Kaisha Toshiba | Computer vision system and method |
-
2019
- 2019-01-22 GB GB1900883.8A patent/GB2580671B/en active Active
-
2020
- 2020-01-14 US US16/741,804 patent/US11315253B2/en active Active
- 2020-01-21 JP JP2020007450A patent/JP6922005B2/ja active Active
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20250238894A1 (en) * | 2023-03-06 | 2025-07-24 | Boe Technology Group Co., Ltd. | Image super-resolution method, device, and storage medium |
Also Published As
| Publication number | Publication date |
|---|---|
| GB2580671A (en) | 2020-07-29 |
| US20200234447A1 (en) | 2020-07-23 |
| JP2020119568A (ja) | 2020-08-06 |
| US11315253B2 (en) | 2022-04-26 |
| GB2580671B (en) | 2022-05-04 |
| GB201900883D0 (en) | 2019-03-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6922005B2 (ja) | コンピュータビジョンのシステムおよび方法 | |
| JP6818806B2 (ja) | コンピュータビジョンシステム及び方法 | |
| Emara et al. | Liteseg: A novel lightweight convnet for semantic segmentation | |
| US11461998B2 (en) | System and method for boundary aware semantic segmentation | |
| CN116188999B (zh) | 一种基于可见光和红外图像数据融合的小目标检测方法 | |
| US10832097B2 (en) | Device and a method for image classification using a convolutional neural network | |
| CN107506707B (zh) | 采用嵌入式系统中的小规模卷积神经网络模块的人脸检测 | |
| US10510146B2 (en) | Neural network for image processing | |
| EP3427195B1 (en) | Convolutional neural networks, particularly for image analysis | |
| CN107909026B (zh) | 基于小规模卷积神经网络年龄和/或性别评估方法及系统 | |
| Yang et al. | Real-time pedestrian and vehicle detection for autonomous driving | |
| CN111598030A (zh) | 一种航拍图像中车辆检测和分割的方法及系统 | |
| CN112200189B (zh) | 基于SPP-YOLOv3的车型识别方法、装置及计算机可读存储介质 | |
| US20220111860A1 (en) | Detecting objects and determining behaviors of objects | |
| Hua et al. | Convolutional networks with bracket-style decoder for semantic scene segmentation | |
| CN115512302A (zh) | 基于改进YOLOX-s模型的车辆检测方法及系统 | |
| JP2022123903A (ja) | 物体検出システムおよび物体検出方法 | |
| CN115017931A (zh) | 一种批量qr码实时提取方法及系统 | |
| Hussain et al. | Image segmentation for autonomous driving using u-net inception | |
| CN115082867B (zh) | 用于对象检测的方法和系统 | |
| CN113780189A (zh) | 一种基于U-Net改进的车道线检测方法 | |
| KR20220146750A (ko) | 그룹 확장 컨벌루션 모듈 기반 시멘틱 분할 네트워크 시스템 및 방법 | |
| Rao et al. | A Deep Learning Approach Towards Building Intelligent Transport System | |
| JP2020038572A (ja) | 画像学習プログラム、画像学習方法、画像認識プログラム、画像認識方法、学習データセットの生成プログラム、学習データセットの生成方法、学習データセット、及び画像認識装置 | |
| Rakhmonov et al. | Airy YOLOv5 for Disabled Sign Detection |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200302 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210420 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210511 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210526 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210629 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210728 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6922005 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |