JP7092016B2 - 画像処理装置、方法、及びプログラム - Google Patents
画像処理装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP7092016B2 JP7092016B2 JP2018233709A JP2018233709A JP7092016B2 JP 7092016 B2 JP7092016 B2 JP 7092016B2 JP 2018233709 A JP2018233709 A JP 2018233709A JP 2018233709 A JP2018233709 A JP 2018233709A JP 7092016 B2 JP7092016 B2 JP 7092016B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- resolution
- label
- low
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/174—Segmentation; Edge detection involving the use of two or more images
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
20 演算部
30 ダウンサンプリング部
32 セマンティックセグメンテーション部
34 アップサンプリング部
50 出力部
100 画像処理装置
Claims (5)
- 入力画像と、前記入力画像の解像度と、画像の各画素にラベルを付与する学習済みモデルの学習に用いた学習用画像の解像度とに基づいて、前記入力画像と、前記学習用画像に対応する解像度である低解像画像との画素の対応関係に関する複数のシフト量の各々について、前記シフト量を用いて前記入力画像から低解像度画像の各々を生成し、生成した前記低解像度画像の各々と前記低解像度画像の生成に用いた前記シフト量の各々とを出力するダウンサンプリング部と、
前記学習済みモデルに前記低解像度画像の各々を入力し、前記低解像度画像の各々の各画素にラベルを付与した低解像度ラベル画像の各々を出力するセマンティックセグメンテーション処理部と、
前記低解像度画像の生成に用いた前記シフト量の各々と、前記低解像度ラベル画像の各々とに基づいて、前記入力画像の各画素のラベルを求めたラベル画像を出力するアップサンプリング部と、
を含む画像処理装置。 - 前記アップサンプリング部は、前記低解像度ラベル画像ごとに、前記入力画像に対して、前記シフト量に応じて前記低解像度ラベル画像を割り当てた結果に基づいて、前記入力画像の各画素について、前記低解像度ラベル画像の各画素との重なりの割合に応じた各ラベルのスコアを付与した個別のラベル画像の各々を算出し、各画素について、前記個別のラベル画像の各々の前記画素について付与された各ラベルのスコアを統合して前記画素のラベルを決定することにより前記ラベル画像を出力する請求項1に記載の画像処理装置。
- ダウンサンプリング部が、入力画像と、前記入力画像の解像度と、画像の各画素にラベルを付与する学習済みモデルの学習に用いた学習用画像の解像度とに基づいて、前記入力画像と、前記学習用画像に対応する解像度である低解像画像との画素の対応関係に関する複数のシフト量の各々について、前記シフト量を用いて前記入力画像から低解像度画像の各々を生成し、生成した前記低解像度画像の各々と前記低解像度画像の生成に用いた前記シフト量の各々とを出力するステップと、
セマンティックセグメンテーション処理部が、前記学習済みモデルに前記低解像度画像の各々を入力し、前記低解像度画像の各々の各画素にラベルを付与した低解像度ラベル画像の各々を出力するステップと、
アップサンプリング部が、前記低解像度画像の生成に用いた前記シフト量の各々と、前記低解像度ラベル画像の各々とに基づいて、前記入力画像の各画素のラベルを求めたラベル画像を出力するステップと、
を含む画像処理方法。 - 前記アップサンプリング部が処理するステップは、前記低解像度ラベル画像ごとに、前記入力画像に対して、前記シフト量に応じて前記低解像度ラベル画像を割り当てた結果に基づいて、前記入力画像の各画素について、前記低解像度ラベル画像の各画素との重なりの割合に応じた各ラベルのスコアを付与した個別のラベル画像の各々を算出し、各画素について、前記個別のラベル画像の各々の前記画素について付与された各ラベルのスコアを統合して前記画素のラベルを決定することにより前記ラベル画像を出力する請求項3に記載の画像処理方法。
- コンピュータを、請求項1又は請求項2に記載の画像処理装置の各部として機能させるためのプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018233709A JP7092016B2 (ja) | 2018-12-13 | 2018-12-13 | 画像処理装置、方法、及びプログラム |
| PCT/JP2019/048008 WO2020121996A1 (ja) | 2018-12-13 | 2019-12-09 | 画像処理装置、方法、及びプログラム |
| US17/413,429 US12039736B2 (en) | 2018-12-13 | 2019-12-09 | Image processing device, method, and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018233709A JP7092016B2 (ja) | 2018-12-13 | 2018-12-13 | 画像処理装置、方法、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020095526A JP2020095526A (ja) | 2020-06-18 |
| JP7092016B2 true JP7092016B2 (ja) | 2022-06-28 |
Family
ID=71076887
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018233709A Active JP7092016B2 (ja) | 2018-12-13 | 2018-12-13 | 画像処理装置、方法、及びプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US12039736B2 (ja) |
| JP (1) | JP7092016B2 (ja) |
| WO (1) | WO2020121996A1 (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPWO2022209390A1 (ja) * | 2021-03-31 | 2022-10-06 | ||
| TW202407640A (zh) * | 2022-07-20 | 2024-02-16 | 日商索尼半導體解決方案公司 | 資訊處理裝置、資訊處理方法、及程式 |
| WO2024075162A1 (ja) * | 2022-10-03 | 2024-04-11 | 日本電信電話株式会社 | 画像修復装置、画像修復方法、および画像修復プログラム |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004096489A (ja) | 2002-08-30 | 2004-03-25 | Seiko Epson Corp | 画像処理装置及びその方法、画像形成装置、並びにコンピュータが読出し可能なプログラム |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10657364B2 (en) * | 2016-09-23 | 2020-05-19 | Samsung Electronics Co., Ltd | System and method for deep network fusion for fast and robust object detection |
| TWI668669B (zh) * | 2018-05-31 | 2019-08-11 | 國立中央大學 | 物件追蹤系統及方法 |
-
2018
- 2018-12-13 JP JP2018233709A patent/JP7092016B2/ja active Active
-
2019
- 2019-12-09 US US17/413,429 patent/US12039736B2/en active Active
- 2019-12-09 WO PCT/JP2019/048008 patent/WO2020121996A1/ja not_active Ceased
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004096489A (ja) | 2002-08-30 | 2004-03-25 | Seiko Epson Corp | 画像処理装置及びその方法、画像形成装置、並びにコンピュータが読出し可能なプログラム |
Non-Patent Citations (1)
| Title |
|---|
| LONG, Jonathan et al.,Fully Convolutional Networks for Semantic Segmentation,2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) [online],2015年10月15日,pp. 3431-3440,[retrieved on 2020.1.24],Retrieved from IEEE Xplore,INSPEC Accession Number: 15524435 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020095526A (ja) | 2020-06-18 |
| US12039736B2 (en) | 2024-07-16 |
| US20220058807A1 (en) | 2022-02-24 |
| WO2020121996A1 (ja) | 2020-06-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN112446383B (zh) | 车牌识别方法及装置、存储介质、终端 | |
| CN111968064B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
| AU2021354030A1 (en) | Processing images using self-attention based neural networks | |
| WO2019081623A1 (en) | SELF-REGRESSIVE NEURAL NETWORK SYSTEMS INCLUDING A SOFTWARE ATTENTION MECHANISM USING SUPPORT DATA CORRECTIVES | |
| CN111723841A (zh) | 文本检测方法、装置、电子设备及存储介质 | |
| CN109858327B (zh) | 一种基于深度学习的字符分割方法 | |
| CN120035849A (zh) | 用于图像和视频的全景分割的通用框架 | |
| JP7092016B2 (ja) | 画像処理装置、方法、及びプログラム | |
| CN109977832B (zh) | 一种图像处理方法、装置及存储介质 | |
| JP2020024612A (ja) | 画像処理装置、画像処理方法、処理装置、処理方法、及びプログラム | |
| CN116071748B (zh) | 一种基于频域全局滤波的无监督视频目标分割方法 | |
| JP2020038574A (ja) | 画像学習プログラム、画像学習方法、画像認識プログラム、画像認識方法、及び画像認識装置 | |
| CN109657538B (zh) | 基于上下文信息指导的场景分割方法和系统 | |
| CN119863371A (zh) | 一种基于半通道傅里叶变换的检测驱动雾天图像增强方法 | |
| JP2017068608A (ja) | 演算装置、方法及びプログラム | |
| Zhang et al. | Boosting no-reference super-resolution image quality assessment with knowledge distillation and extension | |
| CN116740376B (zh) | 基于金字塔集成和注意力加强的目标检测方法及装置 | |
| CN115359000B (zh) | 一种无参考图像质量评价方法、装置及存储介质 | |
| CN116630245A (zh) | 一种基于显著性图引导和不确定性语义增强的息肉分割方法 | |
| CN119785159B (zh) | 一种基于多尺度特征融合的图像色彩美学评估方法 | |
| CN114429602B (zh) | 语义分割方法、装置、电子设备及存储介质 | |
| JP2020038572A (ja) | 画像学習プログラム、画像学習方法、画像認識プログラム、画像認識方法、学習データセットの生成プログラム、学習データセットの生成方法、学習データセット、及び画像認識装置 | |
| CN117649578A (zh) | 通用特征图获取方法及相关设备 | |
| JP7315516B2 (ja) | 骨格推定装置及びプログラム | |
| CN121033631B (zh) | 基于计算机视觉的高刚度结构靶点振动识别方法、系统、终端及介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210312 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220517 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220530 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7092016 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |