JP6158882B2 - 生成装置、生成方法、及び生成プログラム - Google Patents
生成装置、生成方法、及び生成プログラム Download PDFInfo
- Publication number
- JP6158882B2 JP6158882B2 JP2015184742A JP2015184742A JP6158882B2 JP 6158882 B2 JP6158882 B2 JP 6158882B2 JP 2015184742 A JP2015184742 A JP 2015184742A JP 2015184742 A JP2015184742 A JP 2015184742A JP 6158882 B2 JP6158882 B2 JP 6158882B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- generation
- processing
- intermediate image
- recognition rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
〔1.生成処理〕
まず、図1を用いて、実施形態に係る生成処理の一例について説明する。図1は、実施形態に係る生成処理の一例を示す図である。図1に示す生成装置100は、画像に含まれる所定の対象を認識し、その所定の対象が含まれる領域に基づいて画像を加工する。具体的には、生成装置100は、画像に含まれる犬の顔を認識し、画像中の犬の顔が含まれる領域をトリミングする。また、生成装置100がトリミングにより生成した画像は、例えば所定のコンテンツの画像として配信されるが、詳細は後述する。
次に、図2を用いて、実施形態に係る生成装置100の構成について説明する。図2は、実施形態に係る生成装置100の構成例を示す図である。図2に示すように、生成装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、生成装置100は、生成装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、端末装置10との間で情報の送受信を行う。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図2に示すように、学習情報記憶部121と、画像情報記憶部122とを有する。
実施形態に係る学習情報記憶部121は、学習に関する各種情報を記憶する。例えば、図3では、学習情報記憶部121は、所定の学習処理により生成された学習器LEに関する学習情報(モデル)を記憶する。図3に、実施形態に係る学習情報記憶部121の一例を示す。図3に示す学習情報記憶部121は、「重み(wij)」を記憶する。
実施形態に係る画像情報記憶部122は、画像に関する各種情報を記憶する。図4に、実施形態に係る画像情報記憶部122の一例を示す。図4に示す画像情報記憶部122は、「画像ID」、「画像」といった項目を有する。
図2の説明に戻って、制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置100内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
取得部131は、画像を取得する。例えば、取得部131は、外部の情報処理装置から画像を取得する。図1では、取得部131は、外部の情報処理装置から画像IM11を取得する。なお、画像情報記憶部122に元となる画像(例えば、画像IM11)が記憶される場合、取得部131は、画像情報記憶部122から画像(例えば、画像IM11)を取得してもよい。
抽出部132は、画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、所定の対象の認識率向上に寄与する中間画像を抽出する。例えば、抽出部132は、画像に含まれる犬を認識するニューラルネットワークの中間層における中間画像群から、犬の認識率向上に寄与する中間画像を抽出する。また、例えば、抽出部132は、畳み込み処理及びプーリング処理を行うニューラルネットワークの中間層における中間画像群から、所定の対象の認識率向上に寄与する中間画像を抽出する。例えば、抽出部132は、CNNの中間層における中間画像群から、所定の対象の認識率向上に寄与する中間画像を抽出する。
生成部133は、抽出部132により抽出された中間画像を合成した合成画像を生成する。例えば、生成部133は、加工による所定の対象の認識率の変化に応じて重み付けした中間画像を合成した合成画像を生成する。例えば、生成部133は、上記式(2)を用いて、加工による所定の対象の認識率の変化に応じて重み付けした中間画像を合成した合成画像を生成する。図1では、生成部133は、中間画像MM12、MM14、MM17、MM18を合成した合成画像CM11を生成する。
加工部134は、合成画像に基づいて、画像から所定の対象が含まれる領域の画像を取り出す。例えば、加工部134は、合成画像に基づいて、画像から犬の顔が含まれる領域の画像を取り出す。図1では、加工部134は、合成画像CM11を用いて特定された画像IM11の特徴、すなわち犬の顔を含む領域AR11をトリミングする。例えば、加工部134は、画像IM11のうち犬の顔を含む領域AR11をトリミングする。これにより、加工部134は、犬の顔を含む加工画像IM12を生成する。
送信部135は、外部の情報処理装置へ各種情報を送信する。例えば、送信部135は、加工部134により生成された画像を外部の情報処理装置へ送信する。図1では、送信部135は、加工画像IM12を配信する。また、送信部135は、生成装置100がコンテンツを配信する場合、コンテンツを要求した端末装置へ加工画像IM12を含むコンテンツを送信してもよい。
ここで、図5を用いて、実施形態に係る生成装置100による中間画像の取得処理の手順について説明する。図5は、実施形態に係る中間画像群の取得の一例を示すフローチャートである。
次に、図6を用いて、実施形態に係る生成装置100による合成画像の生成処理の手順について説明する。図6は、実施形態に係る合成画像の生成の一例を示すフローチャートである。
次に、図7を用いて、実施形態に係る生成装置100による合成画像を用いた画像の加工処理の手順について説明する。図7は、実施形態に係る画像の加工の一例を示すフローチャートである。
次に、図8を用いて、生成装置100により生成された加工画像IM12の表示例を示す。図8は、実施形態に係る端末装置における加工画像の表示例を示す図である。
上述してきたように、実施形態に係る生成装置100は、抽出部132と、生成部133とを有する。抽出部132は、画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、所定の対象の認識率向上に寄与する中間画像を抽出する。生成部133は、抽出部132により抽出された中間画像を合成した合成画像を生成する。
上述してきた実施形態に係る生成装置100は、例えば図9に示すような構成のコンピュータ1000によって実現される。図9は、生成装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
121 学習情報記憶部
122 画像情報記憶部
130 制御部
131 取得部
132 抽出部
133 生成部
134 加工部
135 送信部
Claims (8)
- 画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、前記中間画像群に含まれる中間画像の各々への加工に応じた前記所定の対象の認識率の変化に基づいて、前記所定の対象の認識率向上に寄与する中間画像を抽出する抽出部と、
前記抽出部により抽出された前記中間画像を合成した合成画像を生成する生成部と、
を備えることを特徴とする生成装置。 - 前記抽出部は、
前記加工により前記所定の対象の認識率を向上させる前記中間画像を抽出する
ことを特徴とする請求項1に記載の生成装置。 - 前記生成部は、
前記加工による前記所定の対象の認識率の変化に応じて重み付けした前記中間画像を合成した合成画像を生成する
ことを特徴とする請求項1または請求項2に記載の生成装置。 - 前記生成部により生成された前記合成画像に基づいて、前記画像を加工する加工部、
をさらに備えることを特徴とする請求項1〜3のいずれか1項に記載の生成装置。 - 前記加工部は、
前記合成画像に基づいて、前記画像から前記所定の対象が含まれる領域の画像を取り出す
ことを特徴とする請求項4に記載の生成装置。 - 前記抽出部は、
畳み込み処理及びプーリング処理を行うニューラルネットワークの中間層における中間画像群から、前記所定の対象の認識率向上に寄与する中間画像を抽出する
ことを特徴とする請求項1〜5のいずれか1項に記載の生成装置。 - コンピュータが実行する生成方法であって、
画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、前記中間画像群に含まれる中間画像の各々への加工に応じた前記所定の対象の認識率の変化に基づいて、前記所定の対象の認識率向上に寄与する中間画像を抽出する抽出工程と、
前記抽出工程により抽出された前記中間画像を合成した合成画像を生成する生成工程と、
を含むことを特徴とする生成方法。 - 画像中の所定の対象を認識するニューラルネットワークの中間層における中間画像群から、前記中間画像群に含まれる中間画像の各々への加工に応じた前記所定の対象の認識率の変化に基づいて、前記所定の対象の認識率向上に寄与する中間画像を抽出する抽出手順と、
前記抽出手順により抽出された前記中間画像を合成した合成画像を生成する生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015184742A JP6158882B2 (ja) | 2015-09-18 | 2015-09-18 | 生成装置、生成方法、及び生成プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015184742A JP6158882B2 (ja) | 2015-09-18 | 2015-09-18 | 生成装置、生成方法、及び生成プログラム |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017051067A Division JP6214073B2 (ja) | 2017-03-16 | 2017-03-16 | 生成装置、生成方法、及び生成プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017059090A JP2017059090A (ja) | 2017-03-23 |
| JP6158882B2 true JP6158882B2 (ja) | 2017-07-05 |
Family
ID=58391649
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015184742A Active JP6158882B2 (ja) | 2015-09-18 | 2015-09-18 | 生成装置、生成方法、及び生成プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6158882B2 (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7146372B2 (ja) * | 2017-06-21 | 2022-10-04 | キヤノン株式会社 | 画像処理装置、撮像装置、画像処理方法、プログラム、および、記憶媒体 |
| JP6352512B1 (ja) * | 2017-08-22 | 2018-07-04 | 株式会社 ディー・エヌ・エー | 信号処理装置、信号処理方法、信号処理プログラム、及びデータ構造 |
| JP6554193B1 (ja) | 2018-01-30 | 2019-07-31 | 三菱電機インフォメーションシステムズ株式会社 | 記入領域抽出装置および記入領域抽出プログラム |
| JP6757349B2 (ja) | 2018-03-12 | 2020-09-16 | 株式会社東芝 | 固定小数点を用いて認識処理を行う多層の畳み込みニューラルネットワーク回路を実現する演算処理装置 |
| JP7135504B2 (ja) * | 2018-07-02 | 2022-09-13 | カシオ計算機株式会社 | 画像識別装置、画像識別方法及びプログラム |
| JP7055769B2 (ja) * | 2019-04-23 | 2022-04-18 | 株式会社東芝 | データ生成装置、データ生成方法およびプログラム |
| EP3748540A1 (en) * | 2019-06-06 | 2020-12-09 | Koninklijke Philips N.V. | Deep neural network visualisation |
| JP7179705B2 (ja) * | 2019-09-09 | 2022-11-29 | ヤフー株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
| JP2022138761A (ja) * | 2021-03-11 | 2022-09-26 | セイコーエプソン株式会社 | 方法、装置、および、コンピュータープログラム |
| WO2023157439A1 (ja) * | 2022-02-18 | 2023-08-24 | 富士フイルム株式会社 | 画像処理装置及びその作動方法、推論装置並びに学習装置 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0447474A (ja) * | 1990-06-14 | 1992-02-17 | Canon Inc | ニューラルネットワークを用いた画像処理方式 |
| JPH05101187A (ja) * | 1991-10-09 | 1993-04-23 | Kawasaki Steel Corp | 画像認識装置及びその学習方法 |
| JPH0830728A (ja) * | 1994-07-12 | 1996-02-02 | Suzuki Motor Corp | 画像の二値化装置 |
| JP5997545B2 (ja) * | 2012-08-22 | 2016-09-28 | キヤノン株式会社 | 信号処理方法及び信号処理装置 |
| JP6137916B2 (ja) * | 2013-04-01 | 2017-05-31 | キヤノン株式会社 | 信号処理装置、信号処理方法、及び、信号処理システム |
-
2015
- 2015-09-18 JP JP2015184742A patent/JP6158882B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2017059090A (ja) | 2017-03-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6158882B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
| CN108140032B (zh) | 用于自动视频概括的设备和方法 | |
| CN110795976B (zh) | 一种训练物体检测模型的方法、装置以及设备 | |
| TWI601077B (zh) | 媒體內容分析系統與方法 | |
| JP2017211939A (ja) | 生成装置、生成方法、及び生成プログラム | |
| US9779329B2 (en) | Image processing apparatus, image processing method and program | |
| US11620480B2 (en) | Learning method, computer program, classifier, and generator | |
| CN112001488A (zh) | 训练生成型对抗性网络 | |
| JP2019046269A (ja) | 機械学習用訓練データの生成 | |
| KR20190054702A (ko) | 영상에서 객체의 행동을 인식하는 방법 및 그 장치 | |
| JP2023502140A (ja) | タスク固有のデータ利用のための物理学により誘導されたディープマルチモーダル埋め込みのための方法及び装置 | |
| CN113095351A (zh) | 借助于初始标记的改善生成经标记的数据的方法 | |
| CN119540518A (zh) | 图像和视频中的实时显著目标检测 | |
| JP6389742B2 (ja) | 画像セグメンテーション方法、装置、及びプログラム | |
| JP2013120441A (ja) | 画像識別情報付与プログラム及び画像識別情報付与装置 | |
| WO2020170803A1 (ja) | 拡張装置、拡張方法及び拡張プログラム | |
| JP6214073B2 (ja) | 生成装置、生成方法、及び生成プログラム | |
| US12586344B2 (en) | Generative model for multi-modality outputs from a single input | |
| KR20250129715A (ko) | 예술적 스타일들에 따른 아바타 생성 | |
| JP2014149788A (ja) | 物体領域境界推定装置、物体領域境界推定方法及び物体領域境界推定プログラム | |
| KR101592087B1 (ko) | 배경 영상의 위치를 이용한 관심맵 생성 방법 및 이를 기록한 기록 매체 | |
| CN112836076B (zh) | 一种图像标签生成方法、装置及设备 | |
| CN118262264B (zh) | 视频动作分割与评估方法 | |
| CN118350450B (zh) | 联邦混合域泛化目标检测方法、装置、电子设备及介质 | |
| CN113378707A (zh) | 对象识别方法及装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20161220 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170316 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20170328 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170509 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170608 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6158882 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |