JP7400972B2 - 認識器学習装置、認識器学習方法、および認識器学習プログラム - Google Patents
認識器学習装置、認識器学習方法、および認識器学習プログラム Download PDFInfo
- Publication number
- JP7400972B2 JP7400972B2 JP2022531262A JP2022531262A JP7400972B2 JP 7400972 B2 JP7400972 B2 JP 7400972B2 JP 2022531262 A JP2022531262 A JP 2022531262A JP 2022531262 A JP2022531262 A JP 2022531262A JP 7400972 B2 JP7400972 B2 JP 7400972B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- recognizer
- data
- score
- learning data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Description
本実施形態では、効率的なAUC最大化学習のため、認識器の学習状況に合わせて適応的に学習効果の高い学習用データを選定する。学習途中の認識器において誤認識されやすい学習用データを、学習効果の高い、認識が困難な学習用データであるとし、認識が困難な学習用データの設定とそれに基づく学習ペアの選定を行う。ラベルを決定するための閾値を、ROC曲線の形状から決定し、決定した閾値によって誤認識する学習用データを、認識が困難な学習用データとして選び出す。選ばれた、認識が困難な学習用データを中心に学習ペアを構築することで、効率的な学習を実現する。
図2は、本実施形態の認識器学習装置10のハードウェア構成を示すブロック図である。
(1)
(2)
(3)
(4)
(5)
(6)
(7)
となる学習用データを、認識が困難な学習用データPhとし、残りをPeとする。負例データNについては
となる学習用データを、認識が困難な学習用データNhとし、残りをNeとする。選択された学習用データの各集合Ph、Pe、Nh、Neを用いて再度、学習部24による学習が行われる。
次に、認識器学習装置10の作用について説明する。図4は、認識器学習装置10による認識器学習処理の流れを示すフローチャートである。CPU11がROM12またはストレージ14から認識器学習プログラムを読み出して、RAM13に展開して実行することにより、認識器学習処理が行なわれる。また、認識器学習装置10に、学習用ラベルが与えられた複数の学習用データの入力が入力される。
(8)
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、
前記プロセッサは、
学習用ラベルが与えられた複数の学習用データに基づいて、データのラベルを認識する認識器を学習し、
前記学習された認識器を用いて、前記複数の学習用データの各々について、前記認識器が出力するスコアを算出し、
前記複数の学習用データの各々について算出されたスコアに基づいて得られる、真陽性率と偽陽性率との対応関係を表すROC(Receiver Operating Characteristic)曲線の形状に基づいて、ラベルを決定するための前記スコアに関する閾値を決定し、
前記決定された閾値と、前記複数の学習用データの各々について算出されたスコアとに基づいて、前記認識器による認識が困難な前記学習用データを選択することを
予め定められた反復終了条件を満たすまで繰り返し、
前記学習することでは、前記学習用データの選択結果に応じた前記学習用データに基づいて、前記認識器を学習する
認識器学習装置。
認識器学習処理を実行するようにコンピュータによって実行可能なプログラムを記憶した非一時的記憶媒体であって、
前記認識器学習処理は、
学習用ラベルが与えられた複数の学習用データに基づいて、データのラベルを認識する認識器を学習し、
前記学習された認識器を用いて、前記複数の学習用データの各々について、前記認識器が出力するスコアを算出し、
前記複数の学習用データの各々について算出されたスコアに基づいて得られる、真陽性率と偽陽性率との対応関係を表すROC(Receiver Operating Characteristic)曲線の形状に基づいて、ラベルを決定するための前記スコアに関する閾値を決定し、
前記決定された閾値と、前記複数の学習用データの各々について算出されたスコアとに基づいて、前記認識器による認識が困難な前記学習用データを選択することを
予め定められた反復終了条件を満たすまで繰り返し、
前記学習することでは、前記学習用データの選択結果に応じた前記学習用データに基づいて、前記認識器を学習する
非一時的記憶媒体。
15 入力部
16 表示部
20 学習用データ記憶部
22 学習用ラベル記憶部
24 学習部
26 パラメータ記憶部
28 スコア算出部
30 閾値決定部
32 選択部
34 選択データ記憶部
Claims (7)
- 学習用ラベルが与えられた複数の学習用データに基づいて、データのラベルを認識する認識器を学習する学習部と、
前記学習された認識器を用いて、前記複数の学習用データの各々について、前記認識器が出力するスコアを算出するスコア算出部と、
前記複数の学習用データの各々について算出されたスコアに基づいて得られる、真陽性率と偽陽性率との対応関係を表すROC(Receiver Operating Characteristic)曲線の形状に基づいて、ラベルを決定するための前記スコアに関する閾値を決定する閾値決定部と、
前記決定された閾値と、前記複数の学習用データの各々について算出されたスコアとに基づいて、前記認識器による認識が困難な前記学習用データを選択する選択部と、
を含み、
予め定められた反復終了条件を満たすまで、前記学習部による学習、前記スコア算出部による算出、前記閾値決定部による決定、および前記選択部による選択を繰り返し、
前記学習部は、前記選択部による前記学習用データの選択結果に応じた前記学習用データに基づいて、前記認識器を学習する
認識器学習装置。 - 前記選択部は、
前記スコアが前記閾値以上であって、前記スコアが前記閾値以上である場合に認識されるラベルと前記学習用ラベルとが一致しない前記学習用データと、
前記スコアが前記閾値未満であって、前記スコアが前記閾値未満である場合に認識されるラベルと前記学習用ラベルとが一致しない前記学習用データとを、前記認識が困難な学習用データとして選択する請求項1記載の認識器学習装置。 - 前記学習部は、
前記認識が困難な学習用データに対する前記認識器による認識結果と、前記学習用データの学習用ラベルとは異なる学習用ラベルが付与された、前記認識が困難な学習用データではない前記学習用データに対する前記認識器による認識結果とを比較した結果を用いて表される目的関数を最適化するように前記認識器を学習する請求項1または2記載の認識器学習装置。 - 学習部が、学習用ラベルが与えられた複数の学習用データに基づいて、データのラベルを認識する認識器を学習し、
スコア算出部が、前記学習された認識器を用いて、前記複数の学習用データの各々について、前記認識器が出力するスコアを算出し、
閾値決定部が、前記複数の学習用データの各々について算出されたスコアに基づいて得られる、真陽性率と偽陽性率との対応関係を表すROC(Receiver Operating Characteristic)曲線の形状に基づいて、ラベルを決定するための前記スコアに関する閾値を決定し、
選択部が、前記決定された閾値と、前記複数の学習用データの各々について算出されたスコアとに基づいて、前記認識器による認識が困難な前記学習用データを選択する
ことを、予め定められた反復終了条件を満たすまで繰り返し、
前記学習部が学習することでは、前記選択部による前記学習用データの選択結果に応じた前記学習用データに基づいて、前記認識器を学習する
認識器学習方法。 - 前記選択部が選択することでは、
前記スコアが前記閾値以上であって、前記スコアが前記閾値以上である場合に認識されるラベルと前記学習用ラベルとが一致しない前記学習用データと、
前記スコアが前記閾値未満であって、前記スコアが前記閾値未満である場合に認識されるラベルと前記学習用ラベルとが一致しない前記学習用データとを、前記認識が困難な学習用データとして選択する請求項4記載の認識器学習方法。 - 前記学習部が学習することでは、前記認識が困難な学習用データに対する前記認識器による認識結果と、前記学習用データの学習用ラベルとは異なる学習用ラベルが付与された、前記認識が困難な学習用データではない前記学習用データに対する前記認識器による認識結果とを比較した結果を用いて表される目的関数を最適化するように前記認識器を学習する請求項4または5記載の認識器学習方法。
- 学習用ラベルが与えられた複数の学習用データに基づいて、データのラベルを認識する認識器を学習し、
前記学習された認識器を用いて、前記複数の学習用データの各々について、前記認識器が出力するスコアを算出し、
前記複数の学習用データの各々について算出されたスコアに基づいて得られる、真陽性率と偽陽性率との対応関係を表すROC(Receiver Operating Characteristic)曲線の形状に基づいて、ラベルを決定するための前記スコアに関する閾値を決定し、
前記決定された閾値と、前記複数の学習用データの各々について算出されたスコアとに基づいて、前記認識器による認識が困難な前記学習用データを選択することを
予め定められた反復終了条件を満たすまで繰り返し、
前記学習することでは、前記学習用データの選択結果に応じた前記学習用データに基づいて、前記認識器を学習する
ことをコンピュータに実行させるための認識器学習プログラム。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2020/024412 WO2021260770A1 (ja) | 2020-06-22 | 2020-06-22 | 認識器学習装置、認識器学習方法、および認識器学習プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2021260770A1 JPWO2021260770A1 (ja) | 2021-12-30 |
| JP7400972B2 true JP7400972B2 (ja) | 2023-12-19 |
Family
ID=79282702
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022531262A Active JP7400972B2 (ja) | 2020-06-22 | 2020-06-22 | 認識器学習装置、認識器学習方法、および認識器学習プログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20230245438A1 (ja) |
| JP (1) | JP7400972B2 (ja) |
| WO (1) | WO2021260770A1 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022056898A1 (en) * | 2020-09-21 | 2022-03-24 | Northwestern Polytechnical University | A deep neural network training method and apparatus for speaker verification |
| CN116156151B (zh) * | 2022-12-15 | 2025-09-16 | 中国计量科学研究院 | 针对智能感知系统的测试方法、系统、电子设备 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018160172A (ja) | 2017-03-23 | 2018-10-11 | 日本電気株式会社 | マルウェア判定方法、マルウェア判定装置及びマルウェア判定プログラム |
| JP2018190128A (ja) | 2017-05-01 | 2018-11-29 | 日本電信電話株式会社 | 設定装置、分析システム、設定方法および設定プログラム |
| WO2020121867A1 (ja) | 2018-12-11 | 2020-06-18 | 日本電信電話株式会社 | 検出学習装置、方法、及びプログラム |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6947219B2 (ja) * | 2017-09-06 | 2021-10-13 | 日本電信電話株式会社 | 異常音検知装置、異常モデル学習装置、異常検知装置、異常音検知方法、異常音生成装置、異常データ生成装置、異常音生成方法、およびプログラム |
| US11704791B2 (en) * | 2018-08-30 | 2023-07-18 | Topcon Corporation | Multivariate and multi-resolution retinal image anomaly detection system |
-
2020
- 2020-06-22 JP JP2022531262A patent/JP7400972B2/ja active Active
- 2020-06-22 WO PCT/JP2020/024412 patent/WO2021260770A1/ja not_active Ceased
- 2020-06-22 US US18/012,137 patent/US20230245438A1/en not_active Abandoned
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2018160172A (ja) | 2017-03-23 | 2018-10-11 | 日本電気株式会社 | マルウェア判定方法、マルウェア判定装置及びマルウェア判定プログラム |
| JP2018190128A (ja) | 2017-05-01 | 2018-11-29 | 日本電信電話株式会社 | 設定装置、分析システム、設定方法および設定プログラム |
| WO2020121867A1 (ja) | 2018-12-11 | 2020-06-18 | 日本電信電話株式会社 | 検出学習装置、方法、及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| US20230245438A1 (en) | 2023-08-03 |
| JPWO2021260770A1 (ja) | 2021-12-30 |
| WO2021260770A1 (ja) | 2021-12-30 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102853349B1 (ko) | 인공 신경 네트워크를 자동으로 조정하는 방법 및 장치 | |
| KR102104605B1 (ko) | 인공지능 기반 플랜트 도면 내 심볼 자동인식 방법 및 장치 | |
| US9330362B2 (en) | Tuning hyper-parameters of a computer-executable learning algorithm | |
| US20230326191A1 (en) | Method and Apparatus for Enhancing Performance of Machine Learning Classification Task | |
| US9842279B2 (en) | Data processing method for learning discriminator, and data processing apparatus therefor | |
| WO2011135410A1 (en) | Optimization technique using evolutionary algorithms | |
| JP7115280B2 (ja) | 検出学習装置、方法、及びプログラム | |
| JP7400972B2 (ja) | 認識器学習装置、認識器学習方法、および認識器学習プログラム | |
| CN108932301A (zh) | 数据填充方法及装置 | |
| CN116432091B (zh) | 基于小样本的设备故障诊断方法、模型的构建方法及装置 | |
| CN109002461A (zh) | 手写模型训练方法、文本识别方法、装置、设备及介质 | |
| CN118152962A (zh) | 一种面向电力监控运行数据异常检测的方法及系统 | |
| CN111104840A (zh) | 基于回归损失的学习及测试的方法及装置 | |
| CN114743044A (zh) | 基于部分域适应的故障诊断方法和装置、存储介质和终端 | |
| JP7395396B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
| JP6233432B2 (ja) | 混合モデルの選択方法及び装置 | |
| CN115909368B (zh) | 一种面向多行字符ocr识别结果的行归类后处理方法 | |
| JP2017220001A (ja) | 予測装置、予測方法及びプログラム | |
| KR20210050362A (ko) | 앙상블 모델 프루닝 방법, 유전자 가위를 검출하는 앙상블 모델 생성 방법 및 장치 | |
| Chuang et al. | Chaotic binary particle swarm optimization for feature selection using logistic map | |
| CN112883901A (zh) | 一种基于ResNet的天体光谱分类方法及其系统 | |
| CN117115179B (zh) | 一种基于最近邻knn算法的逐帧点云快速实例分割方法及装置 | |
| CN113345538A (zh) | 一种基于动态选取训练集的材料性能预测方法 | |
| US11609936B2 (en) | Graph data processing method, device, and computer program product | |
| TWI846140B (zh) | 雷達物件辨識系統及方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221121 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231107 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231120 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7400972 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |