JP7620866B2

JP7620866B2 - アルゴリズム決定装置、学習器の生産装置、特許分類装置、分類情報決定装置、アルゴリズム決定方法、学習器の生産方法、分類情報決定方法、およびプログラム

Info

Publication number: JP7620866B2
Application number: JP2020139102A
Authority: JP
Inventors: 英和谷川
Original assignee: IRD CORP
Current assignee: IRD CORP
Priority date: 2019-08-22
Filing date: 2020-08-20
Publication date: 2025-01-24
Anticipated expiration: 2040-08-20
Also published as: JP2021036427A; JP2025041841A

Description

本発明は、特許情報を分類する特許分類装置等に関するものである。

従来、ユーザが特許等の文書を分類する負荷を軽減する特許分類装置があった（特許文献１参照）。かかる特許分類装置は、文書の分類と前記文書とを対応付けた教師データを記憶部に記憶する分類登録部と、前記記憶部に記憶された前記教師データと前記分類の付与対象となる付与対象文書との類似度に基づいて得られた類似文書の分類に基づいて、前記付与対象文書に付与する分類を決定する分類付与部と、を備えることを特徴とする特許分類装置である。

特開２０１９－８７２５８号公報

しかしながら、従来技術においては、同じアルゴリズムを用いて、特許の分類を行っていたため、精度高く特許を分類できなかった。

また、従来技術においては、どの付与対象文書についても、教師データと付与対象文書との類似度に基づいて得られた類似文書の分類に基づいて分類を決定しているため、特許を精度高く分類できなかった。

また、従来技術においては、周知な技術構成や従来技術等の発明のポイント以外の情報も多く含まれる特許明細書の文書全体を用いて、特許の分類を行っていたため、精度高く特許を分類できなかった。

本第一の発明のアルゴリズム決定装置は、特許に関する特許情報と特許情報に対する分類を示す分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成する１以上の学習器生成プログラムと、学習器を用いて特許分類情報の分類を予測し、予測分類情報を取得する予測プログラムとが格納されるプログラム格納部と、学習元情報を受け付ける学習元情報受付部と、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報を用いて、１以上の各学習器生成プログラムを実行し、１以上の学習器を取得する学習部と、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、学習部が生成した１以上の各学習器を用いて、予測プログラムを適用し、１以上の各特許分類情報に対する２以上の予測分類情報を取得する予測部と、予測部が取得した２以上の各予測分類情報と、学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の精度に関する精度情報を取得し、精度情報が特定する精度が最も高い予測分類情報を決定する評価部と、評価部が決定した予測分類情報に対応するアルゴリズムに関するアルゴリズム情報を取得するアルゴリズム情報取得部と、アルゴリズム情報を出力する出力部とを具備するアルゴリズム決定装置である。

かかる構成により、予測処理を行うための適切な処理を決定できる。

また、本第二の発明のアルゴリズム決定装置は、第一の発明に対して、学習元情報受付部が受け付けた学習元情報が有する２以上の各特許分類情報が有する特許情報のうち、異なる情報を有する２以上の特許分類情報を各々有する２以上の学習元情報を取得する学習元情報取得部をさらに具備し、学習部は、学習元情報取得部が取得した２以上の各学習元情報に対して、１以上の各学習器生成プログラムを実行し、２以上の学習器を取得し、予測部は、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、学習部が生成した２以上の各学習器を用いて、予測プログラムを適用し、１以上の各特許分類情報に対する２以上の予測分類情報を取得し、アルゴリズム情報取得部は、評価部が決定した予測分類情報に対応する学習元情報が有する情報を特定する情報特定情報を含むアルゴリズム情報を取得するアルゴリズム決定装置である。

かかる構成により、予測処理を行う際に使用するデータを変更することにより、予測処理を行うための適切な処理を決定できる。

また、本第三の発明のアルゴリズム決定装置は、第一または第二の発明に対して、プログラム格納部には、２以上の学習器生成プログラムと２以上の予測プログラムとが格納され、学習部は、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の特許分類情報を用いて、２以上の各学習器生成プログラムを実行し、２以上の学習器を取得し、予測部は、学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、学習部が生成した２以上の各学習器を用いて、予測プログラムを適用し、１以上の各特許分類情報に対する２以上の予測分類情報を取得し、アルゴリズム情報取得部は、評価部が決定した予測分類情報に対応する学習器生成プログラムを特定するプログラム特定情報を含むアルゴリズム情報を取得するアルゴリズム決定装置である。

かかる構成により、複数の学習器生成プログラムを使用することにより、予測処理を行うための適切な処理を決定できる。

また、本第四の発明のアルゴリズム決定装置は、第一から第三いずれか１つの発明に対して、予測部が取得した２以上の予測分類情報を用いて、１種類以上の統計処理を行い、統計処理結果である１以上の予測分類情報を取得する統計処理部をさらに具備し、評価部は、予測部が取得した２以上の予測分類情報に代えて、または予測部が取得した２以上の各予測分類情報に加えて、統計処理部が取得した１以上の予測分類情報を含む２以上の各予測分類情報と、学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の精度に関する精度情報を取得し、精度情報が特定する精度が最も高い予測分類情報を決定し、アルゴリズム情報取得部は、評価部が決定した予測分類情報に対応する統計処理の方法を特定する統計処理特定情報を含むアルゴリズム情報を取得するアルゴリズム決定装置である。

かかる構成により、２以上の学習器を用いて取得した予測結果に対して統計処理を行った予測結果を用いることにより、予測処理を行うための適切な処理を決定できる。

また、本第五の発明のアルゴリズム決定装置は、第四の発明に対して、統計処理部は、２種類以上の統計処理を行い、統計処理結果である２以上の予測分類情報を取得し、２種類以上の統計処理は、予測分類情報の論理和または論理積または多数決のいずれかのうちの２種類以上の統計処理であるアルゴリズム決定装置である。

かかる構成により、２以上の学習器を用いて取得した予測結果に対して２以上の統計処理を行った２以上の予測結果を用いることにより、予測処理を行うための適切な統計処理を含む処理を決定できる。

また、本第六の発明のアルゴリズム決定装置は、第一から第五いずれか１つの発明に対して、再現率または適合率またはＦ値または正解率の４つの精度のうちの２以上の精度のうちのいずれの精度に関する精度情報を取得するかを特定する精度特定情報が格納される精度特定情報格納部をさらに具備し、評価部は、予測部が取得した２以上の各予測分類情報と、学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の、精度特定情報により特定される精度情報を取得し、精度情報が特定する精度が最も高い予測分類情報を決定するアルゴリズム決定装置である。

かかる構成により、再現率または適合率またはＦ値または正解率のうち、ユーザが所望するスコアが高い処理を決定できる。

また、本第七の発明の学習器の生産装置は、学習元情報を受け付ける学習元情報受付部と、第一から第六いずれかの発明のアルゴリズム決定装置が出力するアルゴリズム情報に従ったアルゴリズムで、学習元情報受付部が受け付けた学習元情報に対して、学習処理を行い学習器を取得する学習部と、学習器をアルゴリズム情報に対応付けて蓄積する蓄積部とを具備する学習器の生産装置である。

かかる構成により、適切な学習器が生産できる。

また、本第八の発明の特許分類装置は、第七の発明の生産装置が蓄積した学習器が格納される学習器格納部と、分類対象の特許を識別する特許識別子を含む分類対象情報を受け付ける受付部と、分類対象情報に対して、学習器に対応付いているアルゴリズム情報に従ったアルゴリズムにより、学習器を用いて予測処理を行い、分類結果情報を取得する予測部と、予測部が取得した分類結果情報を、受付部が受け付けた分類対象情報に含まれる特許識別子に対応付けて出力する出力部とを具備する特許分類装置である。

かかる構成により、適切な学習器を用いて、精度の高い予測処理ができる。

また、本第九の発明の特許分類装置は、第八の発明に対して、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を用いて、予め決められた条件を満たす重要情報を取得する重要情報取得部と、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する情報であり、重要情報取得部が取得した重要情報を含む情報である分類対象加工情報を取得する分類対象加工情報取得部とをさらに具備し、予測部は、分類対象加工情報取得部が取得した分類対象加工情報に学習器に適用し、機械学習のアルゴリズムにより分類対象加工情報の分類を予測し、分類結果情報を取得する特許分類装置である。

かかる構成により、特許明細書に関する重要な情報を用いることにより、特許を精度高く分類できる。

また、本第十の発明の特許分類装置は、第九の発明に対して、特許情報は、特許識別子に対応する特許請求の範囲または要約書のうちの１種類以上の情報をも含み、分類対象加工情報は、重要情報取得部が取得した重要情報と、特許識別子に対応する特許請求の範囲または要約書のうちの１種類以上の情報とを含む、特許分類装置である。

かかる構成により、特許請求の範囲または/および要約書をも用いることにより、特許を精度高く分類できる。

また、本第十一の発明の特許分類装置は、第九または第十の発明に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、効果の表現と解決手段の表現の両方を含む効果解決手段文であるか否かを判断し、効果解決手段文であると判断した１以上の効果解決手段文を取得する効果解決手段文取得手段を具備し、重要情報は、効果解決手段文取得手段が取得した１以上の効果解決手段文、または１以上の効果解決手段文から取得された用語である効果用語および解決手段用語を含む、特許分類装置である。

かかる構成により、効果解決手段文または効果用語または解決手段用語を用いることにより、特許を精度高く分類できる。

また、本第十二の発明の特許分類装置は、第九から第十一いずれか１つの発明に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、効果の表現を含む効果文であるか否かを判断し、効果文であると判断した１以上の効果文を取得する効果文取得手段を具備し、重要情報は、効果文取得手段が取得した１以上の効果文、または１以上の効果文から取得された用語である効果用語を含む、特許分類装置である。

かかる構成により、効果文または効果用語を用いることにより、特許を精度高く分類できる。

また、本第十三の発明の特許分類装置は、第九から第十二いずれか１つの発明に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、解決手段の表現の両方を含む解決手段文であるか否かを判断し、解決手段文であると判断した１以上の解決手段文を取得する解決手段文取得手段を具備し、重要情報は、解決手段文取得手段が取得した１以上の解決手段文、または１以上の解決手段文から取得された用語である解決手段用語を含む、特許分類装置である。

かかる構成により、解決手段文または解決手段用語を用いることにより、特許を精度高く分類できる。

また、本第十四の発明の特許分類装置は、第九から第十三いずれか１つの発明に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、目的の表現を含む目的文であるか否かを判断し、目的文であると判断した１以上の目的文を取得する目的文取得手段を具備し、重要情報は、目的文取得手段が取得した１以上の目的文、または１以上の目的文から取得された用語である目的用語を含む、特許分類装置である。

かかる構成により、目的文または目的用語を用いることにより、特許を精度高く分類できる。

また、本第十五の発明の特許分類装置は、第九から第十四いずれか１つの発明に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各用語の出現頻度を取得し、出現頻度を用いて、１以上の各用語に対するスコアを算出し、スコアが予め決められた条件を満たすほど大きい１以上の特徴語を取得する特徴語取得手段を具備し、重要情報は、特徴語取得手段が取得した１以上の特徴語を含む、特許分類装置である。

かかる構成により、特徴語を用いることにより、特許を精度高く分類できる。

また、本第十六の発明の特許分類装置は、第九から第十四いずれか１つの発明に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各用語の出現頻度を取得し、出現頻度を用いて、１以上の各用語に対するスコアを算出し、スコアが予め決められた条件を満たすほど大きい１以上の特徴語を取得する特徴語取得手段と、１以上の各用語に対する上位語、下位語、または同義語のうちの１以上の関連語が格納される関連語辞書から、特徴語取得手段が取得した１以上の各特徴語に対応する上位語、下位語、または同義語である１以上の関連語を取得する関連語取得手段とを具備し、重要情報は、関連語取得手段が取得した１以上の関連語を含む、特許分類装置である。

かかる構成により、特徴語の関連語を用いることにより、特許を精度高く分類できる。

また、本第十七の発明の特許分類装置は、第九から第十六いずれか１つの発明に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる文であり、予め決められたタグに対応する文である１以上の重要タグ対応文を取得する重要タグ対応文取得手段を具備し、重要情報は、重要タグ対応文取得手段が取得した１以上の重要タグ対応文を含む、または１以上の重要タグ対応文から取得された用語である重要タグ対応用語を含む、特許分類装置である。

かかる構成により、重要タグ対応文または重要タグ対応用語を用いることにより、特許を精度高く分類できる。

また、本第十八の発明の特許分類装置は、第九から第十七いずれか１つの発明に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる文字列であり、数値範囲を示す文字列である１以上の数値範囲文字列を取得する数値範囲文字列取得手段を具備し、重要情報は、数値範囲文字列取得手段が取得した１以上の数値範囲文字列を含む、特許分類装置である。

かかる構成により、数値範囲文字列を用いることにより、特許を精度高く分類できる。

また、本第十九の発明の特許分類装置は、第九から第十八いずれか１つの発明に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる文字列であり、数値範囲を示す文字列である１以上の数値範囲文字列を取得する数値範囲文字列取得手段と、数値範囲文字列取得手段が取得した数値範囲文字列が示す数値範囲に含まれる３以上の数字を取得する数字取得手段とを具備し、重要情報は、数字取得手段が取得した３以上の数字を含む、特許分類装置である。

かかる構成により、数値範囲文字列が示す数値範囲に含まれる３以上の数字を用いることにより、特許を精度高く分類できる。

また、本第二十の発明の特許分類装置は、第九から第十九いずれか１つの発明に対して、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を外部のサーバ装置から取得する特許明細書取得部をさらに具備し、重要情報取得部は、特許明細書取得部が取得した特許明細書を用いて、予め決められた条件を満たす重要情報を取得する特許分類装置である。

かかる構成により、外部のサーバ装置から取得した特許明細書を用いて取得された重要情報を用いることにより、特許を精度高く分類できる。

本第二十一の発明の分類情報決定装置は、特許情報と特許情報の分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、機械学習の学習処理を行い、取得された学習器が格納される学習器格納部と、特許に関する一の条件と特許情報の分類情報との組である１以上の条件情報が格納される条件情報格納部と、１以上の特許情報を受け付ける特許情報受付部と、１以上の条件情報を用いて、１以上の各特許情報の分類情報を特定する予測分類情報を取得する予測部と、予測分類情報を出力する出力部とを具備し、予測部は、１以上の各特許情報が、１以上の各条件情報が有する条件のうちいずれかの条件に合致するか否かを判断する判断手段と、判断手段が合致すると判断した条件と対になる分類情報を決定する第一決定手段と、学習器を用いて、判断手段がいずれの条件にも合致しないと判断した特許情報の分類情報を、機械学習の予測処理により取得する第二決定手段とを具備する分類情報決定装置である。

かかる構成により、特許を精度高く分類できる。

また、本第二十二の発明の分類情報決定装置は、第二十一の発明に対して、一の条件は、学習元情報が有する２以上のいずれかの特許分類情報を構成する特許情報であることである分類情報決定装置である。

かかる構成により、機械学習の学習器を取得した際に使用した教師データの特許を精度高く分類でき、それ以外の特許をも、学習器を用いた予測処理により精度高く分類できる。

また、本第二十三の発明の分類情報決定装置は、第二十一の発明に対して、一の条件は、検索式である分類情報決定装置である。

かかる構成により、検索式に合致する特許を精度高く分類でき、検索式に合致しない特許をも、機械学習の学習器を用いた予測処理により精度高く分類できる。

本発明の特許分類装置は、特許明細書の全文は有さない特許レコードであり、特許を識別する特許識別子に対応する特許明細書を用いて取得された重要情報と、人手による特許の分類結果を特定する分類結果情報とを有する２以上の特許レコードを有する学習元情報を機械学習のアルゴリズムにより学習し、取得された学習器が格納される学習器格納部と、分類対象の特許を識別する特許識別子を含む分類対象情報を受け付ける受付部と、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を用いて、予め決められた条件を満たす重要情報を取得する重要情報取得部と、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する情報であり、重要情報取得部が取得した重要情報を含む情報である分類対象加工情報を取得する分類対象加工情報取得部と、分類対象加工情報取得部が取得した分類対象加工情報に学習器に適用し、機械学習のアルゴリズムにより分類対象加工情報の分類を予測し、分類結果情報を取得する予測部と、予測部が取得した分類結果情報を、受付部が受け付けた分類対象情報に含まれる特許識別子に対応付けて出力する出力部とを具備する特許分類装置である。

かかる構成（第一の構成）により、特許明細書に関する重要な情報を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一の構成に対して、特許レコードは、特許識別子に対応する特許請求の範囲または要約書のうちの１種類以上の情報をも含み、分類対象加工情報は、重要情報取得部が取得した重要情報と、特許識別子に対応する特許請求の範囲または要約書のうちの１種類以上の情報とを含む、特許分類装置である。

かかる構成（第二の構成）により、特許請求の範囲または/および要約書をも用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一または第二の構成に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、効果の表現と解決手段の表現の両方を含む効果解決手段文であるか否かを判断し、効果解決手段文であると判断した１以上の効果解決手段文を取得する効果解決手段文取得手段を具備し、重要情報は、効果解決手段文取得手段が取得した１以上の効果解決手段文、または１以上の効果解決手段文から取得された用語である効果用語および解決手段用語を含む、特許分類装置である。

かかる構成（第三の構成）により、効果解決手段文または効果用語または解決手段用語を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一から第三いずれか１つの構成に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、効果の表現を含む効果文であるか否かを判断し、効果文であると判断した１以上の効果文を取得する効果文取得手段を具備し、重要情報は、効果文取得手段が取得した１以上の効果文、または１以上の効果文から取得された用語である効果用語を含む、特許分類装置である。

かかる構成（第四の構成）により、効果文または効果用語を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一から第四いずれか１つの構成に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、解決手段の表現の両方を含む解決手段文であるか否かを判断し、解決手段文であると判断した１以上の解決手段文を取得する解決手段文取得手段を具備し、重要情報は、解決手段文取得手段が取得した１以上の解決手段文、または１以上の解決手段文から取得された用語である解決手段用語を含む、特許分類装置である。

かかる構成（第五の構成）により、解決手段文または解決手段用語を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一から第五いずれか１つの構成に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、目的の表現を含む目的文であるか否かを判断し、目的文であると判断した１以上の目的文を取得する目的文取得手段を具備し、重要情報は、目的文取得手段が取得した１以上の目的文、または１以上の目的文から取得された用語である目的用語を含む、特許分類装置である。

かかる構成（第六の構成）により、目的文または目的用語を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一から第六いずれか１つの構成に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各用語の出現頻度を取得し、出現頻度を用いて、１以上の各用語に対するスコアを算出し、スコアが予め決められた条件を満たすほど大きい１以上の特徴語を取得する特徴語取得手段を具備し、重要情報は、特徴語取得手段が取得した１以上の特徴語を含む、特許分類装置である。

かかる構成（第七の構成）により、特徴語を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一から第六いずれか１つの構成に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各用語の出現頻度を取得し、出現頻度を用いて、１以上の各用語に対するスコアを算出し、スコアが予め決められた条件を満たすほど大きい１以上の特徴語を取得する特徴語取得手段と、１以上の各用語に対する上位語、下位語、または同義語のうちの１以上の関連語が格納される関連語辞書から、特徴語取得手段が取得した１以上の各特徴語に対応する上位語、下位語、または同義語である１以上の関連語を取得する関連語取得手段とを具備し、重要情報は、関連語取得手段が取得した１以上の関連語を含む、特許分類装置である。

かかる構成（第八の構成）により、特徴語の関連語を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一から第八いずれか１つの構成に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる文であり、予め決められたタグに対応する文である１以上の重要タグ対応文を取得する重要タグ対応文取得手段を具備し、重要情報は、重要タグ対応文取得手段が取得した１以上の重要タグ対応文を含む、または１以上の重要タグ対応文から取得された用語である重要タグ対応用語を含む、特許分類装置である。

かかる構成（第九の構成）により、重要タグ対応文または重要タグ対応用語を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一から第九いずれか１つの構成に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる文字列であり、数値範囲を示す文字列である１以上の数値範囲文字列を取得する数値範囲文字列取得手段を具備し、重要情報は、数値範囲文字列取得手段が取得した１以上の数値範囲文字列を含む、特許分類装置である。

かかる構成（第十の構成）により、数値範囲文字列を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一から第九いずれか１つの構成に対して、重要情報取得部は、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる文字列であり、数値範囲を示す文字列である１以上の数値範囲文字列を取得する数値範囲文字列取得手段と、数値範囲文字列取得手段が取得した数値範囲文字列が示す数値範囲に含まれる３以上の数字を取得する数字取得手段とを具備し、重要情報は、数字取得手段が取得した３以上の数字を含む、特許分類装置である。

かかる構成（第十一の構成）により、数値範囲文字列が示す数値範囲に含まれる３以上の数字を用いることにより、特許を精度高く分類できる。

また、本発明の特許分類装置は、第一から第十一いずれか１つの構成に対して、受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を外部のサーバ装置から取得する特許明細書取得部をさらに具備し、重要情報取得部は、特許明細書取得部が取得した特許明細書を用いて、予め決められた条件を満たす重要情報を取得する特許分類装置である。

かかる構成（第十二の構成）により、外部のサーバ装置から取得した特許明細書を用いて取得された重要情報を用いることにより、特許を精度高く分類できる。

また、本発明の学習器生産装置は、特許を識別する特許識別子と、特許識別子に対応する特許の人手による分類結果を特定する分類結果情報とを有する２以上の人手評価レコードを有する人手評価情報が格納される人手評価情報格納部と、人手評価情報格納部に格納されている人手評価情報が有する２以上の各人手評価レコードが有する特許識別子に対応する特許明細書を用いて、予め決められた条件を満たす重要情報を取得する重要情報取得部と、２以上の各人手評価レコードごとに、重要情報取得部が取得した重要情報と、重要情報の元になった特許明細書に対応する特許識別子と対になる分類結果情報とを有する特許レコードを取得し、２以上の特許レコードを有する学習元情報を取得する学習元情報取得部と、学習元情報取得部が取得した学習元情報を機械学習のアルゴリズムにより学習し、学習器を取得する学習部と、学習部が取得した学習器を蓄積する蓄積部とを具備する学習器生産装置である。

かかる構成（第十三の構成）により、特許を精度高く分類するための学習器を生産できる。

本発明によれば、適切なアルゴリズムを用いて予測処理を行うことにより、特許を精度高く分類できる。

また、本発明によれば、予め決められた条件に合致する特許情報と合致しない特許情報とで、異なる決定方法を用いて予測分類情報を取得することにより、特許を精度高く分類できる。

また、本発明によれば、特許明細書に関する重要な情報を用いることにより、特許を精度高く分類できる。

実施の形態１における特許分類システムＡの概念図同特許分類システムＡのブロック図同特許分類システムＡを構成する学習器生産装置１のブロック図同学習器生産装置１の動作例について説明するフローチャート同重要情報取得処理例について説明するフローチャート同効果解決手段文取得処理例について説明するフローチャート同効果用語取得処理例について説明するフローチャート同数値範囲文字列取得処理例について説明するフローチャート同数字取得処理例についてフローチャート同特許分類装置２の動作例について説明するフローチャート実施の形態２における特許分類システムＢのブロック図同特許分類システムＢを構成する特許分類装置８のブロック図同特許分類システムＢを構成するアルゴリズム決定装置５の動作例について説明するフローチャート同評価処理例について説明するフローチャート同Ｋ分割交差検証例について説明するフローチャート同統計処理評価例について説明するフローチャート同特許分類システムＢを構成する学習器生産装置の動作例について説明するフローチャート同特許分類装置の動作例について説明するフローチャートアルゴリズム情報候補のデータ構造図同精度情報のデータ構造図実施の形態３における特許分類システムＣのブロック図実施の形態４における特許分類システムＤのブロック図同特許分類システムＤを構成する分類情報決定装置７の動作を説明するフローチャート同「ｋ番目の予測分類情報取得処理」を説明するフローチャート同条件情報のデータ構造図実施の形態５における特許分類システムＥのブロック図同条件情報のデータ構造図各実施の形態におけるコンピュータシステムの概観図同コンピュータシステムのブロック図

以下、アルゴリズム決定装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。

（実施の形態１）
本実施の形態において、特許明細書から重要情報を取得し、特許明細書の全文は含まず、重要情報と人手分類とを有する１以上の特許レコードを有する学習元情報を機械学習のアルゴリズムにより取得された学習器を用いて、特許情報を分類する特許分類装置を含む特許分類システムについて説明する。

また、本実施の形態において、特許請求の範囲または／および要約書をも含む特許レコードを有する学習元情報を機械学習のアルゴリズムにより取得された学習器を用いて、特許情報を分類する特許分類装置を含む特許分類システムについて説明する。

なお、本実施の形態において、重要情報は、効果解決手段文、効果文、解決手段文、目的文、効果用語、解決手段用語、目的用語、特徴語、特徴語の関連語（上位語、下位語、同義語、予め決められたタグに対応する文、当該文に含まれる用語、数値範囲を示す文字列、当該範囲に含まれる数字等である。

また、本実施の形態において、外部のサーバ装置から特許明細書を取得し、当該特許明細書から重要情報を取得する特許分類装置を含む特許分類システムについて説明する。

さらに、本実施の形態において、学習器の生産装置を含む特許分類システムについて説明する。

図１は、本実施の形態における特許分類システムＡの概念図である。特許分類システムＡは、学習器生産装置１、特許分類装置２、サーバ装置３、および１以上のユーザ端末４を備える。学習器生産装置１は、学習器を生産する装置である。特許分類装置２は、特許の分類を予測する装置である。サーバ装置３は、特許明細書等を含む特許書類が格納された装置であり、公知の装置である。サーバ装置３は、例えば、商用特許データベースのサーバ（例えば、ＨＹＰＡＴ－ｉ２（ＵＲＬ：https://portal.hypatweb.jp/）参照）である。ユーザ端末４は、ユーザが使用する端末である。ユーザ端末４は、例えば、パソコン、スマートフォン、タブレット端末等、問わない。

図２は、本実施の形態における特許分類システムＡのブロック図である。図３は、特許分類システムＡを構成する学習器生産装置１のブロック図である。

特許分類システムＡを構成する学習器生産装置１は、学習格納部１１、学習受付部１２、学習処理部１３、および学習出力部１４を備える。学習格納部１１は、人手評価情報格納部１１１を備える。学習処理部１３は、特許明細書取得部１３１、重要情報取得部１３２、学習元情報取得部１３３、および学習部１３４を備える。重要情報取得部１３２は、効果解決手段文取得手段１３２１、効果文取得手段１３２２、解決手段文取得手段１３２３、目的文取得手段１３２４、特徴語取得手段１３２５、関連語取得手段１３２６、重要タグ対応文取得手段１３２７、数値範囲文字列取得手段１３２８、および数字取得手段１３２９を備える。学習出力部１４は、蓄積部１４１を備える。

特許分類装置２は、格納部２１、受付部２２、処理部２３、出力部２４を備える。格納部２１は、学習器格納部２１１を備える。処理部２３は、特許明細書取得部１３１、重要情報取得部１３２、分類対象加工情報取得部２３３、および予測部２３４を備える。

学習器生産装置１を構成する学習格納部１１には、各種の情報が格納される。各種の情報は、例えば、後述する人手評価情報、特許識別子に対応付いた特許明細書、関連語辞書、後述する効果解決手段文パターン等の各種のパターン、各種の重要情報学習器である。

関連語辞書とは、関連語の辞書である。関連語辞書は、例えば、一の用語と関連語の組を多数有する。関連語とは、上位語、下位語、同義語、または類義語である。上位語とは、上位概念の用語である。下位語とは、下位概念の用語である。関連語辞書の構造は問わない、例えば、関連語辞書は、２以上の関連語情報を有する。関連語情報は、例えば、一の用語と、当該一の用語の関連語とを有する。関連語情報は、例えば、一の用語と、当該一の用語の関連語と、フラグである。フラグは、一の用語と、当該一の用語の関連語との関係（例えば、上位語、下位語、同義語、または類義語のうちのいずれか）を特定する情報である。

また、重要情報学習器とは、重要情報であるか否かを判断する学習器である。重要情報学習器には、例えば、後述する効果解決手段文学習器、後述する効果用語学習器、後述する解決手段用語学習器、後述する効果文学習器、後述する解決手段文学習器、後述する目的文学習器、後述する目的用語学習器である。

人手評価情報格納部１１１は、２以上の人手評価レコードを有する人手評価情報が格納される。人手評価レコードは、一の特許に対する人手による分類結果を特定する分類結果情報を有する情報である。人手評価レコードは、特許識別子と分類結果情報とを有する。なお、人手評価レコードが有する分類結果情報は、人手評価レコードが有する特許識別子で識別される特許の分類の結果を特定する情報である。特許識別子は、特許を識別する情報である。特許識別子、例えば、ＩＤ、出願番号、公開番号、登録番号、整理番号等である。分類結果情報は、通常、特許に対する人手による分類結果を特定する情報である。分類結果情報は、例えば、特許の技術分野を特定する情報、特許の関連度合いを特定する情報、特許の重要度を特定する情報等である。分類結果情報は、例えば、「○」「×」、「Ａ」「Ｂ」「Ｃ」「Ｄ」、「１」「２」「３」・・・「９」、社内で用いている社内特有の分類等であり、その情報の種類は問わない。人手評価情報は、例えば、ＣＳＶファイル、エクセルファイル等であり、そのデータ構造等は問わない。

人手評価レコードは、特許識別子と分類結果情報以外に、例えば、特許請求の範囲、要約書、特許分類コード（例えば、ＩＰＣ、ＦＩ、Ｆターム、ＣＰＣ等）を有することは好適である。また、人手評価レコードは、特許明細書を有しても良い。

学習受付部１２は、指示や情報等を受け付ける。指示や情報等は、例えば、学習動作開始指示である。学習動作開始指示は、ここでは、学習器の生産の開始の指示である。学習動作開始指示は、通常、ユーザからの指示である。学習動作開始指示は、例えば、重要情報取得部１３２が取得する重要情報の種類を特定する種類特定情報を有しても良い。種類特定情報は、学習器の作成のために使用する重要情報の種類を特定する情報である。種類特定情報は、例えば、効果解決手段文取得手段１３２１、効果文取得手段１３２２、解決手段文取得手段１３２３、目的文取得手段１３２４、特徴語取得手段１３２５、関連語取得手段１３２６、重要タグ対応文取得手段１３２７、数値範囲文字列取得手段１３２８、数字取得手段１３２９のうち、動作させる手段を特定する情報でも良い。また、種類特定情報は、例えば、効果解決手段文、効果文、解決手段文、目的文、効果用語、解決手段用語、目的用語、特徴語、特徴語の関連語（上位語、下位語、同義語）、タグ対応文、タグ対応用語、数値範囲文字列、数値範囲文字列が示す範囲の数字の重要情報のうち、取得する重要情報を特定する情報でも良い。

種類特定情報は、例えば、ベクトルであり、例えば、（効果解決手段文を取得するか否か，効果文を取得するか否か，解決手段文を取得するか否かを取得するか否か，目的文を取得するか否か，効果用語を取得するか否か，解決手段用語を取得するか否か，目的用語を取得するか否か，特徴語を取得するか否か，特徴語の関連語を取得するか否か，タグ対応文を取得するか否か，タグ対応用語を取得するか否か，数値範囲文字列を取得するか否か，数値範囲文字列が示す範囲の数字を取得するか否か）の構造を有する。また、かかる場合、種類特定情報が（１，０，・・・０，１）である場合、当該種類特定情報は、効果解決手段文と、数値範囲文字列が示す範囲の数字のみを取得することを示す。なお、上記ベクトル（１，０，・・・０，１）において、「・・・」に対応する要素は、すべて０である、とする。また、要素が「１」に対応する重要情報は取得され、要素が「０」に対応する重要情報は取得されないことを示す。

なお、効果解決手段文とは、効果の表現と解決手段の表現の両方を含む文である。効果解決手段文は、例えば、「＜解決手段＞により、＜効果＞できる。」「＜解決手段＞を設けることにより、＜効果＞が可能となる。」「＜解決手段＞に基づいて、＜効果＞できる。」「＜解決手段＞を使用することにより、＜効果＞する。」といったパターン（効果解決手段文パターンと言っても良い）に合致する文である。なお、「＜」と「＞」とにより示される情報（例えば、＜解決手段＞、＜効果＞）は、任意の文字列がマッチする変数である。効果解決手段文は、例えば、「突起を設けることにより、風量調整が可能となる。」「重要用語を使用することにより、特許分類の精度が向上する。」である。

また、効果文とは、効果の表現を含む文である。効果文は、例えば、「＜効果＞できる。」「＜効果＞が可能になる。」「＜効果＞になる。」といったパターン（効果文パターンと言っても良い）に合致する文である。効果文は、例えば、「本実施の形態によれば、風量調整が可能となる。」「本実施例によれば、特許分類の精度が向上する。」である。効果文は、課題を特定する文である課題文と同一である、と考えても良い。

解決手段文は、解決手段の表現を含む文である。解決手段文は、例えば、「ポイントは、＜解決手段＞である。」「＜解決手段＞に基づく。」「＜解決手段＞により、課題を解決できる。」といったパターン（解決手段文パターンと言っても良い）に合致する文である。解決手段文は、例えば、「突起により、課題を解決できる。」「重要用語取得部により、上記課題を解決できる。」である。

目的文は、目的の表現を含む文である。目的文は、例えば、「本発明において、＜目的＞することを目的とする。」「本願発明の目的は、＜目的＞である。」といったパターン（目的文パターンと言っても良い）の文である。目的文は、例えば、「本発明において、風量調整を行うことを目的とする。」「本願発明の目的は、特許分類の精度の向上である。」である。なお、目的文は、効果文または課題文と同一である、と考えても良い。目的、効果、課題は、通常、対応する情報であるからである。

効果用語は、効果を示す用語であり、例えば、「精度向上」「省エネルギー化」「風量調整が可能」「省資源」「安全性の向上」「処理速度の向上」である。なお、効果用語は、課題を特定する文である課題用語と同一である、と考えても良い。

解決手段用語は、解決手段を示す用語であり、例えば、「突起」「重要用語」「重要情報取得部」「処理部」等である。

目的用語は、目的を示す用語であり、例えば、「精度向上」「省エネルギー化」「風量調整が可能」「省資源」「安全性の向上」「処理速度の向上」である。なお、目的用語は、効果用語または課題用語と同一である、と考えても良い。

特徴語は、特許明細書の特徴を示す用語である。特徴語は、着目する特許明細書に多数出現する用語である。また、特徴語は、着目する特許明細書に多数出現し、かつ他の特許明細書での出現頻度が少ない用語であることは好適である。特徴語は、特許明細書の中の用語であり、例えば、ＴＦ／ＩＤＦの値が、予め決められた条件を満たすほど大きい用語である。なお、ＴＦ／ＩＤＦの値の算出方法は公知技術であるので、詳細な説明は省略する。

特徴語の関連語は、特徴語の上位語、特徴語の下位語、または特徴語の同義語である。特徴語の関連語は、例えば、特徴語をキーとして、関連語辞書を検索し、取得された用語である。

重要タグ対応文は、予め決められたタグに対応する文である。予め決められたタグとは、特許明細書中の予め決められたタグである。予め決められたタグは、例えば、［発明の効果］または［発明が解決しようとする課題］または［産業上の利用可能性］のタグである。

タグ対応用語は、重要タグ対応文に含まれる用語である。

数値範囲文字列は、特許明細書に含まれる文字列であり、数値範囲を示す文字列である。数値範囲文字列は、例えば、単位を有する。数値範囲文字列は、例えば、「＜数字＞＜単位＞～＜数字＞＜単位＞」「＜数字＞～＜数字＞＜単位＞」「＜数字＞～＜数字＞」「＜数字＞＜単位＞から＜数字＞＜単位＞」「＜数字＞から＜数字＞＜単位＞」「＜数字＞から＜数字＞」「＜数字＞＜単位＞－＜数字＞＜単位＞」「＜数字＞－＜数字＞＜単位＞」「＜数字＞－＜数字＞」のパターン（数値範囲文字列パターンと言っても良い）にマッチする文字列である。また、数字の正負、有効桁数等は問わない。また、単位は、例えば、長さの単位、重さの単位、割合の単位等であり、種類は問わない。数値範囲文字列は、例えば、「１～１０ｍｍ」「２．５ｍｇ－５．２ｍｇ」「０．８％から１．９％」等である。

数値範囲文字列が「２．５ｍｇ－５．２ｍｇ」の場合、数値範囲文字列が示す数値範囲に含まれる数字は、例えば、「２．５ｍｇ」「２．６ｍｇ」「２．７ｍｇ」・・・「５．１ｍｇ」「５．２ｍｇ」である。

ここで、受け付けとは、通常、ユーザ端末４からの受信であるが、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である、と考えても良い。

学習処理部１３は、各種の処理を行う。各種の処理とは、例えば、特許明細書取得部１３１、重要情報取得部１３２、学習元情報取得部１３３、学習部１３４、効果解決手段文取得手段１３２１、効果文取得手段１３２２、解決手段文取得手段１３２３、目的文取得手段１３２４、特徴語取得手段１３２５、関連語取得手段１３２６、重要タグ対応文取得手段１３２７、数値範囲文字列取得手段１３２８、数字取得手段１３２９が行う処理である。

学習処理部１３は、例えば、重要情報を機械学習のアルゴリズムにより学習し、重要情報であるか否かを判断する学習器を取得し、学習格納部１１に蓄積する。機械学習は、例えば、深層学習、ＳＶＭ、ランダムフォレスト、決定木等が使用可能である。また、機械学習において、学習器を構成するためには、例えば、機械学習の関数（例えば、fastText、TinySVM、各種のRandomForest関数、TensorFlowのライブラリ等）に、入力となる情報群（例えば、文から構成されるベクトル、用語の分散表現等）と出力させたい情報（例えば、重要情報であるか、重要情報でないかの判断情報）とを引数として与えると学習器が得られる。また、機械学習にいて、予測する場合、機械学習の関数に学習器と入力となる情報群（例えば、文から構成されるベクトル、用語の分散表現等）とを引数として与えると、予測された情報（例えば、重要情報であるか、重要情報でないかの判断情報）が得られる。

学習処理部１３は、例えば、１または２以上の効果解決手段文と、１または２以上の非効果解決手段文とを用いて、機械学習のアルゴリズムにより、判断対象の文が効果解決手段文であるか否かを予測するための学習器である効果解決手段文学習器を取得し、学習格納部１１に蓄積する。なお、非効果解決手段文とは、効果解決手段文ではない文である。

さらに具体的には、学習処理部１３は、例えば、１または２以上の効果解決手段文を学習格納部１１から取得し、取得した１以上の各効果解決手段文を形態素解析し、取得した１以上の形態素からベクトルを構成し、当該ベクトルを正例とし、かつ１または２以上の非効果解決手段文を学習格納部１１から取得し、取得した１以上の各非効果解決手段文を形態素解析し、取得した１以上の形態素からベクトルを構成し、当該ベクトルを負例として、機械学習の関数に与え、機械学習による学習処理を行うことにより、効果解決手段文学習器を取得し、学習格納部１１に蓄積する。なお、文からベクトルを構成する方法は問わない。つまり、文からベクトルを構成する場合に、どのような情報を素性として用いるかは問わない。取得した１以上の形態素だけではなく、n-gramも素性として用いても良いことは言うまでもない。

学習処理部１３は、例えば、１または２以上の効果用語と、１または２以上の非効果用語とを用いて、機械学習のアルゴリズムにより、判断対象の用語が効果用語であるか否かを予測するための学習器である効果用語学習器を取得し、学習格納部１１に蓄積する。なお、非効果用語とは、効果用語ではない用語である。

さらに具体的には、学習処理部１３は、例えば、１または２以上の効果用語を学習格納部１１から取得し、取得した１以上の各効果用語の分散表現（ベクトル）を取得し（例えば、word2vecを使用）、当該分散表現を正例とし、かつ１または２以上の非効果用語を学習格納部１１から取得し、取得した１以上の各非効果用語の分散表現（ベクトル）を取得し、当該分散表現を負例として、機械学習の関数に与え、機械学習による学習処理を行うことにより、効果用語学習器を取得し、学習格納部１１に蓄積する。

学習処理部１３は、例えば、１または２以上の解決手段用語と、１または２以上の非解決手段用語とを用いて、機械学習のアルゴリズムにより、判断対象の用語が解決手段用語であるか否かを予測するための学習器である解決手段用語学習器を取得し、学習格納部１１に蓄積する。なお、非解決手段用語とは、解決手段用語ではない用語である。

さらに具体的には、学習処理部１３は、例えば、１または２以上の解決手段用語を学習格納部１１から取得し、取得した１以上の各解決手段用語の分散表現（ベクトル）を取得し、当該分散表現を正例とし、かつ１または２以上の非解決手段用語を学習格納部１１から取得し、取得した１以上の各非解決手段用語の分散表現（ベクトル）を取得し、当該分散表現を負例として、機械学習の関数に与え、機械学習による学習処理を行うことにより、解決手段用語学習器を取得し、学習格納部１１に蓄積する。

学習処理部１３は、例えば、１または２以上の解決手段文と、１または２以上の非解決手段文とを用いて、機械学習のアルゴリズムにより、判断対象の文が解決手段文であるか否かを予測するための学習器である解決手段文学習器を取得し、学習格納部１１に蓄積する。なお、非解決手段文とは、解決手段文ではない文である。

さらに具体的には、学習処理部１３は、例えば、１または２以上の解決手段文を学習格納部１１から取得し、取得した１以上の各解決手段文を形態素解析し、取得した１以上の形態素からベクトルを構成し、当該ベクトルを正例とし、かつ１または２以上の非解決手段文を学習格納部１１から取得し、取得した１以上の各非解決手段文を形態素解析し、取得した１以上の形態素からベクトルを構成し、当該ベクトルを負例として、機械学習の関数に与え、機械学習による学習処理を行うことにより、解決手段文学習器を取得し、学習格納部１１に蓄積する。

学習処理部１３は、例えば、１または２以上の効果文と、１または２以上の非効果文とを用いて、機械学習のアルゴリズムにより、判断対象の文が効果文であるか否かを予測するための学習器である効果文学習器を取得し、学習格納部１１に蓄積する。なお、非効果文とは、効果文ではない文である。

さらに具体的には、学習処理部１３は、例えば、１または２以上の効果文を学習格納部１１から取得し、取得した１以上の各効果文を形態素解析し、取得した１以上の形態素からベクトルを構成し、当該ベクトルを正例とし、かつ１または２以上の非効果文を学習格納部１１から取得し、取得した１以上の各非効果文を形態素解析し、取得した１以上の形態素からベクトルを構成し、当該ベクトルを負例として、機械学習の関数に与え、機械学習による学習処理を行うことにより、効果文学習器を取得し、学習格納部１１に蓄積する。

学習処理部１３は、例えば、１または２以上の目的文と、１または２以上の非目的文とを用いて、機械学習のアルゴリズムにより、判断対象の文が目的文であるか否かを予測するための学習器である目的文学習器を取得し、学習格納部１１に蓄積する。なお、非目的文とは、目的文ではない文である。

さらに具体的には、学習処理部１３は、例えば、１または２以上の目的文を学習格納部１１から取得し、取得した１以上の各目的文を形態素解析し、取得した１以上の形態素からベクトルを構成し、当該ベクトルを正例とし、かつ１または２以上の非目的文を学習格納部１１から取得し、取得した１以上の各非目的文を形態素解析し、取得した１以上の形態素からベクトルを構成し、当該ベクトルを負例として、機械学習の関数に与え、機械学習による学習処理を行うことにより、目的文学習器を取得し、学習格納部１１に蓄積する。

学習処理部１３は、例えば、１または２以上の目的用語と、１または２以上の非目的用語とを用いて、機械学習のアルゴリズムにより、判断対象の用語が目的用語であるか否かを予測するための学習器である目的用語学習器を取得し、学習格納部１１に蓄積する。なお、非目的用語とは、目的用語ではない用語である。

さらに具体的には、学習処理部１３は、例えば、１または２以上の目的用語を学習格納部１１から取得し、取得した１以上の各目的用語の分散表現（ベクトル）を取得し、当該分散表現を正例とし、かつ１または２以上の非目的用語を学習格納部１１から取得し、取得した１以上の各非目的用語の分散表現（ベクトル）を取得し、当該分散表現を負例として、機械学習の関数に与え、機械学習による学習処理を行うことにより、目的用語学習器を取得し、学習格納部１１に蓄積する。

なお、学習処理部１３が文からベクトルを取得する方法、用語からベクトルを取得する方法は問わないことは言うまでもない。学習処理部１３は、文からベクトルを取得する種々の方法、用語からベクトルを取得する種々の方法を使用できる。

特許明細書取得部１３１は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を取得する。特許明細書取得部１３１は、例えば、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を外部のサーバ装置３から取得する。特許明細書取得部１３１は、例えば、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を学習格納部１１から取得する。特許明細書取得部１３１は、例えば、人手評価レコードに含まれる特許明細書を取得しても良い。

重要情報取得部１３２は、後述する受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を用いて、予め決められた条件を満たす重要情報を取得する。

重要情報取得部１３２は、特許明細書取得部１３１が取得した特許明細書を用いて、予め決められた条件を満たす重要情報を取得する。

重要情報取得部１３２は、人手評価情報格納部１１１に格納されている人手評価情報が有する２以上の各人手評価レコードが有する特許識別子に対応する特許明細書を用いて、予め決められた条件を満たす重要情報を取得する。重要情報は、予め決められた条件を満たす文、または予め決められた条件を満たす用語である。

予め決められた条件とは、例えば、効果解決手段文に該当すること、効果用語に該当すること、解決手段用語に該当すること、効果文に該当すること、解決手段文に該当すること、目的文に該当すること、目的用語に該当すること、特徴語に該当すること、関連語に該当すること、重要タグ対応文に該当すること、重要タグ対応用語に該当すること、数値範囲文字列に該当すること、数値範囲文字列から取得できる数値に該当すること等である。

重要情報は、例えば、効果解決手段文取得手段１３２１が取得した１以上の効果解決手段文、または１以上の効果解決手段文から取得された用語である効果用語および解決手段用語を含む。

重要情報は、例えば、効果文取得手段１３２２が取得した１以上の効果文、または１以上の効果文から取得された用語である効果用語を含む。

重要情報は、例えば、解決手段文取得手段１３２３が取得した１以上の解決手段文、または１以上の解決手段文から取得された用語である解決手段用語を含む。

重要情報は、例えば、目的文取得手段１３２４が取得した１以上の目的文、または１以上の目的文から取得された用語である目的用語を含む。

重要情報は、例えば、特徴語取得手段１３２５が取得した１以上の特徴語を含む。

重要情報は、例えば、関連語取得手段１３２６が取得した１以上の関連語を含む。

重要情報は、例えば、重要タグ対応文取得手段１３２７が取得した１以上の重要タグ対応文を含む、または１以上の重要タグ対応文から取得された用語である重要タグ対応用語を含む。

重要情報は、例えば、数値範囲文字列取得手段１３２８が取得した１以上の数値範囲文字列を含む。

重要情報は、例えば、数字取得手段１３２９が取得した３以上の数字を含む。数値範囲文字列が「２．５ｍｇ－５．２ｍｇ」の場合、数値範囲文字列が示す数値範囲に含まれる３以上の数字は、例えば、「２．５ｍｇ」「２．６ｍｇ」「２．７ｍｇ」・・・「５．１ｍｇ」「５．２ｍｇ」である。

重要情報取得部１３２を構成する、効果解決手段文取得手段１３２１、効果文取得手段１３２２、解決手段文取得手段１３２３、目的文取得手段１３２４は、以下に説明するように、例えば、（１）のパターンマッチングの方法、または（２）機械学習の方法等を用いて、重要情報を取得する。なお、特徴語取得手段１３２５、関連語取得手段１３２６、重要タグ対応文取得手段１３２７、数値範囲文字列取得手段１３２８、数字取得手段１３２９は、上記の（１）（２）以外の方法を採ることにより、重要情報を取得することは好適である。なお、下記の重要情報の取得方法は一例であり、他の方法により、重要情報が取得されても良いことは言うまでもない。

重要情報取得部１３２は、特許明細書を用いて、特定の表現を含む文を取得する。特定の表現を含む文は、例えば、効果解決手段文、効果文、解決手段文、または目的文である。

重要情報取得部１３２は、特許明細書を用いて、特定の表現を含む文に含まれる用語を取得する。特定の表現を含む文に含まれる用語は、例えば、効果用語、解決手段用語、または目的用語である。

重要情報取得部１３２は、特許明細書を用いて、特徴語を取得する。重要情報取得部１３２は、特徴語を用いて、関連語を取得する。

重要情報取得部１３２は、特許明細書を用いて、特定のタグに対応する重要タグ対応文、または重要タグ対応用語を取得する。

以下、重要情報の取得例について、各手段ごとに説明する。
（Ａ）効果解決手段文取得手段１３２１

効果解決手段文取得手段１３２１は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、効果解決手段文であるか否かを判断し、効果解決手段文であると判断した１以上の効果解決手段文を取得する。
（１）パターンマッチングによる方法

効果解決手段文取得手段１３２１は、検査対象の特許明細書から１以上の各文を取得し、各文が、予め決められた効果解決手段文パターンに合致するか否かを判断する。効果解決手段文取得手段１３２１は、１または２以上のうちのいずれかの効果解決手段文パターンに合致する文を、効果解決手段文として取得する。

なお、効果解決手段文パターンは、効果解決手段文のパターンを特定する情報である。１または２以上の効果解決手段文パターンは、例えば、学習格納部１１に格納されている。また、効果解決手段文パターンは、例えば、「＜解決手段＞により、＜効果＞できる。」「＜解決手段＞を設けることにより、＜効果＞できる。」「＜解決手段＞に基づいて、＜効果＞できる。」である。なお、パターンマッチングの技術は公知技術であるので、詳細な説明を省略する。

また、効果解決手段文パターン等のパターンは、ブートストラップのアルゴリズムを用いて、増やすことは好適である。
（２）機械学習による方法

効果解決手段文取得手段１３２１は、検査対象の特許明細書から１以上の各文を取得し、各文に対して、効果解決手段文であるか否かを判定する効果解決手段文学習器に適用し、機械学習のアルゴリズムにより予測し、予測の結果である判断情報を取得する。判断情報は、ここでは、文が効果解決手段文であるか否かを示す情報である。

なお、学習処理と同様、予測処理を行う場合も、機械学習は、例えば、深層学習、ＳＶＭ、ランダムフォレスト、決定木等が使用可能である。そして、機械学習において、予測する場合、機械学習の関数（例えば、fastText、TinySVM、各種のRandomForest関数、TensorFlowのライブラリ等）に学習器と入力となる情報群（例えば、文から構成されるベクトル、用語の分散表現等）とを引数として与えると、予測された情報（例えば、重要情報であるか、重要情報でないかの判断情報）が得られる。

そして、効果解決手段文取得手段１３２１は、機械学習の関数が取得した判断情報が「効果解決手段文である」との判断情報である場合、当該文を効果解決手段文として取得する。
（３）効果用語、解決手段用語の取得

効果解決手段文取得手段１３２１は、例えば、取得した効果解決手段文に対応する効果解決手段文パターン（例えば、「＜解決手段＞により、＜効果＞できる。」）を用いて、効果用語（＜効果＞に対応する用語）、解決手段用語（＜解決手段＞に対応する用語）を、取得した効果解決手段文から取得する。

また、効果解決手段文取得手段１３２１は、例えば、機械学習のアルゴリズムにより、効果用語、解決手段用語を取得する。

例えば、効果解決手段文取得手段１３２１は、取得した効果解決手段文を形態素解析し、取得した１以上の各用語に対して、効果用語学習器を適用し、機械学習のアルゴリズムにより、効果用語であるか否かを判断する。また、例えば、効果解決手段文取得手段１３２１は、取得した効果解決手段文を形態素解析し、取得した１以上の各用語に対して、解決手段用語学習器を適用し、機械学習のアルゴリズムにより、解決手段用語であるか否かを判断する。

なお、効果解決手段文取得手段１３２１は、特許明細書の各文を形態素解析し、取得した１以上の各用語に対して、効果用語学習器を適用し、機械学習のアルゴリズムにより、効果用語であるか否かを判断しても良い。また、効果解決手段文取得手段１３２１は、特許明細書の各文を形態素解析し、取得した１以上の各用語に対して、解決手段用語学習器を適用し、機械学習のアルゴリズムにより、解決手段用語であるか否かを判断しても良い。
（Ｂ）効果文取得手段１３２２

効果文取得手段１３２２は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、効果文であるか否かを判断し、効果文であると判断した１以上の効果文を取得する。
（１）パターンマッチングによる方法

効果文取得手段１３２２は、検査対象の特許明細書から１以上の各文を取得し、各文が、予め決められた効果文パターンに合致するか否かを判断する。効果文取得手段１３２２は、１または２以上のうちのいずれかの効果文パターンに合致する文を、効果文として取得する。

なお、効果文パターンは、効果文のパターンを特定する情報である。１または２以上の効果文パターンは、例えば、学習格納部１１に格納されている。また、効果文パターンは、例えば、「＜効果＞できる。」「＜効果＞になる。」である。

また、効果文パターン等のパターンは、ブートストラップのアルゴリズムを用いて、増やすことは好適である。
（２）機械学習による方法

効果文取得手段１３２２は、検査対象の特許明細書から１以上の各文を取得し、各文に対して、効果文であるか否かを判定する効果文学習器に適用し、機械学習のアルゴリズムにより予測し、予測の結果である判断情報を取得する。判断情報は、ここでは、文が効果文であるか否かを示す情報である。

そして、効果文取得手段１３２２は、機械学習の関数が取得した判断情報が「効果文である」との判断情報である場合、当該文を効果文として取得する。
（３）効果用語の取得

効果文取得手段１３２２は、例えば、取得した効果文に対応する効果文パターン（例えば、「＜効果＞できる。」）を用いて、効果用語（＜効果＞に対応する用語）を、取得した効果文から取得する。

例えば、効果文取得手段１３２２は、取得した効果文を形態素解析し、取得した１以上の各用語に対して、効果用語学習器を適用し、機械学習のアルゴリズムにより、効果用語であるか否かを判断する。

なお、効果文取得手段１３２２は、特許明細書の各文を形態素解析し、取得した１以上の各用語に対して、効果用語学習器を適用し、機械学習のアルゴリズムにより、効果用語であるか否かを判断しても良い。
（Ｃ）解決手段文取得手段１３２３

解決手段文取得手段１３２３は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、解決手段文であるか否かを判断し、解決手段文であると判断した１以上の解決手段文を取得する。
（１）パターンマッチングによる方法

解決手段文取得手段１３２３は、検査対象の特許明細書から１以上の各文を取得し、各文が、予め決められた解決手段文パターンに合致するか否かを判断する。解決手段文取得手段１３２３は、１または２以上のうちのいずれかの解決手段文パターンに合致する文を、解決手段文として取得する。

なお、解決手段文パターンは、解決手段文のパターンを特定する情報である。１または２以上の解決手段文パターンは、例えば、学習格納部１１に格納されている。また、解決手段文パターンは、例えば、「ポイントは、＜解決手段＞である。」「＜解決手段＞に基づく。」である。

また、解決手段文パターン等のパターンは、ブートストラップのアルゴリズムを用いて、増やすことは好適である。
（２）機械学習による方法

解決手段文取得手段１３２３は、検査対象の特許明細書から１以上の各文を取得し、各文に対して、解決手段文であるか否かを判定する解決手段文学習器に適用し、機械学習のアルゴリズムにより予測し、予測の結果である判断情報を取得する。判断情報は、ここでは、文が解決手段文であるか否かを示す情報である。

そして、解決手段文取得手段１３２３は、機械学習の関数が取得した判断情報が「解決手段文である」との判断情報である場合、当該文を解決手段文として取得する。
（３）解決手段用語の取得

解決手段文取得手段１３２３は、例えば、取得した解決手段文に対応する解決手段文パターン（例えば、「ポイントは、＜解決手段＞である。」）を用いて、解決手段用語（＜解決手段＞に対応する用語）を、取得した解決手段文から取得する。

また、解決手段文取得手段１３２３は、例えば、機械学習のアルゴリズムにより、解決手段用語を取得する。

例えば、解決手段文取得手段１３２３は、取得した解決手段文を形態素解析し、取得した１以上の各用語に対して、解決手段用語学習器を適用し、機械学習のアルゴリズムにより、解決手段用語であるか否かを判断する。また、例えば、効果解決手段文取得手段１３２１は、取得した効果解決手段文を形態素解析し、取得した１以上の各用語に対して、解決手段用語学習器を適用し、機械学習のアルゴリズムにより、解決手段用語であるか否かを判断する。

なお、解決手段文取得手段１３２３は、特許明細書の各文を形態素解析し、取得した１以上の各用語に対して、解決手段用語学習器を適用し、機械学習のアルゴリズムにより、解決手段用語であるか否かを判断しても良い。
（Ｄ）目的文取得手段１３２４

目的文取得手段１３２４は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各文に対して、目的文であるか否かを判断し、目的文であると判断した１以上の目的文を取得する。
（１）パターンマッチングによる方法

目的文取得手段１３２４は、検査対象の特許明細書から１以上の各文を取得し、各文が、予め決められた目的文パターンに合致するか否かを判断する。目的文取得手段１３２４は、１または２以上のうちのいずれかの目的文パターンに合致する文を、目的文として取得する。

なお、目的文パターンは、目的文のパターンを特定する情報である。１または２以上の目的文パターンは、例えば、学習格納部１１に格納されている。また、目的文パターンは、例えば、「本発明において、＜目的＞することを目的とする。」「本願発明の目的は、＜目的＞である。」である。

また、目的文パターン等のパターンは、ブートストラップのアルゴリズムを用いて、増やすことは好適である。
（２）機械学習による方法

目的文取得手段１３２４は、検査対象の特許明細書から１以上の各文を取得し、各文に対して、目的文であるか否かを判定する目的文学習器に適用し、機械学習のアルゴリズムにより予測し、予測の結果である判断情報を取得する。判断情報は、ここでは、文が目的文であるか否かを示す情報である。

そして、目的文取得手段１３２４は、機械学習の関数が取得した判断情報が「目的文である」との判断情報である場合、当該文を目的文として取得する。
（３）目的用語の取得

目的文取得手段１３２４は、例えば、取得した目的文に対応する目的文パターン（例えば、「本発明において、＜目的＞することを目的とする。」）を用いて、目的用語（＜目的＞に対応する用語）を、取得した目的文から取得する。

また、目的文取得手段１３２４は、例えば、機械学習のアルゴリズムにより、目的用語を取得する。

例えば、目的文取得手段１３２４は、取得した目的文を形態素解析し、取得した１以上の各用語に対して、目的用語学習器を適用し、機械学習のアルゴリズムにより、目的用語であるか否かを判断する。また、例えば、目的文取得手段１３２４は、取得した目的文を形態素解析し、取得した１以上の各用語に対して、目的用語学習器を適用し、機械学習のアルゴリズムにより、目的用語であるか否かを判断する。

なお、目的文取得手段１３２４は、特許明細書の各文を形態素解析し、取得した１以上の各用語に対して、目的用語学習器を適用し、機械学習のアルゴリズムにより、目的用語であるか否かを判断しても良い。
（Ｅ）特徴語取得手段１３２５

特徴語取得手段１３２５は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各用語の出現頻度を取得し、出現頻度を用いて、１以上の各用語に対するスコアを算出し、スコアが予め決められた条件を満たすほど大きい１以上の特徴語を取得する。

特徴語取得手段１３２５は、例えば、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各用語の出現回数を取得する。また、特徴語取得手段１３２５は、例えば、対象となる特許明細書の集合において、１以上の各用語の出現回数を取得する。そして、特徴語取得手段１３２５は、分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる１以上の各用語のＴＦ／ＩＤＦの値（スコア）を算出する。次に、特徴語取得手段１３２５は、スコアが予め決められた条件を満たすほど高い１以上の用語を、当該特許明細書の特徴語として取得する。なお、文書から特徴語を抽出する技術は、問わない。特徴語取得手段１３２５は、種々の技術を使用可能である。
（Ｆ）関連語取得手段１３２６

関連語取得手段１３２６は、関連語辞書から、特徴語取得手段１３２５が取得した１以上の各特徴語に対応する１以上の関連語を取得する。なお、かかる関連語は、重要情報の一例である。また、関連語取得手段１３２６が使用する関連語辞書は、学習器生産装置１または特許分類装置２の内部の辞書でも良いし、図示しないサーバの辞書でも良い。
（Ｆ）重要タグ対応文取得手段１３２７

重要タグ対応文取得手段１３２７は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる文であり、１以上の重要タグ対応文を取得する。

重要タグ対応文取得手段１３２７は、例えば、予め決められたタグを特定する重要タグ特定情報を学習格納部１１から読み出し、当該重要タグ特定情報により特定されるタグの中の１以上の文を、処理対象の特許明細書から取得する。なお、重要タグ特定情報は、例えば、［発明の効果］または［発明が解決しようとする課題］または［産業上の利用可能性］である。例えば、特許明細書から［発明の効果］に対応する１以上の文を取得する技術は公知技術である。

また、重要タグ対応文取得手段１３２７は、重要タグ特定情報に対応する１以上の各文から、重要タグ用語を取得しても良い。重要タグ対応文取得手段１３２７は、例えば、１以上の各文を形態素解析し、１以上の自立語を重要タグ用語として取得する。
（Ｇ）数値範囲文字列取得手段１３２８

数値範囲文字列取得手段１３２８は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書に含まれる文字列であり、数値範囲を示す文字列である１以上の数値範囲文字列を取得する。

数値範囲文字列取得手段１３２８は、例えば、数値範囲文字列パターンにマッチする文字列を特許明細書から取得する。なお、数値範囲文字列パターンは、学習格納部１１に格納されている。数値範囲文字列パターンは、例えば、「＜数字＞＜単位＞～＜数字＞＜単位＞」「＜数字＞～＜数字＞＜単位＞」「＜数字＞～＜数字＞」「＜数字＞＜単位＞から＜数字＞＜単位＞」「＜数字＞から＜数字＞＜単位＞」「＜数字＞から＜数字＞」「＜数字＞＜単位＞－＜数字＞＜単位＞」「＜数字＞－＜数字＞＜単位＞」「＜数字＞－＜数字＞」である。

なお、数値範囲文字列取得手段１３２８は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書の中の特定のタグに対応する領域の１以上の文から１以上の数値範囲文字列を取得することは好適である。なお、特定のタグに対応する領域は、例えば、［発明を実施するための形態］［実施例］［実験］等である。
（Ｈ）数字取得手段１３２９

数字取得手段１３２９は、数値範囲文字列取得手段１３２８が取得した数値範囲文字列が示す数値範囲に含まれる３以上の数字を取得する。数字取得手段１３２９は、数値範囲文字列取得手段１３２８が取得した数値範囲文字列が示す数値範囲の両端と１以上の中の数値を少なくとも取得する。数字取得手段１３２９は、通常、数値範囲の上限と下限の値を取得するが、上限と下限の値を取得しなくても良い。数字取得手段１３２９は、数値範囲文字列が示す数値範囲の中の数値であり、数値範囲文字列の中に現れていない文字列の数値を取得することは好適である。

取得された数値範囲文字列が「２．５ｍｇ－５．２ｍｇ」の場合、数字取得手段１３２９は、数値範囲文字列が示す数値範囲に含まれる数字であり、例えば、「２．５ｍｇ」「２．６ｍｇ」「２．７ｍｇ」・・・「５．１ｍｇ」「５．２ｍｇ」を取得することは好適である。つまり、数字取得手段１３２９は、数値範囲文字列の有効桁数（ここでは、例えば、小数点１桁）で示される桁数の数値であり、取得された数値範囲文字列が示す範囲「２．５－５．２」の数値を生成し、３以上の数値を取得する。なお、数字取得手段１３２９が取得する数値は、単位を有しても有さなくても良い。

学習元情報取得部１３３は、２以上の各人手評価レコードごとに、重要情報取得部１３２が取得した重要情報と、分類結果情報とを有する特許レコードを取得し、２以上の特許レコードを有する学習元情報を取得する。分類結果情報は、重要情報の元になった特許明細書に対応する特許識別子と対になる情報であり、通常、人手による当該特許の分類の結果を示す情報である。

特許レコードは、特許識別子に対応する特許請求の範囲または要約書のうちの１種類以上の情報をも含むことは好適である。また、特許レコードは、１または２以上の特許分類コードを含むことは好適である。

学習部１３４は、学習元情報取得部１３３が取得した学習元情報を機械学習のアルゴリズムにより学習し、学習器を取得する。

学習部１３４は、学習元情報取得部１３３が取得した学習元情報のうち、分類結果情報以外の情報を入力とし、分類結果情報を出力とする学習器を、機械学習のアルゴリズムにより構成する。なお、機械学習は、例えば、深層学習、ＳＶＭ、ランダムフォレスト、決定木等が使用可能である。また、機械学習において、学習器を構成するためには、例えば、機械学習の関数（例えば、fastText、TinySVM、各種のRandomForest関数、TensorFlowのライブラリ等）に、入力となる情報群（例えば、学習元情報のうち、分類結果情報以外の情報）と出力させたい情報（例えば、分類結果情報）とを引数として与えると学習器が得られる。なお、入力となる情報群と出力させたい情報とは、特許レコードを構成する。

学習出力部１４は、各種の情報を出力する。各種の情報とは、例えば、学習器、学習処理が完了した旨の情報である。

ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。

蓄積部１４１は、学習部１３４が取得した学習器を蓄積する。蓄積部１４１は、例えば、学習格納部１１に、学習器を蓄積する。蓄積部１４１は、学習動作開始指示が有する種類特定情報と学習器とを対応付けて、学習部１３４が取得した学習器を蓄積することは好適である。

特許分類装置２を構成する格納部２１には、各種の情報が格納される。各種の情報とは、例えば、学習器である。

学習器格納部２１１には、１または２以上の学習器が格納される。学習器格納部２１１の学習器は、例えば、学習器生産装置１が取得した学習器である。学習器格納部２１１の学習器は、例えば、種類特定情報に対応付いている。

学習器は、２以上の特許レコードを有する学習元情報を機械学習のアルゴリズムにより学習し、取得された学習器である。特許レコードは、特許明細書の全文は有さない。特許レコードは、特許を識別する特許識別子に対応する特許明細書を用いて取得された重要情報と、人手による特許の分類結果を特定する分類結果情報とを有する。

受付部２２は、例えば、予測開始指示を受け付ける。予測開始指示は、予測の開始の指示である。予測開始指示は、例えば、予測対象の分類対象情報、使用する学習器を特定する情報等を有する。

受付部２２は、例えば、１または２以上の分類対象情報を受け付ける。分類対象情報は、分類対象の特許を識別する特許識別子を含む。分類対象情報は、例えば、特許請求の範囲、要約書のうちの１以上の情報を含む。分類対象情報は、例えば、１以上の特許分類コードを含む。分類対象情報は、例えば、特許明細書を含む。

処理部２３は、各種の処理を行う。各種の処理とは、例えば、特許明細書取得部１３１、重要情報取得部１３２、分類対象加工情報取得部２３３、予測部２３４等が行う処理である。

分類対象加工情報取得部２３３は、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応する情報であり、重要情報取得部１３２が取得した重要情報を含む情報である分類対象加工情報を取得する。

分類対象加工情報は、例えば、重要情報取得部１３２が取得した重要情報と、特許識別子に対応する特許請求の範囲または要約書のうちの１種類以上の情報とを含む。

受付部２２が受け付けた分類対象情報が特許明細書を有さない場合、分類対象加工情報取得部２３３は、例えば、受付部２２が受け付けた分類対象情報の一部または全部と重要情報取得部１３２が取得した重要情報とからなる分類対象加工情報を取得する。

受付部２２が受け付けた分類対象情報が特許明細書を有する場合、分類対象加工情報取得部２３３は、例えば、受付部２２が受け付けた分類対象情報から特許明細書を含む一部の情報を除き、当該特許明細書等を除いた後の情報と重要情報取得部１３２が取得した重要情報とからなる分類対象加工情報を取得する。

また、ここでの重要情報取得部１３２は、使用する学習器に対応付いている種類特定情報を用いることは好適である。

予測部２３４は、分類対象加工情報取得部２３３が取得した分類対象加工情報に学習器に適用し、機械学習のアルゴリズムにより分類対象加工情報の分類を予測し、分類結果情報を取得する。機械学習は、例えば、深層学習、ＳＶＭ、ランダムフォレスト、決定木等が使用可能である。予測部２３４は、機械学習の関数に学習器と分類対象加工情報とを引数として与え、分類結果情報を取得する。なお、学習器は、学習器格納部２１１の学習器である。

出力部２４は、予測部２３４が取得した分類結果情報を、受付部２２が受け付けた分類対象情報に含まれる特許識別子に対応付けて出力する。

ここで、出力とは、例えば、ユーザ端末４への送信であるが、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。

サーバ装置３は、特許識別子に対応する特許明細書を多数格納しているサーバである。サーバ装置３は、学習器生産装置１または特許分類装置２から特許識別子を有する特許取得指示を受信すると、当該特許識別子に対応する特許明細書を格納している特許データベースから取得し、当該特許明細書を学習器生産装置１または特許分類装置２に送信する。

ユーザ端末４は、ユーザから学習動作開始指示を受け付け、当該学習動作開始指示を学習器生産装置１に送信する。また、ユーザ端末４は、ユーザから予測動作開始指示を受け付け、当該予測動作開始指示を特許分類装置２に送信する。なお、ユーザ端末４は、予測動作開始指示の送信に応じて、予測の結果である分類結果情報を受信し、出力することは好適である。

学習格納部１１、人手評価情報格納部１１１、格納部２１、および学習器格納部２１１は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

学習格納部１１等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が学習格納部１１等で記憶されるようになってもよく、通信回線等を介して送信された情報が学習格納部１１等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が学習格納部１１等で記憶されるようになっても良い。

学習受付部１２、特許明細書取得部１３１、学習出力部１４、および出力部２４は、通常、無線または有線の通信手段等で実現され得る。

学習処理部１３、重要情報取得部１３２、学習元情報取得部１３３、学習部１３４、効果解決手段文取得手段１３２１、効果文取得手段１３２２、解決手段文取得手段１３２３、目的文取得手段１３２４、特徴語取得手段１３２５、関連語取得手段１３２６、重要タグ対応文取得手段１３２７、数値範囲文字列取得手段１３２８、数字取得手段１３２９、蓄積部１４１、処理部２３、分類対象加工情報取得部２３３、および予測部２３４は、通常、ＭＰＵやメモリ等から実現され得る。学習処理部１３等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。

次に、特許分類システムＡの動作例について説明する。まず、学習器生産装置１の動作例について、図４のフローチャートを用いて説明する。

（ステップＳ４０１）学習受付部１２は、学習動作開始指示を受け付けたか否かを判断する。学習動作開始指示を受け付けた場合はステップＳ４０２に行き、学習動作開始指示を受け付けなかった場合はステップＳ４０１に戻る。

（ステップＳ４０２）学習処理部１３は、カウンタｉに１を代入する。

（ステップＳ４０３）学習処理部１３は、人手評価情報格納部１１１に格納されている学習対象の人手評価情報の中に、ｉ番目の人手評価レコードが存在するか否かを判断する。
ｉ番目の人手評価レコードが存在する場合はステップＳ４０４に行き、存在しない場合はステップＳ４０８に行く。

（ステップＳ４０４）特許明細書取得部１３１は、ｉ番目の人手評価レコードの中に特許明細書が存在すれば、ｉ番目の人手評価レコードから特許明細書を取得する。また、特許明細書取得部１３１は、ｉ番目の人手評価レコードの中に特許明細書が存在しなければ、ｉ番目の人手評価レコードが有する特許識別子を取得し、当該特許識別子をキーとして、サーバ装置３から特許明細書を受信する。

（ステップＳ４０５）重要情報取得部１３２は、ステップＳ４０４で取得された特許明細書から、１種類以上の重要情報を取得する。かかる重要情報取得処理例について、図５のフローチャートを用いて説明する。

（ステップＳ４０６）学習元情報取得部１３３は、ｉ番目の人手評価レコードとステップＳ４０５で取得された重要情報を用いて、ｉ番目の人手評価レコードの中の分類結果情報と重要情報とを少なくとも有するｉ番目の特許レコードを取得し、図示しないバッファに一時蓄積する。

（ステップＳ４０７）学習処理部１３は、カウンタｉを１、インクリメントする。ステップＳ４０３に戻る。

（ステップＳ４０８）学習元情報取得部１３３は、ステップＳ４０６で一時蓄積したすべての特許レコードを有する学習元情報を構成する。

（ステップＳ４０９）学習部１３４は、ステップＳ４０８で取得された学習元情報を用いて学習処理を行い、学習器を取得する。

（ステップＳ４１０）蓄積部１４１は、学習動作開始指示が有する種類特定情報と学習器とを対応付けて、学習格納部１１に蓄積する。ステップＳ４０１に戻る。

なお、図４のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

次に、ステップＳ４０５の重要情報取得処理例について、図５のフローチャートを用いて説明する。

（ステップＳ５０１）重要情報取得部１３２は、学習動作開始指示が有する種類特定情報を取得する。なお、予測処理においては、重要情報取得部１３２は、予測処理で用いる学習器に対応付いている種類特定情報を取得する。

（ステップＳ５０２）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、効果解決手段文を取得するか否かを判断する。効果解決手段文を取得する場合はステップＳ５０３に行き、効果解決手段文を取得しない場合はステップＳ５０４に行く。

（ステップＳ５０３）重要情報取得部１３２は、効果解決手段文取得処理を行う。効果解決手段文取得処理例について、図６のフローチャートを用いて説明する。

（ステップＳ５０４）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、効果文を取得するか否かを判断する。効果文を取得する場合はステップＳ５０５に行き、効果文を取得しない場合はステップＳ５０６に行く。

（ステップＳ５０５）重要情報取得部１３２は、効果取得処理を行う。効果文取得処理例について、図６のフローチャートを用いて説明する。

（ステップＳ５０６）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、解決手段文を取得するか否かを判断する。解決手段文を取得する場合はステップＳ５０７に行き、解決手段文を取得しない場合はステップＳ５０８に行く。

（ステップＳ５０７）重要情報取得部１３２は、解決手段文取得処理を行う。解決手段文取得処理例について、図６のフローチャートを用いて説明する。

（ステップＳ５０８）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、目的文を取得するか否かを判断する。目的文を取得する場合はステップＳ５０９に行き、目的文を取得しない場合はステップＳ５１０に行く。

（ステップＳ５０９）重要情報取得部１３２は、目的文取得処理を行う。目的文取得処理例について、図６のフローチャートを用いて説明する。

（ステップＳ５１０）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、効果用語を取得するか否かを判断する。効果用語を取得する場合はステップＳ５１１に行き、効果用語を取得しない場合はステップＳ５１２に行く。

（ステップＳ５１１）重要情報取得部１３２は、効果用語取得処理を行う。効果用語取得処理例について、図７のフローチャートを用いて説明する。

（ステップＳ５１２）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、解決手段用語を取得するか否かを判断する。解決手段用語を取得する場合はステップＳ５１３に行き、解決手段用語を取得しない場合はステップＳ５１４に行く。

（ステップＳ５１３）重要情報取得部１３２は、解決手段用語取得処理を行う。解決手段用語取得処理例について、図７のフローチャートを用いて説明する。

（ステップＳ５１４）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、目的用語を取得するか否かを判断する。目的用語を取得する場合はステップＳ５１５に行き、目的用語を取得しない場合はステップＳ５１６に行く。

（ステップＳ５１５）重要情報取得部１３２は、目的用語取得処理を行う。目的用語取得処理例について、図７のフローチャートを用いて説明する。

（ステップＳ５１６）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、特徴語を取得するか否かを判断する。特徴語を取得する場合はステップＳ５１７に行き、特徴語を取得しない場合はステップＳ５１８に行く。

（ステップＳ５１７）重要情報取得部１３２は、特徴語取得処理を行う。なお、特徴語取得処理例として、例えば、上述したＴＦ／ＩＤＦのアルゴリズムを用いる。

（ステップＳ５１８）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、関連語を取得するか否かを判断する。関連語を取得する場合はステップＳ５１９に行き、関連語を取得しない場合はステップＳ５２０に行く。

（ステップＳ５１９）重要情報取得部１３２は、関連語取得処理を行う。なお、関連語取得処理例として、例えば、上述したように、ステップＳ５１７で取得された１以上の各特徴語をキーとして、関連語辞書を検索し、各特徴語と対になる１以上の関連語を取得する。なお、関連語の取得の前処理として、特徴語の取得処理が行われている、とする。

（ステップＳ５２０）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、重要タグ対応文を取得するか否かを判断する。重要タグ対応文を取得する場合はステップＳ５２１に行き、重要タグ対応文を取得しない場合はステップＳ５２３に行く。

（ステップＳ５２１）重要情報取得部１３２は、重要タグ対応文取得処理を行う。なお、重要タグ対応文取得処理例は、上述したので、ここでの説明は省略する。

（ステップＳ５２２）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、重要タグ用語を取得するか否かを判断する。重要タグ用語を取得する場合はステップＳ５２３に行き、重要タグ用語を取得しない場合はステップＳ５２４に行く。

（ステップＳ５２３）重要情報取得部１３２は、重要タグ用語取得処理を行う。なお、重要タグ用語取得処理例は、上述したので、ここでの説明は省略する。

（ステップＳ５２４）重要情報取得部１３２は、ステップＳ５０１で取得した種類特定情報を検査し、重要情報として、数値範囲文字列を取得するか否かを判断する。数値範囲文字列を取得する場合はステップＳ５２５に行き、数値範囲文字列を取得しない場合は上位処理にリターンする。

（ステップＳ５２５）重要情報取得部１３２は、数値範囲文字列取得処理を行う。なお、数値範囲文字列取得処理例について、図８のフローチャートを用いて説明する。

（ステップＳ５２６）重要情報取得部１３２は、ステップＳ５２３で取得された１以上の数値範囲文字列を用いて、数字取得処理を行う。数字取得処理例について、図９のフローチャートを用いて説明する。

次に、ステップＳ５０３の効果解決手段文取得処理例、ステップＳ５０５の効果取得処理例、ステップＳ５０７の解決手段文取得処理例、ステップＳ５０９の目的文取得処理例等の文取得処理例について、図６のフローチャートを用いて説明する。

（ステップＳ６０１）重要情報取得部１３２は、文の抽出対象の特許明細書から、予め決められた文抽出対象の範囲の１以上の文を取得する。なお、予め決められた文抽出対象の範囲は、重要情報の種類に応じて異なっていても良い。予め決められた文抽出対象の範囲は、例えば、特許明細書全体、［発明の効果］、［発明を実施するための形態］である。

（ステップＳ６０２）重要情報取得部１３２は、カウンタｉに１を代入する。

（ステップＳ６０３）重要情報取得部１３２は、ステップＳ６０１で取得した１以上の文の中に、ｉ番目の文が存在するか否かを判断する。ｉ番目の文が存在する場合はステップＳ６０４に行き、ｉ番目の文が存在しない場合は上位処理にリターンする。

（ステップＳ６０４）重要情報取得部１３２は、ステップＳ６０３で取得したｉ番目の文が、対応する種類の重要情報の文に該当するか否かを判断する。なお、かかる判断処理の例については、上述した。かかる判断処理は、例えば、パターンマッチングによる方法、機械学習による方法等がある。

（ステップＳ６０５）重要情報取得部１３２は、ステップＳ６０４における判断結果が、該当する種類の重要情報の文である場合はステップＳ６０６に行き、該当する種類の重要情報の文でない場合はステップＳ６０７に行く。

（ステップＳ６０６）重要情報取得部１３２は、ｉ番目の文を重要情報として取得し、図示しないバッファに一時蓄積する。

（ステップＳ６０７）重要情報取得部１３２は、カウンタｉを１、インクリメントする。ステップＳ６０３に戻る。

次に、ステップＳ５１１の効果用語取得処理例、ステップＳ５１３の解決手段用語取得処理例、ステップＳ５１５の目的用語取得処理例等の用語取得処理例について、図７のフローチャートを用いて説明する。

（ステップＳ７０１）重要情報取得部１３２は、用語に対応する文の取得処理を行う。文取得処理は、図６のフローチャートを用いて説明した処理である。なお、用語が効果用語である場合、取得する文は、効果解決手段文と効果文のうちの１種類以上の文である。また、用語が解決手段用語である場合、取得する文は、効果解決手段文と解決手段文のうちの１種類以上の文である。また、用語が目的用語である場合、取得する文は、目的文である。

（ステップＳ７０２）重要情報取得部１３２は、カウンタｉに１を代入する。

（ステップＳ７０３）重要情報取得部１３２は、ステップＳ７０１で取得した１以上の文の中に、ｉ番目の文が存在するか否かを判断する。ｉ番目の文が存在する場合はステップＳ７０４に行き、ｉ番目の文が存在しない場合は上位処理にリターンする。

（ステップＳ７０４）重要情報取得部１３２は、ｉ番目の文を形態素解析し、１以上の用語を取得する。なお、ここで取得する用語は、自立語のみでも良い。また、ここで取得する用語は、各文のパターンを用いて取得される用語であり、パターンの中の変数に対応する用語である。パターンの中の変数に対応する用語とは、用語が効果用語である場合、パターンの中の変数は＜効果＞である。

（ステップＳ７０５）重要情報取得部１３２は、ステップＳ７０４で取得した１以上の用語を重要情報として取得し、図示しないバッファに一時蓄積する。

（ステップＳ７０６）重要情報取得部１３２は、カウンタｉを１、インクリメントする。ステップＳ７０３に戻る。

次に、ステップＳ５２３の数値範囲文字列取得処理例について、図８のフローチャートを用いて説明する。図８のフローチャートにおいて、図６のフローチャートと同一のステップについて、説明を省略する。

（ステップＳ８０１）重要情報取得部１３２は、カウンタｊに１を代入する。

（ステップＳ８０２）重要情報取得部１３２は、ｊ番目の数値範囲文字列取得パターンが格納されているか否かを判断する。ｊ番目の数値範囲文字列取得パターンが格納されている場合はステップＳ８０３に行き、格納されていない場合はステップＳ６０７に行く。

（ステップＳ８０３）重要情報取得部１３２は、ｉ番目の文の中に、ｊ番目の数値範囲文字列取得パターンの合致する文字列が存在するか否かを検査する。合致する文字列が存在する場合はステップＳ８０４に行き、合致する文字列が存在しない場合はステップＳ８０５に行く。

（ステップＳ８０４）重要情報取得部１３２は、ｉ番目の文の中のｊ番目の数値範囲文字列取得パターンの合致する１以上の文字列を取得し、図示しないバッファに蓄積する。

（ステップＳ８０５）重要情報取得部１３２は、カウンタｊを１、インクリメントする。ステップＳ８０２に戻る。

次に、ステップＳ５２６の数字取得処理例について、図９のフローチャートを用いて説明する。

（ステップＳ９０１）重要情報取得部１３２は、カウンタｉに１を代入する。

（ステップＳ９０２）重要情報取得部１３２は、ステップＳ８０４で取得されたｉ番目の数値範囲文字列が存在するか否かを判断する。存在する場合はステップＳ９０３に行き、存在しない場合は上位処理にリターンする。

（ステップＳ９０３）重要情報取得部１３２は、ｉ番目の数値範囲文字列の下限の数値を取得する。

（ステップＳ９０４）重要情報取得部１３２は、ｉ番目の数値範囲文字列の上限の数値を取得する。

（ステップＳ９０５）重要情報取得部１３２は、ｉ番目の数値範囲文字列から単位を取得する。

（ステップＳ９０６）重要情報取得部１３２は、ｉ番目の数値範囲文字列の数値から有効桁数を取得する。

（ステップＳ９０７）重要情報取得部１３２は、下限の数値より大きく、上限の数値より小さい数値であり、有効桁数だけの桁数のある１以上の数値を取得する。

（ステップＳ９０８）重要情報取得部１３２は、ステップＳ９０７で取得した１以上の各数値の後ろに、ステップＳ９０５で取得した単位を付加する。

（ステップＳ９０９）重要情報取得部１３２は、カウンタｉを１、インクリメントする。ステップＳ９０２に戻る。

次に、特許分類装置２の動作例について、図１０のフローチャートを用いて説明する。

（ステップＳ１００１）受付部２２は、１以上の分類対象情報を含む予測開始指示を受け付けたか否かを判断する。予測開始指示を受け付けた場合はステップＳ１００２に行き、予測開始指示を受け付けなかった場合はステップＳ１００１に戻る。なお、１以上の分類対象情報を含む予測開始指示は、１以上の分類対象情報を取得するための情報（例えば、ファイル名、ＵＲＬ等）を含む予測開始指示でも良い。

（ステップＳ１００２）処理部２３は、カウンタｉに１を代入する。

（ステップＳ１００３）処理部２３は、ステップＳ１００１で受け付けられた予測開始指示に対応するｉ番目の分類対象情報が存在するか否かを判断する。ｉ番目の分類対象情報が存在する場合はステップＳ１００４に行き、ｉ番目の分類対象情報が存在しない場合はステップＳ１００１に戻る。

（ステップＳ１００４）特許明細書取得部１３１は、ｉ番目の分類対象情報の中に、特許明細書が存在するか否かを判断する。特許明細書が存在する場合はステップＳ１００５に行き、特許明細書が存在しない場合はステップＳ１００６に行く。

（ステップＳ１００５）特許明細書取得部１３１は、ｉ番目の分類対象情報の中から、特許明細書を取得する。ステップＳ１００８に行く。

（ステップＳ１００６）特許明細書取得部１３１は、ｉ番目の分類対象情報の中から、特許識別子を取得する。

（ステップＳ１００７）特許明細書取得部１３１は、ステップＳ１００６で取得した特許識別子をキーとして、サーバ装置３から特許明細書を受信する。

（ステップＳ１００８）重要情報取得部１３２は、取得された特許明細書を用いて、ｉ番目の重要情報を取得する。重要情報取得処理例について、図５のフローチャートを用いて説明した。なお、ここで、重要情報取得部１３２は、予測処理で使用する学習器に対応付いている種類特定情報を使用して、重要情報を取得することは好適である。

（ステップＳ１００９）分類対象加工情報取得部２３３は、ステップＳ１００８で取得されたｉ番目の重要情報を有し、特許明細書の全文を有さない、ｉ番目の分類対象加工情報を取得する。

（ステップＳ１０１０）予測部２３４は、予測処理で使用する学習器を学習器格納部２１１から取得する。

（ステップＳ１０１１）予測部２３４は、ｉ番目の分類対象加工情報とステップＳ１０１０で取得した学習器とを用いて、機械学習のアルゴリズムにより、予測処理を行い、分類結果情報を取得する。

（ステップＳ１０１２）出力部２４は、ステップＳ１０１１で取得された分類結果情報を、ｉ番目の分類対象情報に対応付けて蓄積する。

（ステップＳ１０１３）処理部２３は、カウンタｉを１、インクリメントする。ステップＳ１００３に戻る。

なお、図１０のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

以上、本実施の形態によれば、特許明細書に関する重要な情報を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、特許請求の範囲または/および要約書をも用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、効果解決手段文または効果用語または解決手段用語を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、効果文または効果用語を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、解決手段文または解決手段用語を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、目的文または目的用語を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、特徴語を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、特徴語の関連語を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、重要タグ対応文または重要タグ対応用語を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、数値範囲文字列を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、数値範囲文字列が示す数値範囲に含まれる３以上の数字を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、外部のサーバ装置から取得した特許明細書を用いて取得された重要情報を用いることにより、特許を精度高く分類できる。

また、本実施の形態によれば、種類特定情報を用いて、複数種類の重要情報から適切な重要情報のみを取得することにより、特許をより精度高く分類できる。なお、例えば、効果解決手段文はすべての技術分野の特許の分類で使用可能であると考えられる、一方、数値範囲文字列、数値範囲文字列が示す数値範囲に含まれる数字等は、化学分野等の一部の技術分野の特許の分類で使用可能であると考えられる。

さらに、本実施の形態によれば、特許を精度高く分類するための学習器を生産できる。

なお、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをＣＤ－ＲＯＭなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における特許分類装置２を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、特許明細書の全文は有さない特許レコードであり、特許を識別する特許識別子に対応する特許明細書を用いて取得された重要情報と、人手による特許の分類結果を特定する分類結果情報とを有する２以上の特許レコードを有する学習元情報を機械学習のアルゴリズムにより学習し、取得された学習器が格納される学習器格納部にアクセス可能なコンピュータを、分類対象の特許を識別する特許識別子を含む分類対象情報を受け付ける受付部と、前記受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を用いて、予め決められた条件を満たす重要情報を取得する重要情報取得部と、前記受付部が受け付けた分類対象情報に含まれる特許識別子に対応する情報であり、前記重要情報取得部が取得した重要情報を含む情報である分類対象加工情報を取得する分類対象加工情報取得部と、前記分類対象加工情報取得部が取得した分類対象加工情報に前記学習器を適用し、機械学習のアルゴリズムにより当該分類対象加工情報の分類を予測し、分類結果情報を取得する予測部と、前記予測部が取得した分類結果情報を、前記受付部が受け付けた分類対象情報に含まれる特許識別子に対応付けて出力する出力部として機能させるためのプログラムである。

また、学習器生産装置１を実現するソフトウェアは、特許を識別する特許識別子と、当該特許識別子に対応する特許の人手による分類結果を特定する分類結果情報とを有する２以上の人手評価レコードを有する人手評価情報が格納される人手評価情報格納部にアクセス可能なコンピュータを、前記人手評価情報格納部に格納されている人手評価情報が有する２以上の各人手評価レコードが有する特許識別子に対応する特許明細書を用いて、予め決められた条件を満たす重要情報を取得する重要情報取得部と、前記２以上の各人手評価レコードごとに、前記重要情報取得部が取得した重要報と、当該重要情報の元になった特許明細書に対応する特許識別子と対になる分類結果情報とを有する特許レコードを取得し、当該２以上の特許レコードを有する学習元情報を取得する学習元情報取得部と、前記学習元情報取得部が取得した学習元情報を機械学習のアルゴリズムにより学習し、学習器を取得する学習部と、前記学習部が取得した学習器を蓄積する蓄積部として機能させるためのプログラムである。

（実施の形態２）
本実施の形態において、異なるアルゴリズムを用いて、特許の分類を精度高く行う特許分類システムＢについて説明する。

また、本実施の形態において、使用するデータが異なる場合の、特許分類システムＢについて説明する。

また、本実施の形態において、学習器生成プログラムが異なる場合の、特許分類システムＢについて説明する。

また、本実施の形態において、統計処理が異なる場合の、特許分類システムＢについて説明する。

また、本実施の形態において、２以上の統計処理方法は、各学習器の予測結果のＯＲまたはＡＮＤまたは多数決を採る方法のうちの２以上の方法を含む、特許分類システムＢについて説明する。

また、本実施の形態において、精度は再現率または適合率またはＦ値または正解率である、特許分類システムＢについて説明する。

また、本実施の形態において、予測処理を行うための適切な処理を決定できるアルゴリズム決定装置５について説明する。

また、本実施の形態において、アルゴリズム決定装置５が決定したアルゴリズムを用いて最適な学習器を生産する、学習器の生産装置について説明する。

また、本実施の形態において、学習器の生産装置が生産した最適な学習器を用いて、特許の分類を精度高く行う特許分類装置について説明する。

図１１は、本実施の形態における特許分類システムＢのブロック図である。特許分類システムＢは、アルゴリズム決定装置５、学習器生産装置６、特許分類装置８、サーバ装置３、および１または２以上のユーザ端末４を備える。

アルゴリズム決定装置５は、格納部５１、受付部５２、処理部５３、および出力部５４を備える。格納部５１は、プログラム格納部５１１、および精度特定情報格納部５１２を備える。受付部５２は、学習元情報受付部５２１を備える。処理部５３は、学習部５３１、予測部５３２、評価部５３３、アルゴリズム情報取得部５３４、学習元情報取得部５３５、および統計処理部５３６を備える。

学習器生産装置６は、学習格納部６１、学習受付部６２、学習処理部１３、および学習出力部６４を備える。学習受付部６２は、学習元情報受付部６２１を備える。学習処理部１３は、特許明細書取得部１３１、重要情報取得部１３２、学習元情報取得部１３３、および学習部１３４を備える。重要情報取得部１３２は、効果解決手段文取得手段１３２１、効果文取得手段１３２２、解決手段文取得手段１３２３、目的文取得手段１３２４、特徴語取得手段１３２５、関連語取得手段１３２６、重要タグ対応文取得手段１３２７、数値範囲文字列取得手段１３２８、および数字取得手段１３２９を備える。学習出力部６４は、蓄積部６４１を備える。

図１２は、特許分類装置８のブロック図である。特許分類装置８は、格納部２１、受付部８１、処理部８２、出力部２４を備える。処理部８２は、特許明細書取得部１３１、重要情報取得部１３２、分類対象加工情報取得部２３３、統計処理部５３６、および予測部８２１を備える。

サーバ装置３、およびユーザ端末４は、実施の形態１におけるものと同じ要素である。

アルゴリズム決定装置５を構成する格納部５１には、各種の情報が格納される。各種の情報とは、例えば、後述するプログラム、および後述する精度特定情報などである。また、格納部５１には、例えば、後述する学習元情報なども格納されていても良い。

プログラム格納部５１１には、１または２以上の学習器生成プログラムと、予測プログラムとが格納される。ここで、予測プログラムは、当該１以上の各学習器生成プログラムに対応付いている。つまり、学習器生成プログラムと予測プログラムとは、通常、一対一に対応しているが、多対一に対応していてもよい。

学習器生成プログラムとは、学習元情報を用いて、特許情報を分類するための学習器を生成するプログラムである。学習元情報とは、学習器を生成するための元情報である。学習元情報は、例えば、２以上の特許分類情報を有する。特許分類情報とは、特許の分類に関する情報である。特許分類情報は、例えば、特許情報と、分類情報とを有する。

特許情報とは、特許に関する情報である。特許情報は、例えば、特許明細書の一部であることは好適であるが、特許明細書の全文でもよい。特許明細書は、例えば、特許公報、公開特許公報、公表特許公報等であり、その種類は問わない。特許情報は、通常、特許識別子を含む。特許識別子は、前述したように、例えば、ＩＤ、出願番号等である。また、特許情報は、例えば、要約、特許請求の範囲、明細書、特許分類コード等のうち１または２以上の情報を含む。特許情報は、上述した重要情報を有することは好適である。ただし、特許情報に含まれる情報の種類は問わない。

分類情報とは、特許情報に対する分類を示す情報である。分類情報は、通常、特許に対する人手による分類を示す情報である。分類情報は、例えば、「○，×」「Ａ，Ｂ，Ｃ」、技術分野のＩＤ等、何でも良い。

なお、特許分類情報は、例えば、実施の形態１における特許レコードであってもよい。前述したように、特許レコードは、重要情報と、人手による分類結果情報とを有する。分類情報は、実施の形態１における分類結果情報であってもよい。ただし、分類情報は、人手による情報とは限らず、予測分類情報のうちスコアの高い情報（例えば、後述する予測部５３２が取得するプリミティブなスコアが予め決められた閾値よりも高いまたは閾値以上の分類情報）でも良い。

ただし、学習元情報の構造は問わない。また、学習元情報は、例えば、後述する学習元情報受付部５２１によって受け付けられても良いし、後述する学習元情報取得部５３５によって取得されても良い。

学習器生成プログラムは、機械学習のアルゴリズムにより学習処理を行うプログラムである。機械学習は、例えば、深層学習、ＳＶＭ、ランダムフォレスト、決定木等が使用可能である。また、機械学習において、学習器を構成するためには、例えば、機械学習の関数（例えば、fastText、TinySVM、各種のRandomForest関数、TensorFlowのライブラリ等）に、学習元情報を与えると、学習器が得られる。

予測プログラムとは、学習器を用いて特許分類情報の分類を予測し、予測分類情報を取得するプログラムである。学習器は、後述する学習部５３１によって取得される。

プログラム格納部５１１には、例えば、２以上の学習器生成プログラムと、２以上の予測プログラムとが格納されても良い。

予測プログラムは、機械学習のアルゴリズムにより予測処理を行うプログラムである。予測プログラムは、例えば、上述した機械学習の関数を有する。予測プログラムに、学習器と、分類対象の特許分類情報とを与えて、当該予測プログラムが実行されると、予測結果である予測分類情報が得られる。

ここで、２以上の予測プログラムは、当該２以上の学習器生成プログラムにそれぞれ対応付いている。つまり、学習器生成プログラムと予測プログラムとは、通常、一対一に対応している。

精度特定情報格納部５１２には、精度特定情報が格納される。精度特定情報とは、予め決められた２種類以上の精度のうちのいずれの精度に関する精度情報を取得するかを特定する情報である。予め決められた２種類以上の精度は、例えば、再現率または適合率またはＦ値または正解率の４つの精度のうちの２以上の精度であることは好適である。

再現率、適合率、Ｆ値は、周知技術である。正解率とは、例えば、予測部５３２が取得した全ての予測分類情報のうち、学習元情報に含まれる分類情報と一致するものの割合である。

精度情報とは、精度に関する情報である。精度情報は、例えば、再現率に関する情報、適合率に関する情報、Ｆ値に関する情報、正解率に関する情報などであるが、精度に関する情報であれば何でも良い。再現率に関する情報は、例えば、再現率であるが、再現率を基に取得される情報でも良い。適合率に関する情報は、例えば、適合率であるが、適合率を基に取得される情報でも良い。Ｆ値に関する情報は、例えば、Ｆ値であるが、Ｆ値を基に取得される情報でも良い。正解率に関する情報は、例えば、正解率であるが、正解率を基に取得される情報でも良い。

なお、精度特定情報は、例えば、受付部５２によって受け付けられ、精度特定情報格納部５１２に蓄積されるが、予め精度特定情報格納部５１２に格納されていても良い。

受付部５２は、各種の情報を受け付ける。各種の情報とは、例えば、学習元情報である。

また、受付部５２は、例えば、前述した精度特定情報を受け付ける。

なお、前述したように、受け付けとは、通常、ユーザ端末４からの受信であるが、キーボード等の入力デバイスから入力された情報の受け付け、ディスクや半導体メモリ等の記録媒体から読み出された情報の受け付けなどを含む概念である、と考えても良い。

学習元情報受付部５２１は、前述した学習元情報を受け付ける。

学習元情報受付部５２１は、例えば、ユーザ端末４から学習元情報を受信する。ただし、例えば、ディスクや半導体メモリ等の記録媒体に学習元情報が格納されており、学習元情報受付部５２１は、かかる記録媒体から学習元情報を読み出してもよい。また、学習元情報受付部５２１が受け付ける学習元情報に含まれる特許情報は、特許識別子でもよい。その場合、学習元情報受付部５２１は、ユーザ端末４から受信した学習元情報に含まれる特許識別子に対応する特許情報を、例えば、サーバ装置３から受信してもよい。なお、かかる事項は、学習器生産装置６を構成する学習元情報学習受付部６２１にも当てはまる。

処理部５３は、各種の処理を行う。各種の処理とは、例えば、学習部５３１、予測部５３２、評価部５３３、アルゴリズム情報取得部５３４、学習元情報取得部５３５、および統計処理部５３６などの処理である。また、処理部５３は、例えば、フローチャートで説明する各種の判断や各種カウンタの制御なども行う。

処理部５３は、重要情報取得部１３２が行う処理を行っても良い。つまり、処理部５３は、重要情報取得部１３２を有しても良い。

処理部５３を構成する学習部５３１は、例えば、学習元情報受付部５２１が受け付けた学習元情報のうちの少なくとも一部の特許分類情報を用いて、１以上の各学習器生成プログラムを実行し、１以上の学習器を取得する。

ここで、学習器５３１が使用する「学習元情報受付部５２１が受け付けた学習元情報のうちの少なくとも一部の特許分類情報」とは、例えば、学習元情報のうちのＮ割の特許分類情報である。Ｎ割とは、例えば、９割であるが、８割や９割５分等でもよく、その数値は問わない。

学習部５３１は、例えば、学習元情報取得部５３５が取得した２以上の各学習元情報に対して、プログラム格納部５１１に格納されている１以上の各学習器生成プログラムを実行し、２以上の学習器を取得しても良い。

学習部５３１は、例えば、学習元情報受付部５２１が受け付けた学習元情報のうちの少なくとも一部の特許分類情報を用いて、２以上の各学習器生成プログラムを実行し、２以上の学習器を取得しても良い。

予測部５３２は、例えば、学習元情報受付部５２１が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、学習部５３１が生成した１以上の各学習器を用いて、予測プログラムを適用し、１以上の各特許分類情報に対する２以上の予測分類情報を取得しても良い。

ここで、予測部５３２の予測対象となる「学習元情報受付部５２１が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報」とは、通常、学習部１３４が使用していない１以上の特許分類情報である。例えば、学習器５３１が学習元情報のうちのＮ割（例えば、９割）を使用する場合、予測部５３２の予測対象となるのは、学習元情報のうちの“１０－Ｎ”割（例えば、１割）であることは好適である。ただし、学習元情報の中には、例えば、学習に使用されず、予測の対象にもならない特許分類情報が存在してもよいし、学習に使用され、かつ予測の対象にもなる特許分類情報が含まれていても構わない。

予測部５３２は、例えば、学習元情報受付部５２１が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、学習部５３１が生成した２以上の各学習器を用いて、予測プログラムを適用し、１以上の各特許分類情報に対する２以上の予測分類情報を取得しても良い。

予測部５３２は、例えば、アルゴリズムの種類（例えば、ディープラーニング１、ランダムフォレスト、ディープラーニング２など）と、使用する情報の種類（例えば、要約書と分類コード、要約書と特許請求の範囲と分類コード等）の組み合わせごとに取得された２以上の各学習器ごとに、当該学習器を用いて予測プログラムを適用し、「Ａ，Ｂ，Ｃ」や「○，×」等の２以上の分類情報に対応する２以上のプリミティブなスコアを取得し、プリミティブなスコアが最も高い分類情報を、予測分類情報として取得してもよい。なお、プリミティブなスコアとは、予測プログラムが出力するスコアである。

これにより、例えば、分類情報「Ａ」に対するプリミティブなスコア（＝Ｓ１）と、分類情報「Ｂ」に対するプリミティブなスコア（＝Ｓ２）と、分類情報「Ｃ」に対するプリミティブなスコア（＝Ｓ３）とが取得される。そして、例えば、Ｓ１＞Ｓ２＞Ｓ３である場合は、最高スコアＳ１に対応する分類情報「Ａ」が、予測分類情報として取得されてもよい。

評価部５３３は、予測部５３２が取得した２以上の各予測分類情報と、学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の精度に関する精度情報を取得し、精度情報が特定する精度が最も高い予測分類情報を決定する。精度は、例えば、再現率、適合率、Ｆ値、または正解率である。

評価部５３３は、例えば、予測部５３２が取得した２以上の予測分類情報に代えて、または予測部５３２が取得した２以上の各予測分類情報に加えて、統計処理部５３６が取得した１以上の予測分類情報を含む２以上の各予測分類情報と、学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の精度に関する精度情報を取得し、精度情報が特定する精度が最も高い予測分類情報を決定しても良い。

評価部５３３は、例えば、予測部５３２が取得した２以上の各予測分類情報と、学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の、精度特定情報により特定される精度情報を取得し、精度情報が特定する精度が最も高い予測分類情報を決定しても良い。

評価部５３３は、例えば、精度特定情報格納部５１２に格納されている精度特定情報に対応する精度情報を取得する。

評価部５３３は、例えば、学習元情報に対して、Ｋ分割交差検証を用いて、精度情報を取得する。

アルゴリズム情報取得部５３４は、アルゴリズム情報を取得する。アルゴリズム情報とは、評価部５３３が決定した予測分類情報に対応するアルゴリズムに関する情報である。評価部５３３が決定した予測分類情報とは、前述したように、精度が最も高い予測分類情報である。

アルゴリズム情報は、使用する情報の種類を特定する情報（後述する情報特定情報）、使用する学習器生成プログラムを特定する情報（後述するプログラム特定情報）、統計処理を特定する情報（後述する統計処理特定情報）のうちの１または２種類以上の情報を含む。

アルゴリズム情報は、例えば、後述する学習元情報取得部５３５が取得する２以上の学習元情報のうち、精度が最も高い予測分類情報に対応する学習元情報を特定可能な情報である。学習元情報を特定可能な情報は、例えば、学習元情報が有する情報を特定する情報特定情報であってもよい。情報特定情報は、通常、学習元情報を構成する特許情報に含まれる情報の種類（例えば、“要約書”、“特許請求の範囲”、“要約書＋特許請求の範囲”等）を特定する情報である。

すなわち、アルゴリズム情報取得部５３４は、例えば、評価部５３３が決定した予測分類情報に対応する学習元情報が有する情報を特定する情報特定情報を含むアルゴリズム情報を取得しても良い。

または、アルゴリズム情報は、例えば、プログラム格納部５１１に格納されている２以上の学習器生成プログラムのうち、精度が最も高い予測分類情報に対応する学習器生成プログラムを特定する情報であってもよい。

すなわち、アルゴリズム情報取得部５３４は、例えば、評価部５３３が決定した予測分類情報に対応する学習器生成プログラムを特定するプログラム特定情報を含むアルゴリズム情報を取得しても良い。

または、アルゴリズム情報は、例えば、後述する統計処理部５３６が行う２以上の統計処理のうち、精度が最も高い予測分類情報に対応する統計処理を特定する情報であってもよい。

すなわち、アルゴリズム情報取得部５３４は、例えば、評価部５３３が決定した予測分類情報に対応する統計処理の方法を特定する統計処理特定情報を含むアルゴリズム情報を取得しても良い。

または、アルゴリズム情報は、例えば、再現率または適合率またはＦ値または正解率のうち、ユーザが所望する精度を特定する情報であっても良い。

すなわち、アルゴリズム情報取得部５３４は、例えば、受付部５２が受け付けた精度特定情報を含むアルゴリズム情報を取得しても良い。

学習元情報取得部５３５は、学習元情報受付部５２１が受け付けた学習元情報が有する２以上の各特許分類情報が有する特許情報のうち、異なる情報を有する２以上の特許分類情報を各々有する２以上の学習元情報を取得する。

ここで、異なる情報を有する２以上の特許分類情報を有する２以上の各学習元情報は、例えば、一の学習元情報が有する２以上の各特許分類情報を構成する特許情報に含まれる情報が異なるような、２以上の学習元情報である。

学習元情報取得部５３５は、学習元情報受付部５２１が受け付けた学習元情報が有する２以上の各特許分類情報が有する特許情報の中の明細書から、１または２種類以上の重要情報を取得しても良い。かかる場合、学習元情報取得部５３５は、重要情報取得部１３２を有する。

具体的には、例えば、学習元情報受付部５２１が受け付けた学習元情報が有する２以上の各特許分類情報が有する特許情報に、要約、特許請求の範囲、および明細書が含まれており、学習元情報取得部５３５は、受け付けられた学習元情報が有する２以上の各特許分類情報が有する特許情報を用いて、例えば、各々の特許情報に要約が含まれる２以上の特許分類情報を有する１番目の学習元情報と、各々の特許情報に要約および特許請求の範囲が含まれる２以上の特許分類情報を有する２番目の学習元情報と、各々の特許情報に要約が含まれる２以上の特許分類情報を有する３番目の学習元情報と、各々の特許情報に要約および効果解決手段文が含まれる２以上の特許分類情報を有する３番目の学習元情報と、各々の特許情報に要約、特許請求の範囲、および効果解決手段文が含まれる２以上の特許分類情報を有する４番目の学習元情報とを取得してもよい。

また、上述した２以上の各学習元情報は、例えば、「要約書と特許請求の範囲とからなる特許情報と分類情報とを有する２以上の特許分類情報を有する学習元情報」「要約書からなる特許情報と分類情報とを有する２以上の特許分類情報を有する学習元情報」「特許請求の範囲からなる特許情報と分類情報とを有する２以上の特許分類情報を有する学習元情報」「要約書と重要情報とからなる特許情報と分類情報とを有する２以上の特許分類情報を有する学習元情報」「特許請求の範囲と重要情報とからなる特許情報と分類情報とを有する２以上の特許分類情報を有する学習元情報」である。

または、異なる情報を有する２以上の特許分類情報を各々有する２以上の学習元情報は、例えば、学習元情報のうちの少なくとも一部（以下、学習部分）の特許分類情報を学習部５３１の学習処理に使用し、学習元情報のうちの少なくとも一部（以下、予測部分）の各特許分類情報を予測部５３２による予測の対象とする場合において、学習部分に属する１以上の特許分類情報と、予測部分に属する１以上の特許分類情報との組み合わせを異ならせた、２以上の特許分類情報であってもよい。

具体的には、例えば、学習元情報受付部５２１が１００件分の特許分類情報を有する学習元情報を受け付けた場合、学習元情報取得部５３５は、当該１００件を第一～第十の１０グループに等分（一般には、Ｋ個のグループに分割）し、当該１０グループ中の９グループ（（Ｋ－１）個のグループ）を学習部分に、残る１グループを予測部分に配属する処理を、グループの組み合わせを変えながら１０回、行ってもよい（Ｋ分割交差検証）。

これによって、例えば、第一～第九の９グループに属する９０件が学習部分であり、第十グループに属する１０件が予測部分である第一の学習元情報と、第一～第八，第十の９グループに属する９０件が学習部分であり、第九グループに属する１０件が予測部分である第二の学習元情報と、第一～第七，第九，第十の９グループに属する９０件が学習部分であり、第八グループに属する１０件が予測部分である第三の学習元情報と、・・・第二～第十の９グループに属する９０件が学習部分であり、第一グループに属する１０件が予測部分である第十の学習元情報との、１０個の学習元情報が取得される。

統計処理部５３６は、予測部５３２が取得した２以上の予測分類情報を用いて、１または２種類以上の統計処理を行い、統計処理結果である１または２以上の予測分類情報を取得する。統計処理とは、統計に関する処理である。統計処理は、例えば、予測分類情報の論理和（ＯＲ）または論理積（ＡＮＤ）または多数決をとる処理であるが、統計に関する処理であれば何でも良い。

統計処理部５３６は、例えば、２種類以上の統計処理を行い、統計処理結果である２以上の予測分類情報を取得しても良い。２種類以上の統計処理とは、例えば、上記予測分類情報の論理和または論理積または多数決のいずれかのうちの２種類以上の統計処理である。

ここで、論理和または論理積または多数決をとる場合のスコアは、例えば、プリミティブなアルゴリズムの２以上の動作結果（つまり、予測部５３２が、最終結果である予測分類情報を取得する前に、２以上の分類情報ごとに取得したプリミティブなスコア）を用いて取得される。

統計処理部５３６は、プリミティブなアルゴリズムの複数の各動作結果と最終結果とを比較し、合致する数または割合が大きいほど、高いスコアを取得することは好適である。

プリミティブなアルゴリズムの複数の各動作結果に含まれるスコアが全て同じである場合、統計処理部５３６は、プリミティブなアルゴリズムの複数の各動作結果と最終結果とを比較し、合致する数または割合が大きいほど、高いスコアを取得することは好適である。

例えば、統計処理部５３６は、論理和または論理積または多数決をとる場合のスコアを、例えば、以下のようにして算出する。
（１）プリミティブなアルゴリズムの複数の動作結果がすべて、最終結果（つまり、予測部５３２が取得した予測分類情報）と一致した場合、統計処理部５３６は、プリミティブなアルゴリズムの２以上の動作結果のうちの最高のスコアを付ける。
（２）プリミティブなアルゴリズムの複数の動作結果のうち、５０％以上が、最終結果と異なる場合・・・最低のスコア（二値分類の場合は０．５）を付ける。
（３）上記（１），（２）以外（つまり、１００％未満であり、５０％より多い割合が、最終結果と同じ場合）、統計処理部５３６は、プリミティブなアルゴリズムの複数のスコアのうち、最低のスコアを付ける。

出力部５４は、各種の情報を出力する。各種の情報とは、例えば、アルゴリズム情報である。なお、前述したように、出力とは、例えば、ユーザ端末４への送信であるが、ディスプレイへの表示、プリンタでの印字、スピーカーからの音出力、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念と考えても良い。

出力部５４は、アルゴリズム情報取得部５３４が取得したアルゴリズム情報を、例えば、学習元情報に対応付けて蓄積する。

出力部５４は、アルゴリズム情報取得部５３４が取得したアルゴリズム情報を、例えば、学習器生産装置６に送信する又は引き渡す。ただし、アルゴリズム情報は、例えば、ユーザ端末４に送信されたり、ディスプレイに表示されたり、記録媒体に蓄積されたりしても良く、その出力態様や出力先は問わない。

学習器生産装置６を構成する学習格納部６１は、各種の情報を格納し得る。各種の情報とは、例えば、学習器、学習元情報、アルゴリズム情報などである。また、学習格納部６１には、例えば、前述した効果解決手段文、前述した非効果解決手段文、前述した解決手段用語、前述した非解決手段用語、前述した効果用語、前述した解決手段文、前述した非解決手段文、前述した効果文、前述した非効果文、前述した目的文、前述した非目的文、前述した目的用語、前述した非目的用語なども格納されてもよい。なお、その他の情報について、適時説明する場合がある。

学習受付部６２は、各種の情報を受け付ける。各種の情報とは、例えば、前述した学習元情報である。なお、前述したように、受け付けとは、通常、ユーザ端末４からの受信であるが、キーボード等の入力デバイスから入力された情報の受け付け、ディスクや半導体メモリ等の記録媒体から読み出された情報の受け付けなどを含む概念である、と考えても良い。

学習元情報受付部６２１は、学習元情報を受け付ける。学習元情報受付部６２１は、通常、ユーザ端末４から学習元情報を受信する。ただし、学習元情報は、キーボード等の入力デバイスを介して受け付けられてもよいし、ディスク等の記録媒体から読み出されてもよく、その受け付けの態様は問わない。

学習処理部１３、特許明細書取得部１３１、重要情報取得部１３２、学習元情報取得部１３３、および学習部１３４を備える。重要情報取得部１３２は、効果解決手段文取得手段１３２１、効果文取得手段１３２２、解決手段文取得手段１３２３、目的文取得手段１３２４、特徴語取得手段１３２５、関連語取得手段１３２６、重要タグ対応文取得手段１３２７、数値範囲文字列取得手段１３２８、および数字取得手段１３２９は、基本的に、実施の形態１におけるものと同様の処理を行う。

ただし、学習部１３４は、アルゴリズム決定装置５が出力するアルゴリズム情報に従ったアルゴリズムで、学習元情報受付部６２１が受け付けた学習元情報または学習元情報取得部１３３が取得した学習元情報に対して、学習処理を行い、学習器を取得する。

学習部１３４は、例えば、アルゴリズム情報が有する情報特定情報で特定される情報を、学習元情報受付部６２１が受け付けた学習元情報から取得し、当該情報と学習元情報が有する分類情報とを有する２以上の特許分類情報を有する学習元情報を取得する。また、学習部１３４は、例えば、アルゴリズム情報が有するプログラム特定情報により特定されるプログラムに、取得した学習元情報を与え、学習処理を行い、学習器を構成する。なお、情報特定情報が重要情報を特定する情報を含む場合、学習部１３４は、重要情報取得部１３２が行う重要情報取得を行う。

学習部１３４は、例えば、アルゴリズム情報が有する情報特定情報で特定される情報を、学習元情報受付部６２１が受け付けた学習元情報から取得し、当該情報と学習元情報が有する分類情報とを有する２以上の特許分類情報を有する２以上の学習元情報を取得しても良い。また、学習部１３４は、例えば、アルゴリズム情報が有するプログラム特定情報により特定される１または２以上の各プログラムに、取得した２以上の各学習元情報を与え、学習処理を行い、２以上の学習器を構成しても良い。なお、情報特定情報が重要情報を特定する情報を含む場合、学習部１３４は、重要情報取得部１３２が行う重要情報取得を行う。

例えば、アルゴリズム決定装置５が出力するアルゴリズム情報が、（ａ）２以上の学習元情報のうち、精度が最も高い予測分類情報に対応する学習元情報を特定可能な情報である場合、学習部１３４は、当該アルゴリズム情報が特定する学習元情報を用いて、学習器を取得する。

または、アルゴリズム情報が、（ｂ）プログラム格納部５１１に格納されている２以上の学習器生成プログラムのうち、精度が最も高い予測分類情報に対応する学習器生成プログラムを特定する情報である場合、学習部１３４は、当該アルゴリズム情報が特定する学習器生成プログラムを用いて、学習器を取得する。

または、アルゴリズム情報が、（ｃ）２以上の統計処理のうち、精度が最も高い予測分類情報に対応する統計処理を特定する情報である場合、学習部１３４は、当該統計処理を特定する情報に対応する２以上の学習元情報、当該統計処理を特定する情報に対応する２以上の学習器生成プログラム、当該統計処理を特定する情報に対応する２以上の学習元情報と１以上の学習器生成プログラム、または当該統計処理を特定する情報に対応する１以上の学習元情報と２以上の学習器生成プログラムを用いて、２以上の学習器を取得する。

また、例えば、アルゴリズム情報が、再現率または適合率またはＦ値または正解率のうち、ユーザが所望する精度の種類を特定する情報（つまり、受付部５２が受け付けた精度特定情報）に対応付いている場合、学習部１３４は、当該アルゴリズム情報が特定する精度を上げるための学習器を取得する。なお、学習部１３４がアルゴリズム情報に従った学習器を生成すれば、上記の効果を奏することができる。

蓄積部６４１は、学習部１３４が取得した学習器を蓄積する。蓄積部６４１は、学習部１３４が取得した学習器を、通常、アルゴリズム決定装置５が出力するアルゴリズム情報に対応付けて蓄積する。学習器の蓄積先は、通常、特許分類装置２を構成する学習器格納部２１１である。ただし、学習器は、例えば、学習格納部６１に蓄積されてもよく、その蓄積先は問わない。

特許分類装置８を構成する学習器格納部２１１には、学習器生産装置６が取得した１または２以上の学習器が格納される。学習器には、通常、アルゴリズム情報が対応づいている。

受付部８１は、分類対象の特許を識別する特許識別子を含む分類対象情報を受け付ける。

予測部８２１は、受付部８１が受け付けた分類対象情報に対して、学習器格納部２１１の学習器に対応付いているアルゴリズム情報に従ったアルゴリズムにより、当該学習器を用いて予測処理を行い、分類結果情報を取得する。

予測部８２１は、例えば、受付部８１が受け付けた分類対象情報に対応する情報であり、アルゴリズム情報が有する情報特定情報が特定する情報であり、予測処理に使用する情報を取得する。次に、予測部８２１は、例えば、アルゴリズム情報が有する１以上の各プログラム特定情報により特定される１以上の各予測プログラムに、予測処理に使用する情報を与え、当該１以上の各予測プログラムを実行し、予測プログラムごとの分類結果情報を取得する。

また、アルゴリズム情報が統計処理特定情を含む場合、予測部８２１は、２以上の各予測プログラムごとの分類結果情報を統計処理し、最終的な分類結果情報を取得する。

予測部７２は、分類対象加工情報取得部２３３が取得した分類対象加工情報に学習器に適用し、機械学習のアルゴリズムにより当該分類対象加工情報の分類を予測し、分類結果情報を取得しても良い。

出力部７３は、予測部７２が取得した分類結果情報を、受付部７１が受け付けた分類対象情報に含まれる特許識別子に対応付けて出力する。

格納部５１、プログラム格納部５１１、精度特定情報格納部５１２、および学習格納部６１等は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

格納部５１等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部５１等で記憶されるようになっても良く、通信回線等を介して送信された情報が格納部５１等で記憶されるようになっても良く、あるいは、入力デバイスを介して入力された情報が格納部５１等で記憶されるようになっても良い。

受付部５２、学習元情報受付部５２１、出力部５４、学習受付部６２、学習元情報受付部６２１、学習出力部６４、蓄積部６４１、および受付部８１は、通常、無線または有線の通信手段等で実現され得る。

処理部５３、学習部５３１、予測部５３２、評価部５３３、アルゴリズム情報取得部５３４、学習元情報取得部５３５、統計処理部５３６、処理部８２、予測部８２１等は、通常、プロセッサやメモリ等から実現され得る。処理部５３等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。なお、プロセッサは、例えば、ＣＰＵ、ＭＰＵ、ＧＰＵ等であり、問わない。

次に、特許分類システムＢの動作例について説明する。まず、アルゴリズム決定装置５の動作例を図１３のフローチャートを用いて説明する。

（ステップＳ１３０１）処理部５３は、アルゴリズム情報のすべての候補を取得する。

なお、例えば、格納部５１に、１または２以上の情報特定情報（例えば、「要約書」「要約書，特許分類コード」「要約書，効果解決手段文」の３つ）、１または２以上のプログラム特定情報（例えば、「深層学習」「ランダムフォレスト」の２つ）、および１または２以上の統計処理特定情報（例えば、「ＡＮＤ」「ＯＲ」）が格納されている場合、処理部５３は、３つの情報特定情報のうちのいずれかの情報特定情報と、２つのプログラム特定情報のいずれかのプログラム特定情報の組み合わせである６つのアルゴリズム情報の候補を取得する。また、処理部５３は、３つの情報特定情報のうちのいずれかの情報特定情報と、２つの各プログラム特定情報で特定されるプログラムの予測結果の２種類の統計処理特定情報の組み合わせである６つのアルゴリズム情報の候補を取得する。つまり、ここの例では、処理部５３は、１２のアルゴリズム情報の候補を取得する。

（ステップＳ１３０２）処理部５３は、カウンタｉに１を代入する。

（ステップＳ１３０３）処理部５３は、ステップＳ１３０１で取得したアルゴリズム情報の候補の中で、ｉ番目のアルゴリズム情報の候補が存在するか否かを判断する。ｉ番目のアルゴリズム情報の候補が存在する場合はステップＳ１３０４に行き、ｉ番目のアルゴリズム情報の候補が存在しない場合はステップＳ１３０６に行く。

（ステップＳ１３０４）評価部５３３は、ｉ番目のアルゴリズム情報の候補に対応する情報およびアルゴリズムを用いた場合における、格納部５１に格納されている精度特定情報により特定される精度（例えば、再現率、Ｆ値など）の評価を行い、精度情報を取得し、当該精度情報をｉ番目のアルゴリズム情報の候補に対応付けて一時蓄積する。なお、かかる評価処理について、図１４のフローチャートを用いて説明する。

（ステップＳ１３０５）処理部５３は、カウンタｉを１、インクリメントする。ステップＳ１３０３に戻る。

（ステップＳ１３０６）アルゴリズム情報取得部５３４は、最良の値の精度情報を取得する。

（ステップＳ１３０７）アルゴリズム情報取得部５３４は、ステップＳ１３０６で取得した最良の値の精度情報と対になるアルゴリズム情報の候補を、アルゴリズム情報として取得する。

（ステップＳ１３０８）アルゴリズム情報取得部５３４は、アルゴリズム情報を蓄積する。

なお、図１３のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。

次に、ステップＳ１３０４における評価処理について、図１４のフローチャートを用いて説明する。

（ステップＳ１４０１）学習元情報取得部５３５は、アルゴリズム情報の候補に対応する情報特定情報を取得する。

（ステップＳ１４０２）学習元情報取得部５３５は、カウンタｉに１を代入する。

（ステップＳ１４０３）学習元情報取得部５３５は、処理対象の学習元情報の中に、ｉ番目の特許情報が存在するか否かを判断する。ｉ番目の特許情報が存在する場合はステップＳ１４０４に行き、ｉ番目の特許情報が存在しない場合はステップＳ１４０６に行く。なお、ステップＳ１４０６に行く場合、評価対象の学習元情報が完成している。また、処理対象の学習元情報は、例えば、格納部５１に格納されている。

（ステップＳ１４０４）学習元情報取得部５３５は、ｉ番目の特許情報に対応する情報であり、ステップＳ１４０１で取得した情報特定情報により特定される情報を取得する。評価部５３３は、処理対象の学習元情報が有する分類情報と取得した情報とからなる特許分類情報を取得し、図示しないバッファに一時蓄積する。

（ステップＳ１４０５）学習元情報取得部５３５は、カウンタｉを１、インクリメントする。ステップＳ１４０３に戻る。

（ステップＳ１４０６）評価部５３３は、アルゴリズム情報の候補に対応する統計処理特定情報が存在するか否かを判断する。統計処理特定情報が存在する場合はステップＳ１４０９に行き、統計処理特定情報が存在しない場合はステップＳ１４０７に行く。

（ステップＳ１４０７）評価部５３３は、アルゴリズム情報の候補に対応するプログラム特定情報を取得する。

（ステップＳ１４０８）評価部５３３は、ステップＳ１４０７で取得したプログラム特定情報により特定される学習プログラムと予測プログラムとを用いて、Ｋ分割交差検証を行う。Ｋ分割交差検証の処理例について、図１５のフローチャートを用いて説明する。

（ステップＳ１４０９）評価部５３３は、アルゴリズム情報の候補に対応する統計処理特定情報が存在する場合の評価を行う。かかる統計処理評価の処理の例について、図１５のフローチャートを用いて説明する。

（ステップＳ１４１０）評価部５３３は、アルゴリズム情報の候補に対応付けて、取得された精度情報を一時蓄積する。上位処理にリターンする。

次に、ステップＳ１４０８のＫ分割交差検証の処理例について、図１５のフローチャートを用いて説明する。

（ステップＳ１５０１）評価部５３３は、学習元情報をｋ（ｋは２以上の自然数）に分割する。

（ステップＳ１５０２）評価部５３３は、カウンタｉに１を代入する。

（ステップＳ１５０３）評価部５３３は、ｋに分割した学習元情報の中で、ｉ番目の分割パターンが存在するか否かを判断する。ｉ番目の分割パターンが存在する場合はステップＳ１５０４に行き、ｉ番目の分割パターンが存在しない場合はステップＳ１５１３に行く。なお、ｋに分割した場合、通常、ｋの分割パターンが存在する。かかることは、Ｋ分割交差検定における公知技術である。

（ステップＳ１５０４）学習部５３１は、学習元情報の中の一部の情報であり、学習対象の情報（ｋの分割パターンにおける学習処理に使用する特許分類情報）を取得する。

（ステップＳ１５０５）学習部５３１は、プログラム特定情報により特定される学習プログラムに、ステップＳ１５０４で取得した学習対象の情報を与え、当該学習プログラムを実行し、学習器を取得する。

（ステップＳ１５０６）予測部５３２は、カウンタｊに１を代入する。

（ステップＳ１５０７）予測部５３２は、学習元情報の中の一部の情報であり、予測対象のｊ番目の情報が存在するか否かを判断する。予測対象のｊ番目の情報が存在する場合はステップＳ１５０８に行き、予測対象のｊ番目の情報が存在しない場合はステップＳ１５１０に行く。

（ステップＳ１５０８）予測部５３２は、プログラム特定情報により特定される予測プログラムに、予測対象のｊ番目の情報を与え、当該予測プログラムを実行し、予測結果を取得する。

（ステップＳ１５０９）予測部５３２は、カウンタｊを１、インクリメントする。ステップＳ１５０７に戻る。

（ステップＳ１５１０）評価部５３３は、アルゴリズム情報の候補に対応付く精度特定情報を取得する。

（ステップＳ１５１１）評価部５３３は、ステップＳ１５０８で取得された予測結果の集合と、学習元情報の中の予測対象の特許分類情報が有する分類情報の集合とを比較し、ステップＳ１５１０で取得した精度特定情報で特定される精度（例えば、再現率、Ｆ値）の精度情報を取得する。なお、かかる精度情報は、一次精度情報とする。

（ステップＳ１５１２）評価部５３３は、カウンタｉを１、インクリメントする。ステップＳ１５０３に戻る。

（ステップＳ１５１３）評価部５３３は、ステップＳ１５１１で取得したｋ個の一次精度情報の代表値（例えば、平均値、中央値）である精度情報を取得し、当該精度情報を、当該アルゴリズム情報の候補に対応付けて蓄積する。上位処理にリターンする。

次に、ステップＳ１４０９の統計処理評価の処理の例について、図１６のフローチャートを用いて説明する。なお、図１６のフローチャートにおいて、図１５のフローチャートと同一のステップについて説明を省略する。

（ステップＳ１６０１）評価部５３３は、カウンタｊに１を代入する。

（ステップＳ１６０２）評価部５３３は、ｊ番目のプログラム特定情報が存在するか否かを判断する。ｊ番目のプログラム特定情報が存在する場合はステップＳ１６０３に行き、ｊ番目のプログラム特定情報が存在しない場合はステップＳ１６０９に行く。

（ステップＳ１６０３）学習部５３１は、ｊ番目のプログラム特定情報により特定される学習プログラムに、ステップＳ１５０４で取得された学習対象の情報を与え、当該学習プログラムを実行し、学習器を取得する。

（ステップＳ１６０４）予測部５３２は、カウンタｌに１を代入する。

（ステップＳ１６０５）予測部５３２は、学習元情報の中の一部の情報であり、予測対象のｌ番目の情報が存在するか否かを判断する。予測対象のｌ番目の情報が存在する場合はステップＳ１６０６に行き、予測対象のｌ番目の情報が存在しない場合はステップＳ１６０８に行く。

（ステップＳ１６０６）予測部５３２は、プログラム特定情報により特定される予測プログラムに、予測対象のｌ番目の情報を与え、当該予測プログラムを実行し、予測結果を取得する。

（ステップＳ１６０７）予測部５３２は、カウンタｌを１、インクリメントする。ステップＳ１６０５に戻る。

（ステップＳ１６０８）評価部５３３は、カウンタｊを１、インクリメントする。ステップＳ１６０２に戻る。

（ステップＳ１６０９）統計処理部５３６は、カウンタｌに１を代入する。

（ステップＳ１６１０）統計処理部５３６は、ｌ番目の予測対象の情報が存在するか否かを判断する。ｌ番目の予測対象の情報が存在する場合はステップＳ１６１１に行き、ｌ番目の予測対象の情報が存在しない場合はステップＳ１６１３に行く。

（ステップＳ１６１１）統計処理部５３６は、ｌ番目の予測対象の情報に対する２以上の予測結果に対して、アルゴリズム情報の候補が有する統計処理特定情報により特定される統計処理（例えば、「ＡＮＤ」「ＯＲ」「多数決」）を行い、統計処理結果を取得する。

（ステップＳ１６１２）統計処理部５３６は、カウンタｌを１、インクリメントする。ステップＳ１６１０に戻る。

（ステップＳ１６１３）評価部５３３は、アルゴリズム情報の候補に対応付く精度特定情報を取得する。

（ステップＳ１６１４）評価部５３３は、ステップＳ１６１１で取得された統計処理結果の集合と、学習元情報の中の予測対象の特許分類情報が有する分類情報の集合とを比較し、ステップＳ１６１３で取得した精度特定情報で特定される精度（例えば、再現率、Ｆ値）の精度情報を取得する。なお、かかる精度情報は、一次精度情報とする。

（ステップＳ１６１５）評価部５３３は、カウンタｉを１、インクリメントする。ステップＳ１５０３に戻る。

（ステップＳ１６１６）評価部５３３は、ステップＳ１６１４で取得したｋ個の一次精度情報の代表値（例えば、平均値、中央値）である精度情報を取得し、当該精度情報を、当該アルゴリズム情報の候補に対応付けて蓄積する。上位処理にリターンする。

次に、学習器生産装置６の動作例について、図１７のフローチャートを用いて説明する。

（ステップＳ１７０１）学習受付部６２は、学習元情報を取得する。

（ステップＳ１７０２）学習処理部１３は、ステップＳ１７０１で取得した学習元情報に対応するアルゴリズム情報を取得する。

（ステップＳ１７０３）学習処理部１３は、アルゴリズム情報が有する情報特定情報を取得する。

（ステップＳ１７０４）学習処理部１３は、ステップＳ１７０３で取得した情報特定情報により特定される情報であり、学習元情報が有する各特許分類情報に対応する情報を取得し、当該情報と各特許分類情報が有する分類情報からなる情報を取得する。そして、学習処理部１３は、取得した情報を有する学習元情報であり、学習処理に使用する学習元情報を取得する。

（ステップＳ１７０５）学習処理部１３は、カウンタｉに１を代入する。

（ステップＳ１７０６）学習処理部１３は、ステップＳ１７０２で取得したアルゴリズム情報が有するｉ番目のログラム特定情報が存在するか否かを判断する。ｉ番目のログラム特定情報が存在する場合はステップＳ１７０７に行き、ｉ番目のログラム特定情報が存在しない場合は処理を終了する。

（ステップＳ１７０７）学習処理部１３は、ステップＳ１７０７で取得したプログラム特定情報により特定される学習プログラムを学習格納部６１から取得する。

（ステップＳ１７０８）学習処理部１３は、ステップＳ１７０７で取得した学習プログラムに、ステップＳ１７０４で取得した学習元情報を与え、当該学習プログラムを実行し、学習器を取得する。そして、学習処理部１３は、当該学習器をステップＳ１７０２で取得したアルゴリズム情報と対に蓄積する。

（ステップＳ１７０９）学習処理部１３は、カウンタｉを１、インクリメントする。ステップＳ１７０６に戻る。

次に、特許分類装置８の動作例について、図１８のフローチャートを用いて説明する。

（ステップＳ１８０１）受付部８１は、分類対象情報を受け付けたか否かを判断する。分類対象情報を受け付けた場合はステップＳ１８０２に行き、分類対象情報を受け付けなかった場合はステップＳ１８０１に戻る。

（ステップＳ１８０２）処理部８２は、格納部２１に格納されているアルゴリズム情報を取得する。

（ステップＳ１８０３）処理部８２は、ステップＳ１８０２で取得したアルゴリズム情報が有する情報特定情報を取得する。

（ステップＳ１８０４）処理部８２は、ステップＳ１８０３で取得した情報特定情報により特定される情報であり、分類対象情報に対応する情報を取得する。

（ステップＳ１８０５）処理部８２は、ステップＳ１８０２で取得したアルゴリズム情報が有するプログラム特定情報を取得する

（ステップＳ１８０６）処理部８２は、カウンタｉに１を代入する。

（ステップＳ１８０７）処理部８２は、ステップＳ１８０２で取得したアルゴリズム情報の中にｉ番目のプログラム特定情報が存在するか否かを判断する。ｉ番目のプログラム特定情報が存在する場合はステップＳ１８０８に行き、ｉ番目のプログラム特定情報が存在しない場合はステップＳ１８１１に行く。

（ステップＳ１８０８）予測部８２１は、ステップＳ１８０５で取得したプログラム特定情報により特定される予測プログラムを格納部２１から取得する。

（ステップＳ１８０９）予測部８２１は、ステップＳ１８０８で取得した予測プログラムに、ステップＳ１８０２で取得したアルゴリズム情報と対になる学習器と、ステップＳ１８０４で取得した情報とを与え、当該予測プログラムを実行し、予測結果を取得し、当該予測結果を分類対象情報に対応付けて蓄積する。なお、予測部８２１は、スコアをも取得することは好適である。

（ステップＳ１８１０）処理部８２は、カウンタｉを１、インクリメントする。ステップＳ１８０７に戻る。

（ステップＳ１８１１）予測部８２１は、ステップＳ１８０２で取得したアルゴリズム情報の中に統計処理特定情報が存在するか否かを判断する。統計処理特定情報が存在する場合はステップＳ１８１２に行き、統計処理特定情報が存在しない場合はステップＳ１８１４に行く。

（ステップＳ１８１２）統計処理部５３６は、ステップＳ１８０９における２以上の予測処理の予測結果に対して、統計処理特定情報により特定される統計処理を行い、統計処理結果を取得する。なお、統計処理結果は、最終的な予測結果である。

（ステップＳ１８１３）統計処理部５３６は、予測部８２１が取得したスコアを用いて、統計処理結果に対応するスコアを取得する。

（ステップＳ１８１４）出力部は、ステップＳ１８１２で取得された最終的な予測結果と、ステップＳ１８１３で取得されたスコアとを出力する。

以下、特許分類システムＢの具体的な動作例について説明する。なお、以下の説明は、各種の変更が可能であり、本発明の範囲を何ら制限するものではない。

本例において、情報特定情報は、“要約書，ＩＰＣ”、または“要約書，効果解決手段文，ＩＰＣ”の２通りである。また、プログラム特定情報は、“深層学習．ｅｘｅ”、“ランダムフォレスト．ｅｘｅ”２通りである。さらに、統計情報特定情報は、“ＡＮＤ”、または“ＯＲ”の２通りである。

アルゴリズム決定装置５の格納部５１には、例えば、後述する図１９に示すような、８個のアルゴリズム情報候補１～８が格納されている。アルゴリズム情報候補とは、アルゴリズム情報の候補である。アルゴリズム情報候補１～４は、上記２通りの情報特定情報のうちのいずれかの情報特定情報と、上記２通りのプログラム特定情報のいずれかのプログラム特定情報との組み合わせである４つのアルゴリズム情報の候補である。アルゴリズム情報候補５～８は、上記２通りの情報特定情報のうちのいずれかの情報特定情報と、上記２通りの各プログラム特定情報で特定されるプログラムの予測結果の２種類の統計処理特定情報の組み合わせである４つのアルゴリズム情報の候補である。なお、かかる８つのアルゴリズム情報候補１～８は、本例では、予め格納部５１に格納されているが、例えば、後述する設定画面を通じて入力されるユーザの指示に応じて処理部５３が取得し、格納部５１に蓄積してもよい。

また、格納部５１には、例えば、後述する図２０に示すような、上記８個のアルゴリズム情報候補１～８に対応する８個の精度情報１～８が格納され得る。なお、かかる８個の精度情報１～８は、アルゴリズム情報取得部５３４によって取得され、上記８個のアルゴリズム情報候補１～８に対応付けて格納部５１に蓄積される。

図１９は、アルゴリズム情報候補のデータ構造図である。アルゴリズム情報候補は、情報特定情報、プログラム特定情報、および統計情報特定情報を有する。ＩＤ“１”に対応付いたアルゴリズム情報候補１は、情報特定情報“要約書，ＩＰＣ”、プログラム特定情報“深層学習．ｅｘｅ”、および統計情報特定情報“－”を有する。なお、“－”は、どの統計処理も行わない旨の情報である。

また、ＩＤ“２”に対応付いたアルゴリズム情報候補２は、情報特定情報“要約書，効果解決手段文，ＩＰＣ”、プログラム特定情報“深層学習．ｅｘｅ”、および統計情報特定情報“－”を有する。同様に、アルゴリズム情報候補３は、情報特定情報“要約書，ＩＰＣ”、プログラム特定情報“ランダムフォレスト．ｅｘｅ”、および統計情報特定情報“－”を有する。アルゴリズム情報候補４は、情報特定情報“要約書，効果解決手段文，ＩＰＣ”、プログラム特定情報“ランダムフォレスト．ｅｘｅ”、および統計情報特定情報“－”を有する。

アルゴリズム情報候補５は、情報特定情報“要約書，ＩＰＣ”、プログラム特定情報“深層学習．ｅｘｅ，ランダムフォレスト．ｅｘｅ”、および統計情報特定情報“ＯＲ”を有する。アルゴリズム情報候補６は、情報特定情報“要約書，効果解決手段文，ＩＰＣ”、プログラム特定情報“深層学習．ｅｘｅ，ランダムフォレスト．ｅｘｅ”、および統計情報特定情報“ＯＲ”を有する。アルゴリズム情報候補７は、情報特定情報“要約書，ＩＰＣ”、プログラム特定情報“深層学習．ｅｘｅ，ランダムフォレスト．ｅｘｅ”、および統計情報特定情報“ＡＮＤ”を有する。アルゴリズム情報候補８は、情報特定情報“要約書，効果解決手段文，ＩＰＣ”、プログラム特定情報“深層学習．ｅｘｅ，ランダムフォレスト．ｅｘｅ”、および統計情報特定情報“ＡＮＤ”を有する。

図２０は、精度情報のデータ構造図である。精度情報は、再現率、適合率、Ｆ値、および正解率を有する。ＩＤ“１”に対応付いた精度情報１は、再現率“ａ_１”、適合率“ｂ_１”、Ｆ値“（ａ_１＋ｂ_１）／２”、および正解率“ｃ_１”を有する。また、ＩＤ“２”に対応付いた精度情報２は、再現率“ａ_２”、適合率“ｂ_２”、Ｆ値“（ａ_２＋ｂ_２）／２”、および正解率“ｃ_２”を有する。

同様に、精度情報３は、再現率“ａ_３”、適合率“ｂ３”、Ｆ値“（ａ_３＋ｂ_３）／２”、および正解率“ｃ_３”を有する。精度情報４は、再現率“ａ_４”、適合率“ｂ_４”、Ｆ値“（ａ_４＋ｂ_４）／２”、および正解率“ｃ_４”を有する。精度情報５は、再現率“ａ_５”、適合率“ｂ_５”、Ｆ値“（ａ_５＋ｂ_５）／２”、および正解率“ｃ_５”を有する。精度情報６は、再現率“ａ_６”、適合率“ｂ_６”、Ｆ値“（ａ_６＋ｂ_６）／２”、および正解率“ｃ_６”を有する。精度情報７は、再現率“ａ_７”、適合率“ｂ_７”、Ｆ値“（ａ_７＋ｂ_７／２”、および正解率“ｃ_７”を有する。精度情報８は、再現率“ａ_８”、適合率“ｂ_８”、Ｆ値“（ａ_８＋ｂ_８）／２”、および正解率“ｃ_８”を有する。

ユーザは、特許識別子と分類情報とで構成された１００個の特許分類情報を有する学習元情報をユーザ端末４に入力する。ユーザ端末４は、学習元情報の入力を受け付け、受け付けた学習元情報をアルゴリズム決定装置５に送信する。

プログラム格納部５１１には、上記２通りのプログラム特定情報に対応する２つの学習器生成プログラムと、当該２つの学習器生成プログラムに対応する２つの予測プログラムとが格納されている。

精度特定情報格納部５１２には、４つの精度特定情報「再現率」「適合率」「F値」「正解率」のうちいずれか一つ（ここでは、「正解率」）が格納されている。なお、格納されている精度特定情報は、例えば、後述する設定画面を通じて入力されるユーザの指示に応じて処理部５３が取得し、格納部５１に蓄積したものであるが、デフォルトの情報または自動的に取得された情報でもよい。

アルゴリズム決定装置５において、学習元情報受付部５２１が上記学習元情報を受信し、処理部５３は、当該受信された学習元情報と、格納部５１に格納されている８個のアルゴリズム情報候補１～８とを用いて、以下のような処理を行う。

詳しくは、処理部５３を構成する学習元情報取得部５３５が、上記受信された学習元情報が有する２以上（ここでは、１００個）の各特許分類情報ごとに、当該特許分類情報が有する特許情報のうち、アルゴリズム情報候補を構成する上記２種類の情報特定情報で特定される情報を有する２以上の特許分類情報を各々有する２以上の特許分類情報を取得する。これにより、受け付けられた一の特許分類情報に対して、異なる情報を有する２以上の特許分類情報（ここでは、「要約書，ＩＰＣ」を有する特許分類情報、および「要約書，効果解決手段文，ＩＰＣ」を有する特許分類情報の２つ）が取得される。

次に、当該取得された２以上の各学習元情報ごとに、学習部５３１が、当該学習元情報のうち少なくとも一部（例えば、９０個）の特許分類情報を用いて、プログラム格納部５１１に格納されている２つの学習器生成プログラムのうち、当該アルゴリズム情報候補が有するプログラム特定情報で特定される学習器生成プログラムを実行し、２つの学習器を取得する。予測部５３２は、当該学習元情報のうち少なくとも一部（例えば、学習器の生成に使用されていない１０個）の特許分類情報に対して、当該取得された２つの各学習器を用いて、当該学習器の取得に用いた学習器生成プログラムに対応する予測プログラムを適用し、２以上（ここでは、上記１０個）の各特許分類情報に対する２以上（ここでは、４個）の予測分類情報を取得する。

統計処理部５３５は、当該取得された２以上の予測分類情報を用いて、上記２通りの統計処理（ＡＮＤ，ＯＲ）のうち、統計情報特定情報で特定される統計処理を行い、統計処理結果である２以上（ここでは、４個）の予測分類情報を取得する。

評価部５３３は、こうして取得された４以上（ここでは、上記２通りのいずれかの情報特定情報と上記２通りのいずれかのプログラム特定情報との組み合わせに対応する４個、および上記２通りのいずれかの情報特定情報と、上記２通りの各プログラム特定情報で特定されるプログラムの予測結果の２種類のいずれかの統計処理特定情報との組み合わせに対応する４個の、合計８個）の予測分類情報と、学習元情報が有する分類情報とを用いて、各予測分類情報の精度情報を取得し、アルゴリズム情報候補に対応付けて格納部５１に蓄積する。

なお、上記８個の予測分類情報のうち、前者４個の各予測分類情報については、例えば、図１５のフローチャートで説明したＫ分割交差検証により、当該予測分類情報に対応する精度情報が取得され、後者４個の各予測分類情報については、例えば、図１６のフローチャートで説明した統計処理評価により、当該予測分類情報に対応する精度情報が取得されてもよい。

これにより、図１９に示した８個のアルゴリズム情報候補１～８に対応付けて、図２０に示した８個の精度情報１～８が格納部５１に格納される。

アルゴリズム情報取得部５３４は、精度特定情報格納部５１２に格納されている精度特定情報で特定される精度（ここでは、正解率）について、格納部５１に格納されている精度情報１～８のうち、最良の値（例えば、最大値）の精度情報を取得する。例えば、精度情報１～８に対応する正解率ｃ_１～ｃ_８のうちｃ_３が最良の値ある場合は、当該最良の値に対応する精度情報３が取得される。

なお、例えば、格納されている精度特定情報が、４種類の精度をすべて用いる旨の情報（例えば、４種類の各精度ごとに、最良の値に対応する精度情報に各ｘ点（例えば、１点）を加点し、最高得点に対応する精度情報を取得する旨の情報）であり、再現率ａ_１～ａ_８のうち最良の値がａ_２であり、適合率ｂ_１～ｂ_８のうち最良の値がｂ_３であり、Ｆ値“（ａ_１＋ｂ_１）／２”～“（ａ_８＋ｂ_８）／２”のうち最良の値が“（ａ_２＋ｂ_２）／２”であり、正解率ｃ_１～ｃ_８のうちｃ_４が最良の値ある場合は、精度情報２について“１点＋１点＝２点”が取得され、精度情報３について“１点”が取得され、精度情報４について“１点”が取得され、その他の各精度情報１，５～８については“０点”が取得され、こうして取得された８個の点数のうち最高点である２点に対応する精度情報２が取得されてもよい。

また、例えば、格納されている精度特定情報が、４種類の精度のうち一の精度(例えば、適合率)を重視する旨の情報（例えば、４種類の各精度ごとに、最良の値に対応する精度情報に各ｘ点（例えば、１点）を加点し、ｘ点が加点された精度情報の中に、重視する精度情報が含まれている場合は、当該重視する精度情報について、さらにｙ点（例えば、２点）を加点する旨の情報など）であり、再現率ａ_１～ａ_８のうち最良の値がａ_２であり、適合率ｂ_１～ｂ_８のうち最良の値がｂ_３であり、Ｆ値“（ａ_１＋ｂ_１）／２”～“（ａ_８＋ｂ_８）／２”のうち最良の値が“（ａ_２＋ｂ_２）／２”であり、正解率ｃ_１～ｃ_８のうちｃ_３が最良の値ある場合は、精度情報２について“１点＋１点＝２点”が取得され、精度情報３について、“（１点＋２点）＋１点＝４点”が取得され、その他の各精度情報１，４～８については“０点”が取得され、こうして取得された８個の点数のうち最高点である４点に対応する精度情報３が取得されてもよい。

アルゴリズム情報取得部５３４は、当該最良の値の精度情報と対になるアルゴリズム情報（例えば、精度情報３が取得された場合は、当該精度情報３と対になるアルゴリズム情報候補３）を、格納部５１からアルゴリズム情報として取得する。アルゴリズム情報取得部５３４は、当該取得したアルゴリズム情報を、上記受信された学習元情報に対応付けて格納部５１に蓄積する。

出力部５４は、こうして、学習元情報受付部５２１が学習元情報を受信したことに応じて、アルゴリズム情報取得部５３４が取得したアルゴリズム情報を出力する。アルゴリズム情報の出力先は、通常、学習機生産装置６である。

学習機生産装置６において、学習処理部１３が、アルゴリズム決定装置５から出力されたアルゴリズム情報を学習格納部６１に蓄積し、学習部１３４は、学習格納部６１に格納されているアルゴリズム情報を用いて、例えば、図１７のフローチャートに示した手順で、学習器を取得する。取得された学習器は、特許分類装置８に引き渡される。

学習機生産装置６によって取得されたアルゴリズム情報は、特許分類装置８にも出力される。特許分類装置８において、処理部８２は、学習機生産装置６から引き渡された学習器と、学習機生産装置６から出力されたアルゴリズム情報とを格納部２１に蓄積する。その後、受付部８１が、ユーザ端末４から分類対象情報を受信し、処理部８２は、当該受信された分類対象情報に対し、格納部２１に格納されている学習器とアルゴリズム情報と用いて、例えば、図１８のフローチャートに示した処理を実行し、予測分類情報とそれに対するスコアを取得する。出力部２４は、当該取得された特許分類情報とスコアを、当該分類対象情報の送信元であるユーザ端末４に送信する。これにより、ユーザ端末４のディスプレイに、特許分類情報とスコアが表示される。

なお、学習機生産装置６によって取得されたアルゴリズム情報は、上記学習元情報の送信元であるユーザ端末４にも送信されてもよい。ユーザ端末４は、アルゴリズム決定装置５から送信されたアルゴリズム情報を、ディスプレイ等の出力デバイスを介して出力する。これによって、ユーザ端末４のディスプレイに、アルゴリズム情報が表示される。

以上、本実施の形態によれば、アルゴリズム決定装置５は、予測処理を行うための適切な処理を決定できる。

また、アルゴリズム決定装置５は、予測処理を行う際に使用するデータを変更することにより、予測処理を行うための適切な処理を決定できる。

また、アルゴリズム決定装置５は、複数の学習器生成プログラムを使用することにより、予測処理を行うための適切な処理を決定できる。

また、アルゴリズム決定装置５は、２以上の学習器を用いて取得した予測結果に対して統計処理を行った予測結果を用いることにより、予測処理を行うための適切な処理を決定できる。

また、アルゴリズム決定装置５は、２以上の学習器を用いて取得した予測結果に対して２以上の統計処理を行った２以上の予測結果を用いることにより、予測処理を行うための適切な統計処理を含む処理を決定できる。

また、アルゴリズム決定装置５は、再現率または適合率またはＦ値または正解率のうち、ユーザが所望するスコア（受付部５２が受け付けた精度特定情報で特定される精度情報）が高い処理を決定できる。

また、学習器生産装置６は、アルゴリズム決定装置５が出力するアルゴリズム情報に従ったアルゴリズムで学習処理を行うことにより、適切な学習器が生産できる。

また、特許分類装置２は、学習器生産装置６が生産した適切な学習器を用いて、予測処理を行うことにより、特許を精度高く分類できる。

なお、特許分類装置２は、学習器生産装置６が生産した適切な学習器と、特許明細書に関する重要な情報とを用いることにより、特許をより精度高く分類できる。

なお、本実施の形態におけるアルゴリズム決定装置５を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成する１以上の学習器生成プログラムと、学習器を用いて特許分類情報の分類を予測し、予測分類情報を取得する予測プログラムとが格納されるプログラム格納部５１１にアクセス可能なコンピュータを、学習元情報を受け付ける学習元情報受付部５２１と、前記学習元情報受付部５２１が受け付けた学習元情報のうちの少なくとも一部の特許分類情報を用いて、前記１以上の各学習器生成プログラムを実行し、１以上の学習器を取得する学習部５３１と、前記学習元情報受付部５２１が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、前記学習部５３１が生成した１以上の各学習器を用いて、予測プログラムを適用し、前記１以上の各特許分類情報に対する２以上の予測分類情報を取得する予測部５３２と、前記予測部５３２が取得した２以上の各予測分類情報と、前記学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の精度に関する精度情報を取得し、当該精度情報が特定する精度が最も高い予測分類情報を決定する評価部と、前記評価部が決定した予測分類情報に対応するアルゴリズムに関するアルゴリズム情報を取得するアルゴリズム情報取得部５３４と、前記アルゴリズム情報を出力する出力部として機能させるためのプログラムである。

また、本実施の形態における学習器生産装置６を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータを、学習元情報を受け付ける学習元情報受付部６２１と、アルゴリズム決定装置５が出力するアルゴリズム情報に従ったアルゴリズムで、前記学習元情報受付部６２１が受け付けた学習元情報に対して、学習処理を行い学習器を取得する学習部１３４と、前記学習器を前記アルゴリズム情報に対応付けて蓄積する蓄積部６４１として機能させるためのプログラムである。

さらに、本実施の形態における特許分類装置２を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、学習器生産装置６が蓄積した学習器が格納される学習器格納部にアクセス可能なコンピュータを、分類対象の特許を識別する特許識別子を含む分類対象情報を受け付ける受付部と、前記分類対象情報に対して、前記学習器に対応付いているアルゴリズム情報に従ったアルゴリズムにより、前記学習器を用いて予測処理を行い、分類結果情報を取得する予測部２３４と、前記予測部２３４が取得した分類結果情報を、前記受付部が受け付けた分類対象情報に含まれる特許識別子に対応付けて出力する出力部として機能させるためのプログラムである。

（実施の形態３）
図２１は、本実施の形態における特許分類システムＣのブロック図である。

特許分類システムＣは、アルゴリズム決定装置５、学習器生産装置１、特許分類装置２、サーバ装置３、および１または２以上のユーザ端末４を備える。

アルゴリズム決定装置５は、実施の形態２におけるものと同じ要素である。学習器生産装置１、特許分類装置２、サーバ装置３、およびユーザ端末４は、実施の形態1におけるものと同じ要素である。

ただし、学習器生産装置１を構成する学習処理部１３が使用するアルゴリズムは、アルゴリズム決定装置５によって決定されたアルゴリズムである。

また、特許分類装置２を構成する重要情報取得部１３２は、効果解決手段文取得手段１３２１、効果文取得手段１３２２、解決手段文取得手段１３２３、目的文取得手段１３２４、特徴語取得手段１３２５、関連語取得手段１３２６、重要タグ対応文取得手段１３２７、数値範囲文字列取得手段１３２８、および数字取得手段１３２９を備える。

次に、特許分類システムＣの動作について説明する。特許分類システムＣを構成するアルゴリズム決定装置５のフローチャートは、図１３～図１６に示されている。学習器生産装置１のフローチャートは、図４～図９に示されている。特許分類装置２のフローチャートは、図１０に示されている。

以上、本実施の形態によれば、実施の形態１に記載の効果に加えて、実施の形態２に記載の効果がさらに得られる。

（実施の形態４）
本実施の形態において、一の条件とクラス（分類情報）との組である条件情報が格納されており、当該一の条件に合致する予測対象（特許情報）については、当該一の条件と対になるクラスに決定し、当該一の条件に合致しない場合に、機械学習のアルゴリズムでクラスを決定する、分類情報決定装置を備える特許分類システムＤについて説明する。

また、本実施の形態において、機械学習のアルゴリズムは、例えば、実施の形態１～３で説明したものと同様であるが、その種類は問わない、分類情報決定装置を備える特許分類システムＤについて説明する。

また、本実施の形態において、一の条件は、機械学習の学習器を作成した際に使用した教師データの特許であること、である分類情報決定装置を備える特許分類システムＤについて説明する。

図２２は、本実施の形態における特許分類システムＤのブロック図である。特許分類システムＤは、学習器生産装置１、分類情報決定装置７、サーバ装置３、およびユーザ端末４を備える。特許分類システムＤにおいて、学習器生産装置１に代えて、学習器生産装置６を用いても良い。

学習器生産装置１は、実施の形態１におけるものと同様の構成を有し、同様の動作を行う。すなわち、学習器生産装置１は、学習元情報を用いて、機械学習の学習処理を行い、学習器を取得する。

分類情報決定装置７は、格納部７１、受付部７２、処理部７３、および出力部７４を備える。格納部７１は、学習器格納部７１１、および条件情報格納部７１２を備える。受付部７２は、特許情報受付部７２１を備える。処理部７３は、予測部７３１を備える。予測部７３１は、判断手段７３１１、第一決定手段７３１２、および第二決定手段７３１３を備える。

分類情報決定装置７を構成する格納部７１には、各種の情報が格納される。各種の情報とは、例えば、前述した学習器、および後述する条件情報などである。また、格納部７１には、例えば、１または２以上の特許情報が格納されてもよいし、特許分類情報が格納されてもよい。

学習器格納部７１１には、学習器が格納される。本実施の形態では、学習器生産装置１が、学習習元情報を用いて、機械学習の学習処理を行い、学習器を取得する。前述したように、学習元情報は、２以上の特許分類情報を有し、特許分類情報は、特許情報と、特許情報の分類情報とを有する。取得された学習器は、分類情報決定装置７に引き渡され、例えば、後述する処理部７３によって、学習器格納部７１１に蓄積される。

ただし、学習器は、予め学習器格納部７１１に格納されていてもよいし、分類情報決定装置７内で取得されもよい。後者の場合、例えば、格納部７１に、学習元情報が格納されており、分類情報決定装置７は、当該学習習元情報を用いて機械学習の学習処理を行い、学習器を取得する学習部（図示しない）を備えていてもよい。

条件情報格納部７１２には、１または２以上の条件情報が格納される。条件情報とは、特許に関する一の条件と、特許情報の分類情報との組である。本実施の形態において、一の条件は、例えば、予測の対象である特許情報が、学習元情報が有する２以上のいずれかの特許分類情報を構成する特許情報であること、である。一の条件は、例えば、特許の検索式である。検索式は、例えば、「発明の名称に「機械学習」を含む」、「出願人＝ＡＢＣ＆ＩＰＣ＝Ｇ０６Ｆ＊」である。

なお、特許情報とは、前述したように、特許に関する情報であり、例えば、特許公報や公開特許公報等の特許明細書の一部または全部である。また、分類情報とは、前述したように、特許情報に対する分類を示す情報であり、例えば、「○，×」や「Ａ，Ｂ，Ｃ」等、何でもよい。

条件情報は、例えば、学習元情報が有する２以上の特許分類情報のうちの一の特許分類情報に対応する特許識別子（例えば、公開番号や特許番号等）と、当該一の特許分類情報に対応する分類情報とを含む。例えば、学習器が、学習元情報が有する２以上の特許分類情報のうち一部を用いて取得された場合、条件情報は、学習器を取得する際に使用された２以上の特許分類情報のうちの一の特許分類情報に対応する特許識別子と、当該一の特許分類情報に対応する分類情報とを含む。

ただし、条件情報は、例えば、学習元情報が有する２以上の特許分類情報のうちの一の特許分類情報でもよい。例えば、学習器が、学習元情報が有する２以上の特許分類情報のうち一部を用いて取得された場合、条件情報は、学習器を取得する際に使用された２以上の特許分類情報のうちの一の特許分類情報でもよい。

学習器生産装置１は、例えば、上記学習器と共に、当該学習器を取得する際に使用した学習元情報をも、分類情報決定装置７に引き渡してもよい。

分類情報決定装置７において、例えば、処理部７３が、上記学習元情報の引き渡しを受け、当該学習元情報を用いて、特許識別子と分類情報とを有する２以上の条件情報を取得し、学習器格納部７１１に蓄積する。ただし、２以上の条件情報の取得は、学習器生産装置１側で行われ、取得された２以上の条件情報が分類情報決定装置７に引き渡されてもよい。

これにより、条件情報格納部７１２には、学習器生産装置１が学習器を取得する際に使用した２以上の特許分類情報（例えば、前述した特許分類情報を構成する１００個の特許分類１～１００のうち、９０個の特許分類情報１１～１００）に対応する２以上の条件情報（例えば、後述する図２５に示す９０個の条件情報１～９０）が格納される。

受付部７２は、各種の情報を受け付ける。各種の情報とは、例えば、特許情報である。前述したように、受け付けとは、通常、ユーザ端末４からの受信であるが、例えば、キーボード等の入力デバイスから入力された情報の受け付け、ディスクや半導体メモリ等の記録媒体から読み出された情報の受け付けなどを含む概念である、と考えても良い。

特許情報受付部７２１は、１または２以上の特許情報を受け付ける。特許情報受付部７２１は、通常、ユーザ端末４から、1以上の特許情報を受信する。ただし、例えば、ディスク等の記録媒体に１以上の特許情報が格納されており、特許情報受付部７２１は、かかる記録媒体から1以上の特許情報を読み出してもよい。

処理部７３は、各種の処理を行う。各種の処理とは、例えば、予測部７３１、判断手段７３１１、第一決定手段７３１２、および第二決定手段７３１３などの処理である。また、処理部７３は、例えば、フローチャートで説明する各種の判断なども行う。なお、処理部７３が行うその他の処理について、適時説明する場合がある。

予測部７３１は、１以上の条件情報を用いて、１以上の各特許情報の分類情報を特定する予測分類情報を取得する。

予測部７３１は、例えば、特許情報受付部７２１が受け付けた１以上の各特許情報ごとに、予測分類情報取得処理を実行する。予測分類情報取得処理とは、予測分類情報を取得する処理である。予測分類情報とは、当該特許情報の分類情報を特定する情報である。

判断手段７３１１は、１以上の各特許情報が、１以上の各条件情報が有する条件のうちのいずれかの条件に合致するか否かを判断する。

判断手段７３１１は、例えば、特許情報受付部７２１が受け付けた１以上の各特許情報ごとに、当該特許情報が、条件情報格納部７１２に格納されている１以上の条件情報に対応する１以上の条件のうち、いずれかの条件に合致するか否かを判断する。

本実施の形態では、例えば、条件情報が特許識別子と分類情報の対であり、条件情報格納部７１２には、１以上の特許識別子が、分類情報に対応付けて格納されており、判断手段７３１１は、受け付けられた１以上の各特許情報ごとに、当該特許情報が有する特許識別子が、条件情報格納部７１２に格納されている１以上の特許識別子のうちのいずれかの特許識別子に合致するか否かを判断してもよい。

第一決定手段７３１２は、判断手段７３１１が合致すると判断した条件と対になる分類情報を取得する。

第一決定手段７３１２は、例えば、１以上の各特許情報ごとに、当該特許情報が有する特許識別子に合致すると判断された特許識別子と対になる分類情報を取得する。

第二決定手段７３１３は、学習器格納部７１１に格納されている学習器を用いて、特許情報の分類情報を、機械学習の予測処理により取得する。判断手段７３１１がいずれの条件にも合致しないと判断した特許情報に対して、第二決定手段７３１３は、学習器格納部７１１に格納されている学習器を用いて、機械学習の予測処理により分類情報を取得する。

本実施の形態では、第二決定手段７３１３は、例えば、条件情報格納部７１２に格納されている１以上の特許識別子のいずれにも合致しないと判断された特許識別子に対応する特許情報の分類情報を、機械学習の予測処理により取得する。

出力部７４は、各種の情報を出力する。各種の情報とは、例えば、予測分類情報である。出力部７４は、例えば、受け付けられた１以上の各特許情報ごとに、第一決定手段７３１２が決定した分類情報または第二決定手段７３１３が取得した分類情報を、当該特許情報に対応する特許識別子と対に、予測分類情報として出力する。

なお、前述したように、出力とは、例えば、ユーザ端末４への送信であるが、ディスプレイへの表示、プリンタでの印字、スピーカーからの音出力、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念と考えても良い。

出力部７４は、予測部７３１が取得した予測分類情報を出力する。出力部７４は、取得された予測分類情報を、通常、ユーザ端末４に送信する。ただし、予測分類情報は、例えば、ディスプレイに表示されたり、記録媒体に蓄積されたり、他の処理装置や他のプログラムなどに引き渡されたりしても良く、その出力態様や出力先は問わない。

サーバ装置３は、実施の形態1におけるものと同様の動作を行う。

ユーザ端末４は、実施の形態1におけるものと同様の動作を行う。

格納部７１、学習器格納部７１１、および条件情報格納部７１２は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。

格納部７１等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部７１等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部１等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部１等で記憶されるようになっても良い。

受付部７２、特許情報受付部７２１、および出力部７４は、通常、無線または有線の通信手段等で実現され得る。

処理部７３、予測部７３１、判断手段７３１１、第一決定手段７３１２、および第二決定手段７３１３は、通常、ＭＰＵやメモリ等から実現され得る。処理部７３等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。

次に、特許分類システムＤの動作について図２３および図２４のフローチャートを用いて説明する。図２３は、分類情報決定装置７の動作を説明するフローチャートである。

（ステップＳ２３０１）処理部７３は、特許情報受付部７２１が１以上の特許情報を受け付けたか否かを判断する。特許情報受付部７２１が１以上の特許情報を受け付けたと判断された場合はステップＳ２３０２に進み、受け付けていないと判断された場合はステップ２５０１に戻る。

（ステップＳ２３０２）処理部７３は、カウンタｋに１を代入する。

（ステップＳ２３０３）処理部７３は、ｋ番目の特許情報が存在するか否かを判断する。ｋ番目の特許情報が、存在すると判断された場合はステップＳ２３０３に進み、存在しないと判断された場合はステップＳ２３０１に戻る。

（ステップＳ２３０４）予測部７３１は、ｋ番目の特許情報の分類情報を特定する予測分類情報ｋを取得する処理（以下、「k番目の予測分類情報取得処理」）を実行する。なお、k番目の予測分類情報取得処理については、図２４のフローチャートを用いて説明する。

（ステップＳ２３０５）処理部７３は、カウンタｋを１、インクリメントする。ステップＳ２３０３に戻る。

なお、図２３のフローチャートにおいて、分類情報決定装置７の電源オフや処理終了の割り込みにより処理は終了する。

図２４は、上記ステップＳ２３０４の「ｋ番目の予測分類情報取得処理」を説明するフローチャートである。

（ステップＳ２４０１）予測部７３１は、カウンタｎに１を代入する。

（ステップＳ２４０２）予測部７３１は、ｎ番目の条件が存在するか否かを判断する。ｎ番目の条件が、存在すると判断された場合はステップＳ２４０３に進み、存在しないと判断された場合はステップＳ２４０７に進む。

（ステップＳ２４０３）予測部７３１を構成する判断手段７３１１は、ｋ番目の特許情報がn番目の条件に合致するか否かを判断する。ｋ番目の特許情報がn番目の条件に、合致すると判断された場合はステップ２６０５に進み、合致しないと判断された場合はステップＳ２４０４に進む。

（ステップＳ２４０４）予測部７３１は、カウンタｎを１、インクリメントする。ステップＳ２４０２に戻る。

（ステップＳ２４０５）第一決定手段７３１２は、条件情報格納部７１２に格納されている１以上の条件情報に対応する１以上の条件のうちｎ番目の条件、と対になる分類情報を決定する。

（ステップＳ２４０６）予測部７３１は、ステップＳ２４０５で決定された分類情報を“予測分類情報ｋ”にセットする。上位処理にリターンする。

（ステップＳ２４０７）第二決定手段７３１３は、学習器格納部７１１に格納されている学習器を用いて、ｋ番目の特許情報の分類情報を、機械学習の予測処理により取得する。

（ステップＳ２４０８）予測部７３１は、ステップＳ２４０７で取得された分類情報を“予測分類情報ｋ”にセットする。上位処理にリターンする。

以下、本実施の形態における特許分類システムＤの具体的な動作例について説明する。

学習器生産装置１は、実施の形態１で説明したように、学習元情報を用いて、機械学習の学習処理を行い、学習器を取得する。学習器生産装置１は、当該取得した学習器と、当該学習器を取得する際に使用した学習元情報とを分類情報決定装置７に引き渡す。本例では、１００個の特許分類情報１～１００を有する学習元情報を用いて学習器が取得され、当該学習器が当該学習元情報と共に引き渡されたとする。

分類情報決定装置７において、処理部７３は、上記学習器の引き渡しを受け、学習器格納部７１１に蓄積する。また、処理部７３は、上記学習元情報の引き渡しを受け、当該学習元情報に対応する２以上（本例では、当該学習元情報が有する１００個の特許分類情報１～１００のうち、学習器の取得の際に使用された９０個の特許分類情報１１～１００に対応する９０個）の条件情報を取得し、条件情報格納部７１２に蓄積する。

これにより、学習器格納部７１１には、学習器生産装置１が、受け付けた学習元情報が有する１００個の特許分類情報のうち、特許分類情報１１～１００を用いて取得した学習器が格納される。また、条件情報格納部７１２には、例えば、図２５に示すような、２以上（本例では、当該学習器を取得する際に使用された９０個の特許分類情報１１～１００に対応する９０個）の条件情報が格納される。

図２５は、本実施の形態における条件情報のデータ構造図である。条件情報は、特許識別子と分類情報とを有する。条件情報格納部７１２に格納される２以上の各条件情報は、ＩＤ（例えば、“１”，“２”等）に対応付いている。例えば、ＩＤ“１”に対応付いた条件情報（以下、条件情報１）は、特許識別子“特開２０１７－ｄｄｄｄ”と分類情報“Ｂ”とを有する。また、ＩＤ“２”に対応付いた条件情報２は、特許識別子“特開２０１７－ｅｅｅｅ”と分類情報“Ａ”とを有する。同様に、条件情報１００は、特許識別子“特開２０１８－ｆｆｆｆ”と分類情報“Ｃ”とを有する。

本例では、受け付けられた学習元情報が有する１００個の特許分類情報１～１００に対応する１００個の特許情報が、ディスク等の既得媒体から読み出されたとする。

分類情報決定装置７において、特許情報受付部７２１が上記読み出された１００個の特許情報を受け付け、予測部７３１は、当該受け付けられた１００個の特許情報ごとに、当該特許情報の分類情報を特定する予測分類情報を取得する予測分類情報取得処理を実行する。

すなわち、予測部７３１を構成する判断手段７３１１は、まず、特許分類情報１に対応する１番目の特許情報について、当該特許情報が、条件情報格納部７１２に格納されている１０個の条件情報１～１０に対応する１０個の条件のうちの、いずれかの条件に合致するか否かを判断する。当該特許情報は、いずれの条件にも合致しないと判断される。

いずれの条件にも合致しないとの上記判断結果を受け、第二決定手段７３１３は、学習器格納部７１１に格納されている学習器を用いて、１番目の特許情報の分類情報を、機械学習の予測処理により取得する。本例では、分類情報“Ａ”が取得されたとする。これにより、１番目の特許情報の予測分類情報として、学習器による分類情報“Ａ”が取得される。

特許分類情報２～１０についても同様に、いずれの条件にも合致しないと判断され、学習器による予測分類情報（例えば、特許分類情報２について予測分類情報“Ａ”、特許分類情報１０について予測分類情報“Ｂ”など）が取得される。これにより、２番目～１０番目の各特許情報の予測分類情報として、学習器による予測分類情報“Ａ”・・・“Ｂ”が取得される。

次に、判断手段７３１１は、特許分類情報１１に対応する１１番目の特許情報について、当該特許情報が、条件情報格納部７１２に格納されている９０個の条件情報１～９０に対応する９０個の条件のうちのいずれかの条件に合致するか否かを判断する。当該条件情報は、当該９０個の条件のうち、１番目の条件に合致すると判断される。

１番目の条件に合致するとの上記判断結果を受け、第一決定手段７３１２は、条件情報格納部７１２に格納されている９０個の条件情報に対応する９０個の条件のうち１番目の条件である特許識別子“特開２０１７-ｄｄｄｄ”、と対になる分類情報“Ｂ”を決定する。これにより、１１番目の特許情報の予測分類情報として、特許分類情報１１を構成する分類情報“Ｂ”が取得される。

特許分類情報１２～１００についても同様に、当該９０個の条件のうちの１２番目～９０番目の条件に合致すると判断され、１２番目～１００番目の条件である特許識別子“特開２０１７-ｅｅｅｅ”・・・“特開２０１８－ｆｆｆｆ”、と対になる分類情報“Ｂ”・・・“Ｃ”が決定される。これにより、１２番目～１００番目の各特許情報の予測分類情報として、各特許分類情報１２～１００を構成する分類情報“Ａ”・・・“Ｃ”が取得される。

出力部７４は、こうして、１００個の各特許情報ごとに取得された分類情報を、当該特許情報に対応付けて、ディスク等の記録媒体に蓄積する。

これにより、記録媒体には、例えば、特許情報と、当該特許情報の分類情報との組が、１００組、格納される。

以上、本実施の形態によれば、学習器生産装置１が、特許情報と分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、機械学習の学習処理を行い、学習器を取得し、学習器格納部７１１に、当該取得された学習器が格納される。条件情報格納部７１２には、特許に関する一の条件と分類情報との組である１以上の条件情報が格納される。分類情報決定装置７は、１以上の特許情報を受け付け、１以上の条件情報を用いて、１以上の各特許情報の分類情報を特定する予測分類情報を取得し、予測分類情報を出力する。

予測分類情報を取得する際、分類情報決定装置７は、１以上の各特許情報が、１以上の各条件情報が有する条件のうちいずれかの条件に合致するか否かを判断し、合致すると判断した条件と対になる分類情報を決定する一方、学習器を用いて、いずれの条件にも合致しないと判断した特許情報の分類情報を、機械学習の予測処理により取得することにより、特許を精度高く分類できる。

また、上記構成において、一の条件は、学習元情報が有する２以上のいずれかの特許分類情報を構成する特許情報であることであることにより、機械学習の学習器を取得した際に使用した教師データの特許を精度高く分類でき、それ以外の特許をも、学習器を用いた予測処理により精度高く分類できる。

なお、本実施の形態における分類情報決定装置７を実現するソフトウェアは、例えば、以下のようなプログラムである。つまり、このプログラムは、特許情報と当該特許情報の分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、機械学習の学習処理を行い、取得された学習器が格納される学習器格納部７１１、および特許に関する一の条件と特許情報の分類情報との組である１以上の条件情報が格納される条件情報格納部７１２にアクセス可能なコンピュータを、１以上の特許情報を受け付ける特許情報受付部７２１と、前記１以上の条件情報を用いて、前記１以上の各特許情報の分類情報を特定する予測分類情報を取得する予測部７３１と、前記予測分類情報を出力する出力部７４として機能させ、前記予測部７３１は、前記１以上の各特許情報が、前記１以上の各条件情報が有する条件のうちいずれかの条件に合致するか否かを判断する判断手段７３１１と、前記判断手段７３１１が合致すると判断した条件と対になる分類情報を決定する第一決定手段７３１２と、前記学習器を用いて、前記判断手段７３１１が前記いずれの条件にも合致しないと判断した特許情報の分類情報を、機械学習の予測処理により取得する第二決定手段７３１３とを具備するプログラムである。

（実施の形態５）
本実施の形態において、一の条件とクラス（分類情報）との組である条件情報が格納されており、当該一の条件に合致する予測対象（特許情報）については、当該一の条件と対になるクラスに決定し、当該一の条件に合致しない場合に、機械学習のアルゴリズムでクラスを決定する、分類情報決定装置を備える特許分類システムＥについて説明する。

また、本実施の形態において、機械学習のアルゴリズムは、例えば、実施の形態１～３で説明したものと同様であるが、その種類は問わない、分類情報決定装置を備える特許分類システムＥについて説明する。

また、本実施の形態において、一の条件は、特許の検索式（例えば、「発明の名称に「機械学習」を含む」等）である、分類情報決定装置を備える特許分類システムＥについて説明する。

図２６は、本実施の形態における特許分類システムＥのブロック図である。特許分類システムＥは、アルゴリズム決定装置５、学習器生産装置６、分類情報決定装置７ａ、サーバ装置３、およびユーザ端末４を備える。

分類情報決定装置７ａは、格納部７１、受付部７２ａ、処理部７３ａ、および出力部７４を備える。受付部７２ａは、特許情報受付部７２１、および検索式受付部７２２を備える。処理部７３ａは、特許明細書取得部１３１、重要情報取得部１３２、分類対象加工情報取得部２３３、予測部７３１、および検索部７３２を備える。予測部７３１は、判断手段７３１１、第一決定手段７３１２、および第二決定手段７３１３を備える。

ユーザ端末４は、ユーザ受付部４１、ユーザ処理部４２、ユーザ送信部４３、ユーザ受信部４４、およびユーザ出力部４５を備える。

アルゴリズム決定装置５は、実施の形態２におけるものと同様の構成を有し、同様の動作を行う。

学習器生産装置６は、実施の形態２におけるものと同様の構成を有し、同様の動作を行う。

分類情報決定装置７ａは、以下で説明する事項を除いて、実施の形態４における分類情報決定装置７と同様の構成を有し、同様の動作を行う。

すなわち、条件情報格納部７１２に格納される１以上の各条件情報を構成する一の条件は、検索式である。検索式とは、特許情報を検索する際の条件（以下、検索条件と記す場合がある）を示す情報である。検索条件は、例えば、「機械学習」等のキーワード、ＩＰＣ、Ｆターム、ＦＩ等の特許分類コードなどであるが、出願日又は公開日が属する期間を特定する期間情報でもよく、その種類は問わない。

また、検索条件は、例えば、『「発明の名称」に「機械学習」を含む』といった、項目情報とキーワードとの組を含んでもよい。項目情報とは、特許情報における項目を特定する情報である。項目情報は、例えば、「発明の名称」、「要約」、「発明の効果」等であるが、「全文」でもよく、その種類は問わない。

検索式は、例えば、キーワードや特許分類コード等の２以上の条件を論理演算子（例えば、ＡＮＤまたはＯＲなど）で結合したものであってもよい。また、検索式は、検索式を複数組み合わせ（論理演算子で結合した）検索式であっても良く、その形式は問わない。

受付部７２ａは、例えば、特許情報に加えて、検索式も受け付ける。

検索式受付部７２２は、検索式を受け付ける。検索式受付部７２２は、通常、ユーザ端末４から検索式を受信する。ただし、検索式は、例えば、分類情報決定装置７ａ内のキーボード等の入力デバイスを介して受け付けられてもよく、その受け付けの態様は問わない。

処理部７３ａは、予測部７３１等の処理に加えて、例えば、特許明細書取得部１３１、重要情報取得部１３２、分類対象加工情報取得部２３３、および検索部７３２の処理をさらに行う。なお、特許明細書取得部１３１、重要情報取得部１３２、および分類対象加工情報取得部２３３は、実施の形態１のものと同様の動作を行う。

検索部７３２は、検索式受付部７２２が受け付けた検索式を用いて検索を行い、検索結果を取得する。検索の対象は、例えば、格納部７１内の１以上の特許情報であるが、サーバ装置３内の１以上の特許情報でも良い。検索結果は、検索対象である１以上の特許情報のうち、検索式が示す検索条件を満たす１または２以上の特許情報である。なお、検索結果は、１または２以上の特許情報に対応する１または２以上の特許識別子でもよい。

ユーザ端末４を構成するユーザ受付部４１は、各種の情報を受け付ける。各種の情報とは、例えば、前述した検索式である。ユーザ受付部４１の受け付けは、通常、ユーザ端末４内でのキーボード等の入力デバイスを介した受け付けである。ただし、受け付けは、例えば、記録媒体からの読み出し、外部の装置からの受信等でもよく、その態様は問わない。なお、かかる事項は、検索式受付部４１１による検索式の受け付けにも当てはまる。

検索式受付部４１１は、検索式を受け付ける。

ユーザ処理部４２は、各種の処理を行う。各種の処理とは、例えば、ユーザ受付部４１が検索式等の情報を受け付けたか否かの判断、受け付けられた情報の送信される情報への変換などであるが、その種類は問わない。

ユーザ送信部４３は、各種の情報を送信する。各種の情報とは、例えば、検索式である。ユーザ送信部４３は、例えば、ユーザ受付部４１が受け付けた検索式を分類情報決定装置７ａに送信する。

ユーザ受信部４４は、各種の情報を受信する。各種の情報とは、例えば、検索式である。ユーザ受信部４４は、例えば、ユーザ送信部４３による検索式の送信に応じて、検索結果を分類情報決定装置７ａから受信する。

ユーザ出力部４５は、各種の情報を出力する。各種の情報とは、例えば、検索結果である。ユーザ出力部４５は、検索結果等の情報を、例えば、ディスプレイに表示したり、記録媒体に蓄積したりする。ただし、検索結果等の情報は、例えば、他のプログラムに引き渡された、他の装置に送信されたりしてもよく、その出力態様は問わない。

検索式受付部４１１、およびユーザ受付部４１は、キーボードやタッチパネル等の入力デバイスを含むと考えても、含まないと考えてもよい。検索式受付部４１１等は、入力デバイスのドライバーソフトによって、または入力デバイスとそのドライバーソフトとで実現され得る。

ユーザ送信部４３、およびユーザ受信部４４は、通常、無線または有線の通信手段等で実現され得る。

検索部７３２、およびユーザ処理部４２等は、通常、ＭＰＵやメモリ等から実現され得る。処理部７３ａ等の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはＲＯＭ等の記録媒体に記録されている。但し、ハードウェア（専用回路）で実現しても良い。

なお、特許分類システムＥの動作は、実施の形態４において図２３および図２４のフローチャートを用いて説明したものと同様である。

以下、本実施の形態における特許分類システムＥの具体的な動作例について説明する。

アルゴリズム決定装置５は、実施の形態２で説明したように、予測処理を行うための適切な処理を決定する。学習器生産装置６は、実施の形態２で説明したように、学習元情報を用いて、機械学習の学習処理であり、アルゴリズム決定装置５の決定に従う学習処理を行い、学習器を取得する。学習器生産装置６は、当該取得した学習器と、当該学習器を取得する際に使用した学習元情報とを分類情報決定装置７ａに引き渡す。本例では、１００個の特許分類情報を有する学習元情報を用いて学習器が取得され、当該学習器が当該学習元情報と共に引き渡されたとする。

分類情報決定装置７ａにおいて、処理部７３ａは、上記学習器の引き渡しを受け、学習器格納部７１１に蓄積する。また、処理部７３ａは、上記学習元情報の引き渡しを受け、当該学習元情報に対応する２以上（本例では、学習器の取得の際に使用された９０個の特許分類情報１１～１００に対応する９０個）の条件情報を取得し、条件情報格納部７１２に蓄積する。

これにより、学習器格納部７１１には、学習器生産装置６が、上記学習元情報のうち、９０個の特許分類情報１１～１００を用いて取得した学習器が格納される。また、条件情報格納部７１２には、例えば、図２７に示すような、２以上の条件情報（条件情報１～３等）が格納される。

図２７は、本実施の形態における条件情報のデータ構造図である。条件情報は、検索式と分類情報とを有する。条件情報格納部７１２に格納される２以上の各条件情報は、ＩＤ（例えば、“１”，“２”等）に対応付いている。例えば、ＩＤ“１”に対応付いた条件情報１は、検索式“「発明の名称」に「機械学習」を含む”と分類情報“Ａ”とを有する。また、ＩＤ“２”に対応付いた条件情報２は、検索式“「機械学習」ａｎｄ「自然言語処理」”と分類情報“Ｂ”とを有する。同様に、条件情報３は、検索式“「Ｈ０６ａａ/ａａ」ｏｒ「Ｇ０６ｂｂ/ｂｂ」ｏｒ・・・”と分類情報“Ｃ”とを有する。

ユーザは、ユーザ端末４の入力デバイスを介して、１以上の特許情報を入力する。ここで入力される特許情は、公開番号等の特許識別子である。例えば、前述した学習元情報が有する１００個の特許分類情報１～１００のうち、１０個の特許分類情報１～１０に対応する１０個の特許識別子が入力されたとする。

ユーザ端末４において、ユーザ受付部４１が、上記入力された１０個の特許識別子を受け付け、ユーザ送信部４３は、当該受け付けられた１０個の特許識別子を分類情報決定装置７ａに送信する。

分類情報決定装置７ａにおいて、特許情報受付部７２１が上記送信された１０個の特許識別子を受信し、出力部７４は、当該受け付けられた１０個の特許情識別子を含む要求をサーバ装置３に送信し、特許情報受付部７２１は、当該送信された１０個の特許情識別子に対応する１０個の特許情報をサーバ装置３から受信する。予測部７３１は、当該受信された１０個の特許情報ごとに、当該特許情報の分類情報を特定する予測分類情報を取得する予測分類情報取得処理を実行する。

すなわち、予測部７３１を構成する判断手段７３１１は、まず、特許分類情報１に対応する１番目の特許情報について、当該特許情報が、条件情報格納部７１２に格納されている２以上の条件情報１～３等に対応する２以上の条件のうちの、いずれかの条件に合致するか否かを判断する。ここでは、当該特許情報は、いずれの条件にも合致しないと判断されたとする。

特許分類情報２～９についても同様に、いずれの条件にも合致しないと判断され、学習器による予測分類情報（例えば、特許分類情報２について予測分類情報“Ａ”など）が取得される。これにより、２番目～９番目の各特許情報の予測分類情報として、学習器による予測分類情報“Ａ”，“Ａ”・・・が取得される。

次に、判断手段７３１１は、特許分類情報１０に対応する１０番目の特許情報について、当該特許情報が、上記２以上の条件のうちのいずれかの条件に合致するか否かを判断する。当該条件情報は、条件情報３に対応する３番目の条件に合致すると判断されたとする。

３番目の条件に合致するとの上記判断結果を受け、第一決定手段７３１２は、条件情報格納部７１２に格納されている１０個の条件情報に対応する３以上の条件のうち３番目の条件である検索式“「Ｈ０６ａａ/ａａ」ｏｒ「Ｇ０６ｂｂ/ｂｂ」ｏｒ・・・”、と対になる分類情報“Ｃ”を取得する。これにより、１０番目の特許情報の予測分類情報として、特許分類情報１０を構成する分類情報“Ｃ”が取得される。

出力部７４は、こうして、１０個の各特許情報ごとに取得された分類情報を、当該特許情報に対応付けて、ユーザ端末４に送信する。これにより、特許情報と分類情報との組である１０個の組情報が送信される。

ユーザ端末４において、ユーザ受信部４４が、上記送信された１０個の組情報を受信し、ユーザ出力部４５は、当該受信された１０個の組情報を、ディスプレイを介して出力する。なお、出力される組情報は、受信された組情報と同じでなくてもよい。例えば、出力される組情報を構成する特許情報は、受信された組情報を構成する特許情報の一部（例えば、特許識別子と要約書など）でもよい。

これにより、ユーザ端末４のディスプレイに、特許情報と分類情報との組が１０組、表示される。

以上、本実施の形態によれば、学習器生産装置６が、特許情報と分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、機械学習の学習処理を行い、学習器を取得し、学習器格納部７１１に、当該取得された学習器が格納される。条件情報格納部７１２には、特許に関する一の条件と分類情報との組である１以上の条件情報が格納される。分類情報決定装置７ａは、１以上の特許情報を受け付け、１以上の条件情報を用いて、１以上の各特許情報の分類情報を特定する予測分類情報を取得し、予測分類情報を出力する。

予測分類情報を取得する際、分類情報決定装置７ａは、１以上の各特許情報が、１以上の各条件情報が有する条件のうちいずれかの条件に合致するか否かを判断し、合致すると判断した条件と対になる分類情報を決定する一方、学習器を用いて、いずれの条件にも合致しないと判断した特許情報の分類情報を、機械学習の予測処理により取得することにより、特許を精度高く分類できる。

また、上記構成において、一の条件は検索式であることであることにより、検索式に合致する特許を精度高く分類でき、検索式に合致しない特許をも、機械学習の学習器を用いた予測処理により精度高く分類できる。

また、アルゴリズム決定装置５が、予測処理を行うための適切な処理を決定し、学習器生産装置６は、その決定に従ったアルゴリズムで学習処理を行うことにより、適切な学習器が生産される結果、特許を精度高く分類できる。

なお、本実施の形態における分類情報決定装置７ａを実現するソフトウェアは、例えば、以下のようなプログラムである。つまり、このプログラムは、特許情報と当該特許情報の分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、機械学習の学習処理を行い、取得された学習器が格納される学習器格納部７１１、および特許に関する一の条件と特許情報の分類情報との組である１以上の条件情報が格納される条件情報格納部７１２にアクセス可能なコンピュータを、１以上の特許情報を受け付ける特許情報受付部７２１と、前記１以上の条件情報を用いて、前記１以上の各特許情報の分類情報を特定する予測分類情報を取得する予測部７３１と、前記予測分類情報を出力する出力部として機能させ、前記予測部７３１は、前記１以上の各特許情報が、前記１以上の各条件情報が有する条件のうちいずれかの条件に合致するか否かを判断する判断手段７３１１と、前記判断手段７３１１が合致すると判断した条件と対になる分類情報を決定する第一決定手段７３１２と、前記学習器を用いて、前記判断手段７３１１が前記いずれの条件にも合致しないと判断した特許情報の分類情報を、機械学習の予測処理により取得する第二決定手段７３１３とを具備するプログラムである。

また、図２８は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の特許分類装置２等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図２８は、このコンピュータシステム３００の概観図であり、図２９は、システム３００のブロック図である。なお、図２８、図２９は、エンゲージメントシステムを実現するコンピュータの外観等を示す図である。

図２８において、コンピュータシステム３００は、ＣＤ－ＲＯＭドライブ３０１２を含むコンピュータ３０１と、キーボード３０２と、マウス３０３と、モニタ３０４とを含む。

図２９において、コンピュータ３０１は、ＣＤ－ＲＯＭドライブ３０１２に加えて、ＭＰＵ３０１３と、ＣＤ－ＲＯＭドライブ３０１２等に接続されたバス３０１４と、ブートアッププログラム等のプログラムを記憶するためのＲＯＭ３０１５と、ＭＰＵ３０１３に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのＲＡＭ３０１６と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク３０１７とを含む。ここでは、図示しないが、コンピュータ３０１は、さらに、ＬＡＮへの接続を提供するネットワークカードを含んでも良い。

コンピュータシステム３００に、上述した各実施の形態の学習器生産装置１、特許分類装置２、アルゴリズム決定装置５、分類情報決定装置７等の機能を実行させるプログラムは、ＣＤ－ＲＯＭ３１０１に記憶されて、ＣＤ－ＲＯＭドライブ３０１２に挿入され、さらにハードディスク３０１７に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ３０１に送信され、ハードディスク３０１７に記憶されても良い。プログラムは実行の際にＲＡＭ３０１６にロードされる。プログラムは、ＣＤ－ＲＯＭ３１０１またはネットワークから直接、ロードされても良い。

プログラムは、コンピュータ３０１に、上述した実施の形態の学習器生産装置１、特許分類装置２、アルゴリズム決定装置５等の機能を実行させるオペレーティングシステム（ＯＳ）、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能（モジュール）を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム３００がどのように動作するかは周知であり、詳細な説明は省略する。

なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理（ハードウェアでしか行われない処理）は含まれない。

また、上記プログラムを実行するコンピュータは、単数であっても良く、複数であっても良い。すなわち、集中処理を行っても良く、あるいは分散処理を行っても良い。

また、上記各実施の形態において、一の装置に存在する２以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。

また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されても良く、あるいは、複数の装置によって分散処理されることによって実現されても良い。つまり、学習器生産装置１、特許分類装置２、アルゴリズム決定装置５は、スタンドアロンで動作しても良い。学習器生産装置１、特許分類装置２、アルゴリズム決定装置５がスタンドアロンで動作する場合、受付部は、ユーザ等から指示や情報等を受け付ける。また、出力部は、情報等を表示、音出力、表示装置へ送信したりする。

本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。

以上のように、本発明にかかる特許分類システムは、適切なアルゴリズムを用いて予測処理を行うことにより、特許を精度高く分類できるという効果を有し、特許分類システム等として有用である。

また、本発明にかかる特許分類システムは、特許明細書に関する重要な情報を用いることにより、特許を精度高く分類できるという効果を有し、特許分類システム等として有用である。

また、本発明にかかる分類情報決定装置は、予め決められた条件に合致する特許情報と合致しない特許情報とで、異なる決定方法を用いて予測分類情報を取得することにより、特許を精度高く分類できるという効果を有し、分類情報決定装置等として有用である。

１、６学習器生産装置
２、８特許分類装置
３サーバ装置
４ユーザ端末
５アルゴリズム決定装置
７、７ａ分類情報決定装置
１１、６１学習格納部
１２、６２学習受付部
１３学習処理部
１４、６４学習出力部
２１、５１、７１格納部
２２、５２、７２、８１受付部
２３、５３、７３、７３ａ、８２処理部
２４、５４、７４出力部
４１ユーザ受付部
４２ユーザ処理部
４３ユーザ送信部
４４ユーザ受信部
４５ユーザ出力部
１１１人手評価情報格納部
１３１特許明細書取得部
１３２重要情報取得部
１３３、５３５学習元情報取得部
１３４、５３１学習部
１４１、６４１蓄積部
２１１、７１１学習器格納部
２３３分類対象加工情報取得部
２３４、５３２、７３１、８２１予測部
４２１、７３２検索部
５１１プログラム格納部
５１２精度特定情報格納部
５２１、６２１学習元情報受付部
５３１学習器
５３３評価部
５３４アルゴリズム情報取得部
５３６統計処理部
６２１学習元情報学習受付部
７１２条件情報格納部
７２１特許情報受付部
１３２１効果解決手段文取得手段
１３２２効果文取得手段
１３２３解決手段文取得手段
１３２４目的文取得手段
１３２５特徴語取得手段
１３２６関連語取得手段
１３２７重要タグ対応文取得手段
１３２８数値範囲文字列取得手段
１３２９数字取得手段
７３１１判断手段
７３１２第一決定手段
７３１３第二決定手段

Claims

特許に関する特許情報と当該特許情報に対する分類を示す分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、特許に関する特許情報を分類するための学習器を生成する１または２以上の学習器生成プログラムと、学習器を用いて特許分類情報の分類を予測し、予測分類情報を取得する１または２以上の予測プログラムとが格納されるプログラム格納部と、
一の学習元情報を受け付ける学習元情報受付部と、
前記学習元情報受付部が受け付けた前記学習元情報が有する２以上の各特許分類情報が有する特許情報のうち、異なる情報を有する２以上の特許分類情報を各々有する２以上の学習元情報を取得する学習元情報取得部と、
前記学習元情報取得部が取得した２以上の各学習元情報に対して、前記１または２以上の各学習器生成プログラムを実行し、２以上の学習器を取得する学習部と、
前記学習元情報受付部が受け付けた学習元情報のうちの少なくとも一部の各特許分類情報に対して、前記学習部が生成した２以上の各学習器を用いて、１または２以上の各予測プログラムを適用し、前記１以上の各特許分類情報に対する２以上の予測分類情報を取得する予測部と、
前記予測部が取得した２以上の各予測分類情報と、前記学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の精度に関する精度情報を取得し、当該精度情報が特定する精度が最も高い予測分類情報を決定する評価部と、
前記評価部が決定した予測分類情報に対応する学習元情報が有する情報を特定する情報特定情報を含む情報であり、アルゴリズムに関する情報であるアルゴリズム情報を取得するアルゴリズム情報取得部と、
前記アルゴリズム情報を出力する出力部とを具備するアルゴリズム決定装置。
前記予測部が取得した２以上の予測分類情報を用いて、１種類以上の統計処理を行い、統計処理結果である１以上の予測分類情報を取得する統計処理部をさらに具備し、
前記評価部は、
前記予測部が取得した２以上の予測分類情報に代えて、または前記予測部が取得した２以上の各予測分類情報に加えて、前記統計処理部が取得した１以上の予測分類情報を含む２以上の各予測分類情報と、前記学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の精度に関する精度情報を取得し、当該精度情報が特定する精度が最も高い予測分類情報を決定し、
前記アルゴリズム情報取得部は、
前記評価部が決定した予測分類情報に対応する統計処理の方法を特定する統計処理特定情報を含むアルゴリズム情報を取得する請求項１記載のアルゴリズム決定装置。
再現率または適合率またはＦ値または正解率の４つの精度のうちの２以上の精度のうちのいずれの精度に関する精度情報を取得するかを特定する精度特定情報が格納される精度特定情報格納部をさらに具備し、
前記評価部は、
前記予測部が取得した２以上の各予測分類情報と、前記学習元情報が有する分類情報とを用いて、２以上の各予測分類情報の、精度特定情報により特定される精度情報を取得し、当該精度情報が特定する精度が最も高い予測分類情報を決定する請求項１または請求項２記載のアルゴリズム決定装置。
請求項１から請求項３いずれかのアルゴリズム決定装置と、
学習元情報を受け付ける学習元情報受付部と、
前記アルゴリズム決定装置が取得したアルゴリズム情報に従ったアルゴリズムで、前記学習元情報受付部が受け付けた学習元情報に対して、学習処理を行い学習器を取得する学習部と、
前記学習器を前記アルゴリズム情報に対応付けて蓄積する蓄積部とを具備する学習器の生産装置。
請求項４記載の生産装置と、
分類対象の特許を識別する特許識別子を含む分類対象情報を受け付ける受付部と、
前記分類対象情報に対して、前記生産装置が蓄積した学習器に対応付いているアルゴリズム情報に従ったアルゴリズムにより、前記学習器を用いて予測処理を行い、分類結果情報を取得する予測部と、
前記予測部が取得した分類結果情報を、前記受付部が受け付けた分類対象情報に含まれる特許識別子に対応付けて出力する出力部とを具備する特許分類装置。
前記受付部が受け付けた分類対象情報に含まれる特許識別子に対応する特許明細書を用いて、予め決められた条件を満たす重要情報を取得する重要情報取得部と、
前記受付部が受け付けた分類対象情報に含まれる特許識別子に対応する情報であり、前記重要情報取得部が取得した重要情報を含む情報である分類対象加工情報を取得する分類対象加工情報取得部とをさらに具備し、
前記予測部は、
前記分類対象加工情報取得部が取得した分類対象加工情報に前記学習器に適用し、機械学習のアルゴリズムにより当該分類対象加工情報の分類を予測し、分類結果情報を取得する請求項５記載の特許分類装置。
特許情報と当該特許情報の分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、機械学習の学習処理を行い、取得された学習器が格納される学習器格納部と、
特許に関する一の条件と特許情報の分類情報との組である１以上の条件情報が格納される条件情報格納部と、
１以上の特許情報を受け付ける特許情報受付部と、
前記１以上の条件情報を用いて、前記１以上の各特許情報の分類情報を特定する予測分類情報を取得する予測部と、
前記予測分類情報を出力する出力部とを具備し、
前記予測部は、
前記１以上の各特許情報が、前記１以上の各条件情報が有する条件のうちいずれかの条件に合致するか否かを判断する判断手段と、
前記判断手段が合致すると判断した条件と対になる分類情報を決定する第一決定手段と、
前記学習器を用いて、前記判断手段が前記いずれの条件にも合致しないと判断した特許情報の分類情報を、機械学習の予測処理により取得する第二決定手段とを具備する分類情報決定装置。
請求項１から請求項３いずれか一項に記載のアルゴリズム決定装置によって実現されるアルゴリズム決定方法であって、
前記アルゴリズム決定装置が行う各ステップを具備するアルゴリズム決定方法。
請求項４記載の生産装置によって実現される学習器の生産方法であって、
前記生産装置が行う各ステップを具備する学習器の生産方法。
請求項５または請求項６記載の特許分類装置によって実現される特許分類方法であって、
前記特許分類装置が行う各ステップを具備する特許分類方法。
特許情報と当該特許情報の分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、機械学習の学習処理を行い、取得された学習器が格納される学習器格納部、特許に関する一の条件と特許情報の分類情報との組である１以上の条件情報が格納される条件情報格納部、特許情報受付部、予測部、および出力部によって実現される分類情報決定方法であって、
前記特許情報受付部が、１以上の特許情報を受け付ける特許情報受付ステップと、
前記予測部が、前記１以上の条件情報を用いて、前記１以上の各特許情報の分類情報を特定する予測分類情報を取得する予測ステップと、
前記出力部が、前記予測分類情報を出力する出力ステップとを具備し、
前記予測部は、
前記１以上の各特許情報が、前記１以上の各条件情報が有する条件のうちいずれかの条件に合致するか否かを判断する判断手段と、
前記判断手段が合致すると判断した条件と対になる分類情報を決定する第一決定手段と、
前記学習器を用いて、前記判断手段が前記いずれの条件にも合致しないと判断した特許情報の分類情報を、機械学習の予測処理により取得する第二決定手段とを具備する分類情報決定方法。
コンピュータに、
請求項１から請求項３いずれか一項に記載のアルゴリズム決定装置が行うすべての処理を実行させるためのプログラム。
コンピュータに、
請求項４記載の学習器の生産装置が行うすべての処理を実行させるためのプログラム。
コンピュータに、
請求項５または請求項６記載の特許分類装置が行うすべての処理を実行させるためのプログラム。
特許情報と当該特許情報の分類情報とを有する２以上の特許分類情報を有する学習元情報を用いて、機械学習の学習処理を行い、取得された学習器が格納される学習器格納部、および特許に関する一の条件と特許情報の分類情報との組である１以上の条件情報が格納される条件情報格納部にアクセス可能なコンピュータを、
１以上の特許情報を受け付ける特許情報受付部と、
前記１以上の条件情報を用いて、前記１以上の各特許情報の分類情報を特定する予測分類情報を取得する予測部と、
前記予測分類情報を出力する出力部として機能させ、
前記予測部は、
前記１以上の各特許情報が、前記１以上の各条件情報が有する条件のうちいずれかの条件に合致するか否かを判断する判断手段と、
前記判断手段が合致すると判断した条件と対になる分類情報を決定する第一決定手段と、
前記学習器を用いて、前記判断手段が前記いずれの条件にも合致しないと判断した特許情報の分類情報を、機械学習の予測処理により取得する第二決定手段とを具備するプログラム。