Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
交差確認とは - わかりやすく解説 Weblio辞書
[go: Go Back, main page]

交差確認とは? わかりやすく解説

Weblio 辞書 > 辞書・百科事典 > 百科事典 > 交差確認の意味・解説 

交差検証

(交差確認 から転送)

出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2025/12/18 04:24 UTC 版)

交差検証交差確認[1](こうさけんしょう、: cross-validation)とは、統計学において標本データを分割し、その一部をまず解析して、残る部分でその解析のテストを行い、解析自身の妥当性の検証・確認に当てる手法を指す[2][3][4]。データの解析(および導出された推定・統計的予測)がどれだけ本当に母集団に対処できるかを良い近似で検証・確認するための手法である。

最初に解析するデータを「訓練事例集合(training set、訓練データ)」などと呼び、他のデータを「テスト事例集合(testing set、テストデータ)」などと呼ぶ。

交差検証はSeymour Geisserが生み出した。特にそれ以上標本を集めるのが困難(危険だったり、コストがかかったり)な場合は、データから導いた推定は、交差検証などで慎重に裏付けを確認するべきである。

交差検証の主な種類

ホールドアウト検証

初期標本群から事例を無作為に選択してテスト事例を形成し、残る事例を訓練事例とする。テスト事例に使われるのは初期の標本群の3分の1以下の場合が多い[5]。ただし一般にホールドアウト検証は交差検証には分類されない。なぜなら、データを交差させることがないためである。

k-分割交差検証

観測値n=12、標本群k=3の場合のk-分割交差検証の図。データがシャッフルされた後、合計3モデルがトレーニングおよびテストされる。

英名では"

観測値n=8の場合のleave-one-out交差検証(LOOCV)の図。合計8つのモデルがトレーニングおよびテストされる。

leave-one-out cross-validation (LOOCV,一個抜き交差検証) は、標本群から1つの事例だけを抜き出してテスト事例とし、残りを訓練事例とする。これを全事例が一回ずつテスト事例となるよう検証を繰り返す。これはK-分割交差検証の K を標本サイズにした場合と同じである。ただし、LOOCV にはカーネル回帰英語版[要出典]やティホノフ正則化などと関連がある。

時系列の場合

時系列データの場合、 を訓練データの長さ、 をテストデータの長さとし、

  • x番目の訓練データの範囲:
  • x番目のテストデータの範囲:

上記になるようにテストデータが訓練データよりも未来の時刻になるようにスライディングウィンドウにて交差検証する方法がある。時系列は時間の流れで因果関係・相関関係があるため、テストデータは訓練データよりも未来の時刻にしないといけない。

また、以下のように訓練データを先頭から使い徐々に長くする方法もある。[7]

  • x番目の訓練データの範囲:
  • x番目のテストデータの範囲:

誤差見積り

パラメータ推定誤差は計算で求めることができる。平均平方誤差(MSE)は分散、平均平方二乗誤差(RMSE)は標準偏差に用いられる。

注意点

交差検証を使い、モデル選択やハイパーパラメータの決定が行われるが、この行為自体は、訓練データ+テストデータ全体に対して過剰適合を招き、交差検証の結果自体は信用できない結果となる[8]。特定の公開データセットに対して、新しい機械学習のモデルで交差検証の結果が改善したという論文発表が多数あるが、そのような手法はその公開データセットに対する過剰適合の可能性がある。

脚注

  1. ^ 交差検定と呼ばれる場合もあるが,統計学では検定はtestの訳語として用いられ,validationの訳語には検証か確認が用いられる
  2. ^ Kohavi, Ron (1995). “A study of cross-validation and bootstrap for accuracy estimation and model selection”. Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence 2 (12): 1137–1143. (Morgan Kaufmann, San Mateo)
  3. ^ Chang, J., Luo, Y., and Su, K. 1992. GPSM: a Generalized Probabilistic Semantic Model for ambiguity resolution. In Proceedings of the 30th Annual Meeting on Association For Computational Linguistics (Newark, Delaware, June 28 - July 02, 1992). Annual Meeting of the ACL. Association for Computational Linguistics, Morristown, NJ, 177-184
  4. ^ Devijver, P. A., and J. Kittler, Pattern Recognition: A Statistical Approach, Prentice-Hall, London, 1982
  5. ^ Tutorial 12”. Decision Trees Interactive Tutorial and Resources. 2006年6月23日時点のオリジナルよりアーカイブ。2006年6月21日閲覧。
  6. ^ k分割交差検証で精度向上”. AI用語解説 AIコンパス (2025年1月31日). 2025年11月6日閲覧。
  7. ^ 3.1.2.5. Cross validation of time series data - 3.1. Cross-validation: evaluating estimator performance — scikit-learn documentation
  8. ^ 1506.02629 Generalization in Adaptive Data Analysis and Holdout Reuse

外部リンク




英和和英テキスト翻訳

英語⇒日本語日本語⇒英語

辞書ショートカット

すべての辞書の索引

「交差確認」の関連用語

交差確認のお隣キーワード
検索ランキング

   

英語⇒日本語
日本語⇒英語
   



交差確認のページの著作権
Weblio 辞書 情報提供元は 参加元一覧 にて確認できます。

   
ウィキペディアウィキペディア
All text is available under the terms of the GNU Free Documentation License.
この記事は、ウィキペディアの交差検証 (改訂履歴)の記事を複製、再配布したものにあたり、GNU Free Documentation Licenseというライセンスの下で提供されています。 Weblio辞書に掲載されているウィキペディアの記事も、全てGNU Free Documentation Licenseの元に提供されております。

©2026 GRAS Group, Inc.RSS