1. 学ぶ
  2. /
  3. コース
  4. /
  5. End-to-End Machine Learning

Connected

演習

Kolmogorov-Smirnov 検定によるデータドリフトの検出

心疾患予測モデルをデプロイした後、パフォーマンスと入力データを継続的に監視してきました。2月に収集した最新データでは、いくつかの主要特徴量の分布が、1月に学習に使ったデータと少し異なって見えます。このような差異はモデル性能に影響する可能性があるため、早期に検出して対処することが重要です。

この演習では、Kolmogorov-Smirnov(K-S)検定を使って、1月と2月のデータセット間にデータドリフトの兆候がないかを検出します。サンプルデータセット january_data と february_data はすでに読み込まれています。

指示

100 XP
  • scipy.stats モジュールから ks_2samp 関数をインポートします。
  • 提供されたサンプルデータセット january_data と february_data を用いて Kolmogorov-Smirnov 検定を実行し、検定統計量と p-value を計算します。
  • p-value が 0.05 未満であればデータドリフトありと判断します。データドリフトが検出された場合は "Data drift detected."、検出されなかった場合は "No data drift detected." と出力してください。