1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ機械学習のモニタリング

Connected

演習

ホテル予約データセットにおけるドリフト

前の章では、予約のキャンセルを予測するモデルについて、ビジネス価値と ROC AUC のパフォーマンスを計算しました。結果のプロットにいくつかのアラートが見られたため、分析データにドリフトが存在しないかを調査する必要があります。

この演習では、多変量ドリフト検知手法を初期化し、前の章で計算したパフォーマンス結果と比較します。

StandardDeviationThreshold はすでにインポート済みで、ビジネス価値と ROC AUC の結果は perf_results 変数に格納されています。また、feature_column_names も定義済みです。

指示

100 XP
  • StandardDeviationThreshold を初期化し、std_lower_multiplier を 2、std_upper_multiplier パラメータを 1 に設定します。
  • 次の特徴量名をこの順序で追加します: country, lead_time, parking_spaces, hotel。
  • 事前に定義したしきい値と特徴量名を DataReconstructionDriftCalculator に渡します。
  • 多変量ドリフト検知結果(mv_results)とパフォーマンス結果(perf_results)の両方を含む比較プロットを表示します。