1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Pythonで学ぶ機械学習のモニタリング

Connected

Bài tập

要約統計量

前のレッスンで、NannyML が特徴量の統計的な変化を追跡するために5つの方法を提供していることを学びました。

この演習では、Hotel Booking データセットの lead_time 特徴量に注目します。これは、どれだけ前もって予約が行われたか(日数)を表します。合計、中央値、標準偏差といった統計量を使うことで、顧客の予約行動が時間とともにどのように変化したかを把握できます。

なお、リファレンス期間と分析期間のデータセット、そして nannyml ライブラリは、すでに読み込まれており、そのまま使用できます。

Hướng dẫn 1/3

undefined XP
  • 1
    • 解析対象の列を lead time に設定し、SummaryStatsSumCalculator を初期化して、analyzed_column を column_names パラメータに渡します。
  • 2
    • SummaryStatsMedianCalculator を初期化し、analyzed_column を column_names パラメータに渡し、結果を分析期間のみにフィルタリングします。
  • 3
    • SummaryStatsStdCalculator を初期化します。