1. 学ぶ
  2. /
  3. コース
  4. /
  5. Monitorowanie uczenia maszynowego w Pythonie

Connected

演習

Dryf w zbiorze danych dotyczącym rezerwacji hotelowych

W poprzednim rozdziale obliczyłeś wartość biznesową i wydajność mierzoną wskaźnikiem ROC AUC dla modelu przewidującego anulowania rezerwacji. Na wynikowych wykresach zauważyłeś kilka alertów, dlatego teraz warto zbadać, czy w danych analitycznych występuje dryf.

W tym ćwiczeniu zainicjujesz metodę wielowymiarowego wykrywania dryfu i porównasz jej wyniki z wynikami wydajności obliczonymi w poprzednim rozdziale.

StandardDeviationThreshold jest już zaimportowany wraz z wartością biznesową, a wyniki ROC AUC są przechowywane w zmiennej perf_results. Zdefiniowana jest też zmienna feature_column_names.

指示

100 XP
  • Zainicjuj metodę StandardDeviationThreshold i ustaw parametry std_lower_multiplier na 2, a std_upper_multiplier na 1.
  • Dodaj następujące nazwy cech: country, lead_time, parking_spaces i hotel. Zachowaj ich kolejność.
  • Przekaż wcześniej zdefiniowane progi i nazwy cech do DataReconstructionDriftCalculator.
  • Wyświetl wykres porównawczy zawierający zarówno wyniki wielowymiarowego wykrywania dryfu (mv_results), jak i wyniki wydajności (perf_results).