1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Monitoring Machine Learning in Python

Connected

cvičení

Drift v datasetu hotelových rezervací

V předchozí kapitole jsi pro model predikující zrušení rezervací vypočítal/a obchodní hodnotu a výkonnostní metriku ROC AUC. V výsledných grafech ses všiml/a několika upozornění – proto je teď potřeba prověřit, zda se v analytických datech vyskytuje drift.

V tomto cvičení inicializuješ metodu pro detekci multivariátního driftu a porovnáš její výsledky s výsledky výkonnosti z předchozí kapitoly.

StandardDeviationThreshold je již importován, obchodní hodnota a výsledky ROC AUC jsou uloženy v proměnné perf_results a feature_column_names je již definováno.

Pokyny

100 XP
  • Inicializuj metodu StandardDeviationThreshold a nastav parametry std_lower_multiplier na 2 a std_upper_multiplier na 1.
  • Přidej následující názvy příznaků: country, lead_time, parking_spaces a hotel. Zachovej jejich pořadí.
  • Předej dříve definované prahové hodnoty a názvy příznaků do DataReconstructionDriftCalculator.
  • Zobraz porovnávací graf obsahující výsledky multivariátní detekce driftu (mv_results) i výsledky výkonnosti (perf_results).