1. Learn
  2. /
  3. Cursuri
  4. /
  5. Monitorizarea Machine Learning în Python

Connected

exercițiu

Driftul în setul de date pentru rezervări hoteliere

În capitolul anterior, ai calculat valoarea de business și performanța ROC AUC pentru un model care prezice anulările de rezervări. Ai observat câteva alerte în graficele rezultate, motiv pentru care trebuie să investighezi prezența driftului în datele de analiză.

În acest exercițiu, vei inițializa metoda de detectare a driftului multivariat și vei compara rezultatele sale cu rezultatele de performanță calculate în capitolul anterior.

StandardDeviationThreshold este deja importat, împreună cu rezultatele pentru valoarea de business și ROC AUC stocate în variabila perf_results, iar feature_column_names este deja definit.

Instrucțiuni

100 XP
  • Inițializează metoda StandardDeviationThreshold și setează parametrii std_lower_multiplier la 2 și std_upper_multiplier la 1.
  • Adaugă următoarele nume de caracteristici: country, lead_time, parking_spaces și hotel. Păstrează ordinea lor.
  • Transmite pragurile și numele caracteristicilor definite anterior către DataReconstructionDriftCalculator.
  • Afișează graficul comparativ care include atât rezultatele detectării driftului multivariat (mv_results), cât și rezultatele de performanță (perf_results).