1. Nauka
  2. /
  3. Kursy
  4. /
  5. Monitorowanie uczenia maszynowego w Pythonie

Connected

ćwiczenie

Statystyki podsumowujące

Jak pamiętasz z poprzedniej lekcji, NannyML udostępnia pięć metod śledzenia zmian statystycznych w cechach modelu.

W tym ćwiczeniu skupisz się na analizie cechy lead_time ze zbioru danych Hotel Booking, która wskazuje, z jakim wyprzedzeniem (w dniach) dokonano rezerwacji. Korzystając ze statystyk sumy, mediany i odchylenia standardowego, możesz uzyskać cenne informacje o tym, jak zachowanie klientów przy rezerwacjach zmieniało się w czasie.

Zwróć uwagę, że zarówno zbiór referencyjny, jak i zbiór analityczny oraz biblioteka nannyml są już wczytane i gotowe do użycia.

Instrukcje 1/3

undefined XP
  • 1
    • Zdefiniuj analizowaną kolumnę jako lead_time, zainicjalizuj SummaryStatsSumCalculator i przekaż analyzed_column do parametru nazw kolumn.
  • 2
    • Zainicjalizuj SummaryStatsMedianCalculator, przekaż analyzed_column do parametru nazw kolumn i przefiltruj wyniki wyłącznie do okresu analitycznego.
  • 3
    • Zainicjalizuj SummaryStatsStdCalculator.