1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Monitoring Machine Learning in Python

Connected

cvičení

Souhrnné statistiky

Z předchozí lekce víš, že NannyML nabízí pět metod pro sledování statistických změn ve tvých příznacích.

V tomto cvičení se zaměříš na příznak lead_time z datasetu Hotel Booking, který udává, kolik dní předem byla rezervace provedena. Pomocí statistik součtu, mediánu a směrodatné odchylky získáš cenné informace o tom, jak se chování zákazníků při rezervacích v průběhu času měnilo.

Poznamenej si, že referenční i analytická sada dat a také knihovna nannyml jsou již předem načtené a připravené k použití.

Instrukce 1/3

undefined XP
  • 1
    • Nastav analyzovaný sloupec na lead time, inicializuj SummaryStatsSumCalculator a předej analyzed_column parametru column names.
  • 2
    • Inicializuj SummaryStatsMedianCalculator, předej analyzed_column parametru column names a filtruj výsledky pouze pro analytické období.
  • 3
    • Inicializuj SummaryStatsStdCalculator.