1. Learn
  2. /
  3. Courses
  4. /
  5. Monitoring Machine Learning in Python

Connected

Exercise

Kontrola kvality dat

Jak ses dozvěděl/a v předchozím videu, chybějící hodnoty mohou vést ke ztrátě cenných informací a potenciálně i k nesprávným interpretacím. Podobně může přítomnost neznámých hodnot ovlivnit spolehlivost tvého modelu.

V tomto cvičení je tvým cílem prozkoumat, zda dataset hotelových rezervací obsahuje chybějící hodnoty, a identifikovat případné neznámé hodnoty. Referenční i analytický dataset jsou již načteny spolu s knihovnou nannyml.

Rychlá připomínka: pokud si nepamatuješ typy sloupců, snadno si data prohlédneš pomocí metody .head().

Instructions 1/2

undefined XP
  • 1
    • Inicializuj kalkulátor chybějících hodnot, předej vybrané sloupce parametru column_names a nastav chunk_period na měsíční frekvenci.
  • 2
    • Přidej názvy dvou kategorických sloupců country a hotel, inicializuj kalkulátor neznámých hodnot a předej categorical_columns parametru column names.