1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Předpovídání CTR pomocí Machine Learning v Pythonu

Connected

cvičení

Kontrola chybějících hodnot

Identifikace chybějících hodnot je pro analýzu klíčová. Pomocí stejné datové sady zjistíš celkový počet chybějících hodnot tak, že projdeš jak řádky, tak sloupce celého datasetu. Jakmile chybějící hodnoty najdeš, budeš potřebovat další metody, jak s nimi naložit – například Imputer ze sklearn. Chybějící hodnoty je nutné ošetřit, jinak bude správná predikce CTR velmi obtížná.

Vzorová data ve formě DataFrame jsou načtena jako df. V pracovním prostředí máš k dispozici také pandas jako pd.

Pokyny

100 XP
  • Vypiš základní přehled sloupců pomocí .info().
  • Vypiš chybějící hodnoty podle sloupců s využitím .isnull() (nezapomeň na závorky!).
  • Vypiš celkový počet chybějících hodnot po řádcích pomocí axis = 1 a metody .sum().