1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Manipulace s daty v pandas

Connected

Cvičení

Nahrazování chybějících hodnot

Další způsob, jak zacházet s chybějícími hodnotami, je nahradit je všechny stejnou hodnotou. U numerických proměnných je jednou z možností nahradit chybějící hodnoty nulou — to uděláš i tady. Při nahrazování chybějících hodnot ale vždy předpokládáš něco o tom, co taková chybějící hodnota znamená. V tomto případě budeme předpokládat, že chybějící počet prodaných kusů znamená, že se daný typ avokáda v daném týdnu vůbec neprodával.

V tomto cvičení uvidíš, jak nahrazování chybějících hodnot ovlivňuje rozložení proměnné pomocí histogramů. Histogramy pro více proměnných najednou vykreslíš takto:

dogs[["height_cm", "weight_kg"]].hist()

pandas byl naimportován jako pd a matplotlib.pyplot jako plt. Dataset avocados_2016 je k dispozici.

Pokyny 1/2

undefined XP
    1
    2
  • Byl vytvořen seznam cols_with_missing obsahující názvy sloupců s chybějícími hodnotami: "small_sold", "large_sold" a "xl_sold".
  • Vytvoř histogram těchto sloupců.
  • Zobraz graf.