1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Vytvoření bodového grafu s chybějícími hodnotami

V tomto cvičení vytvoříš bodový graf obsahující jak chybějící, tak dostupné hodnoty. Využiješ funkci fill_dummy_values(), kterou jsi vytvořil/a v předchozím cvičení – slouží k doplnění zástupných hodnot do DataFrame diabetes_dummy.

Chybějící hodnoty (nullita) sloupce se zjišťují pomocí metody .isnull(), která vrátí sérii (pd.Series) hodnot True nebo False.

Pro odlišení chybějících a dostupných hodnot různými barvami stačí zkombinovat nullitu pomocí operace OR (|) na vykreslovaných sloupcích. Výsledek je:

  • True \(\rightarrow\) Chybí hodnota sloupce col1, col2 nebo obou.
  • False \(\rightarrow\) Hodnoty sloupců col1 ani col2 nechybí.

DataFrame diabetes a funkce fill_dummy_values() jsou pro tebe již načteny.

Pokyny

100 XP
  • Pomocí operace OR zkombinuj nullitu sloupců Skin_Fold a BMI.
  • Doplň zástupné hodnoty do diabetes_dummy pomocí funkce fill_dummy_values().
  • Vytvoř bodový graf 'BMI' versus 'Skin_Fold'; Y versus X znamená, že Y je na svislé ose a X na vodorovné ose.