1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Detekce chybějících hodnot

Datasety často obsahují chybějící hodnoty skryté za zástupnými řetězci jako 'NA', '.' nebo jinými. V tomto cvičení budeš pracovat s datasetem college, který obsahuje různé údaje o vysokoškolských studentech. Tvým úkolem je identifikovat chybějící hodnoty analýzou tohoto datasetu.

K tomu využiješ metodu .info() z pandas a funkci sort() z numpy spolu s metodou .unique(), abys jasně odlišil/a zástupné hodnoty reprezentující chybějící data.

Soubor college.csv je již načtený. Balíčky numpy a pandas jsou importované jako np a pd.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Načti CSV soubor datasetu do DataFrame v pandas.