1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Smažeš je?

Než se pustíš do mazání chybějících hodnot, je potřeba zvážit, co k tomu vede. Nejjednodušším faktorem je velikost chybějících dat. Složitější příčiny mohou vyžadovat znalost dané domény. V tomto cvičení určíš důvod chybějících hodnot a pak provedeš odpovídající smazání.

Nejdřív použiješ msno.matrix() a msno.heatmap() k vizualizaci chybějících dat a korelace mezi proměnnými s chybějícími hodnotami. Pak zjistíš vzorce v chybějících datech a nakonec smažeš záznamy podle typu chybějících hodnot.

DataFrame diabetes je již načtený.

Místo plt.show() jsme použili proprietární funkci display(), aby se ti výstup zobrazoval pohodlněji.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vizualizuj matici chybějících hodnot v diabetes.