1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Urči MNAR

V předchozím cvičení jsi identifikoval/a typy chybějících hodnot na základě přehledu missingness. V tomto cvičení budeš pokračovat a jednoznačně identifikuješ data, která jsou Missing Not at Random (MNAR).

Přehled chybějících hodnot pro DataFrame diabetes vypadá takto:

Tvým cílem je seřadit DataFrame diabetes podle sloupce Serum_Insulin a identifikovat závislost mezi sloupci Skin_Fold a Serum_Insulin.

Místo plt.show() používáme vlastní funkci display(), která ti usnadní zobrazení výstupu.

Pokyny

100 XP
  • Importuj balíček missingno jako msno.
  • Seřaď hodnoty sloupce Serum_Insulin v DataFrame diabetes.
  • Vizualizuj přehled chybějících hodnot pro Serum_Insulin pomocí msno.matrix().