1. Nauka
  2. /
  3. Kursy
  4. /
  5. Braki danych w Pythonie

Connected

ćwiczenie

Rozpoznaj MNAR

W poprzednim ćwiczeniu identyfikowałeś(-aś) rodzaj brakujących wartości na podstawie podsumowania braków danych. W tym ćwiczeniu pójdziesz o krok dalej i jednoznacznie zidentyfikujesz dane typu Missing Not at Random (MNAR – brakujące nielosowo).

Podsumowanie braków danych dla ramki danych diabetes wygląda następująco.

Twoim celem jest posortowanie ramki danych diabetes według kolumny Serum_Insulin i zbadanie korelacji między Skin_Fold a Serum_Insulin.

Uwaga: zamiast plt.show() używamy zastrzeżonej funkcji display(), która ułatwia podgląd wyników.

Instrukcje

100 XP
  • Zaimportuj pakiet missingno jako msno.
  • Posortuj wartości kolumny Serum_Insulin w ramce danych diabetes.
  • Zwizualizuj podsumowanie braków danych dla Serum_Insulin za pomocą msno.matrix().