1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gestionarea datelor lipsă în Python

Connected

exercițiu

Identifică MNAR

În exercițiul anterior, ai lucrat la identificarea tipului de valori lipsă pe baza sumarului de valori lipsă. În acest exercițiu, vei continua în aceeași direcție pentru a identifica cu certitudine datele care sunt Missing Not at Random (MNAR).

Sumarul valorilor lipsă pentru DataFrame-ul diabetes este prezentat mai jos.

Obiectivul tău este să sortezi DataFrame-ul diabetes după Serum_Insulin și să identifici corelația dintre Skin_Fold și Serum_Insulin.

Reține că am folosit o funcție proprietară display() în locul plt.show(), pentru a-ți face mai ușoară vizualizarea rezultatelor.

Instrucțiuni

100 XP
  • Importă pachetul missingno ca msno.
  • Sortează valorile coloanei Serum_Insulin din diabetes.
  • Vizualizează sumarul valorilor lipsă pentru Serum_Insulin folosind msno.matrix().