1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gestionarea datelor lipsă în Python

Connected

exercițiu

Ștergi sau nu?

Înainte de a șterge valorile lipsă, trebuie să iei în considerare factorii care justifică această decizie. Cel mai simplu factor este dimensiunea datelor lipsă. Motivele mai complexe care influențează absența datelor pot necesita cunoștințe din domeniu. În acest exercițiu, vei identifica motivul pentru care datele lipsesc și vei aplica metoda de ștergere potrivită.

Vei folosi mai întâi msno.matrix() și msno.heatmap() pentru a vizualiza datele lipsă și corelația dintre variabilele cu valori absente. Apoi vei determina tiparul absenței datelor și, în final, vei șterge datele în funcție de tipul de absență identificat.

DataFrame-ul diabetes a fost deja încărcat pentru tine.

Reține că am folosit o funcție proprietară display() în locul plt.show() pentru a-ți face mai ușoară vizualizarea rezultatelor.

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Vizualizează matricea datelor lipsă din diabetes.