1. Aprende
  2. /
  3. Cursos
  4. /
  5. Gestionarea datelor lipsă în Python

Connected

Ejercicio

Generează un grafic scatter cu valorile lipsă

În acest exercițiu vei crea un grafic scatter care include atât valorile lipsă, cât și pe cele prezente. Vei folosi funcția fill_dummy_values(), creată în exercițiul anterior, pentru a completa valori fictive în DataFrame-ul diabetes_dummy.

Nulitatea unei coloane se calculează cu metoda .isnull(), care returnează o Serie (pd.Series) de valori True sau False.

Pentru a atribui culori diferite valorilor lipsă și celor prezente, poți combina nullitățile folosind operația SAU (|) pe coloanele reprezentate în grafic. Rezultatul va fi:

  • True \(\rightarrow\) Cel puțin una dintre valorile col1 sau col2 (sau ambele) lipsește.
  • False \(\rightarrow\) Niciuna dintre valorile col1 și col2 nu lipsește.

DataFrame-ul diabetes și funcția fill_dummy_values() sunt deja încărcate și disponibile.

Instrucciones

100 XP
  • Folosește operația SAU pentru a combina nullitatea coloanelor Skin_Fold și BMI.
  • Completează valorile fictive în diabetes_dummy folosind funcția fill_dummy_values().
  • Creează un grafic scatter pentru 'BMI' față de 'Skin_Fold'; reține că Y față de X înseamnă că Y este pe axa verticală, iar X pe cea orizontală (Y ca funcție de X).