Générer un nuage de points avec valeurs manquantes
Dans cet exercice, vous allez créer un nuage de points incluant à la fois des valeurs manquantes et non manquantes. Vous utiliserez la fonction fill_dummy_values() que vous avez créée dans l’exercice précédent pour renseigner des valeurs factices dans le DataFrame diabetes_dummy.
La nullité d’une colonne se calcule avec la méthode .isnull(). Elle renvoie une Series (pd.Series) de True ou False.
Pour attribuer des couleurs différentes aux valeurs manquantes et non manquantes, vous pouvez simplement combiner la nullité à l’aide de l’opération OU (|) sur les colonnes que vous tracez, ce qui donne :
True→ soitcol1, soitcol2, soit les deux valeurs sont manquantes.False→ aucune des valeurs decol1etcol2n’est manquante.
Le DataFrame diabetes et la fonction fill_dummy_values() ont été chargés pour votre usage.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Instructions
- Utilisez l’opération OU pour combiner la nullité de
Skin_FoldetBMI. - Renseignez les valeurs factices dans
diabetes_dummyà l’aide de la fonctionfill_dummy_values(). - Créez un nuage de points de
'BMI'en fonction de'Skin_Fold'; notez que Y en fonction de X implique l’axe Y contre l’axe X.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Use OR operation to combine Skin_Fold and BMI nullity
nullity = ___
# Fill dummy values in diabetes_dummy
diabetes_dummy = ___
# Create a scatter plot of BMI versus Skin_Fold
diabetes_dummy.plot(x=___, y=___, kind='___', alpha=0.5,
# Set color to nullity of BMI and Skin_Fold
c=___,
cmap='rainbow')
plt.show()