CommencerCommencer gratuitement

Générer un nuage de points avec valeurs manquantes

Dans cet exercice, vous allez créer un nuage de points incluant à la fois des valeurs manquantes et non manquantes. Vous utiliserez la fonction fill_dummy_values() que vous avez créée dans l’exercice précédent pour renseigner des valeurs factices dans le DataFrame diabetes_dummy.

La nullité d’une colonne se calcule avec la méthode .isnull(). Elle renvoie une Series (pd.Series) de True ou False.

Pour attribuer des couleurs différentes aux valeurs manquantes et non manquantes, vous pouvez simplement combiner la nullité à l’aide de l’opération OU (|) sur les colonnes que vous tracez, ce qui donne :

  • True → soit col1, soit col2, soit les deux valeurs sont manquantes.
  • False → aucune des valeurs de col1 et col2 n’est manquante.

Le DataFrame diabetes et la fonction fill_dummy_values() ont été chargés pour votre usage.

Cet exercice fait partie du cours

Gérer les données manquantes en Python

Afficher le cours

Instructions

  • Utilisez l’opération OU pour combiner la nullité de Skin_Fold et BMI.
  • Renseignez les valeurs factices dans diabetes_dummy à l’aide de la fonction fill_dummy_values().
  • Créez un nuage de points de 'BMI' en fonction de 'Skin_Fold' ; notez que Y en fonction de X implique l’axe Y contre l’axe X.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Use OR operation to combine Skin_Fold and BMI nullity
nullity = ___

# Fill dummy values in diabetes_dummy
diabetes_dummy = ___

# Create a scatter plot of BMI versus Skin_Fold
diabetes_dummy.plot(x=___, y=___, kind='___', alpha=0.5,                     
                    # Set color to nullity of BMI and Skin_Fold
                    c=___, 
                    cmap='rainbow')

plt.show()
Modifier et exécuter le code