CommencerCommencer gratuitement

Remplacer les valeurs manquantes cachées

Dans les deux exercices précédents, vous avez identifié et traité des valeurs manquantes lors de l’import d’un jeu de données. Dans cet exercice, vous allez identifier des valeurs manquantes cachées dans vos données et les traiter. Vous utiliserez le jeu de données diabetes, déjà chargé pour vous.

Le DataFrame diabetes contient des 0 dans la colonne BMI. Or, l’IMC (BMI) ne peut pas être égal à 0. Ces valeurs devraient être NaN. Dans cet exercice, vous apprendrez à repérer ce type d’anomalies. Vous effectuerez une analyse simple pour détecter et remplacer les valeurs manquantes. numpy et pandas ont été importés sous les alias np et pd respectivement.

Par ailleurs, n’hésitez pas à explorer le jeu de données en affichant par exemple .head(), .info(), etc., pour vous familiariser avec sa structure.

Cet exercice fait partie du cours

Gérer les données manquantes en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print the description of the data
print(___)
Modifier et exécuter le code