CommencerCommencer gratuitement

Analyser le pourcentage de valeurs manquantes

Avant de vous lancer dans le traitement des données manquantes, il est essentiel d’analyser les différents facteurs qui les entourent. La première étape consiste à quantifier le manque, c’est-à-dire le nombre de valeurs absentes pour une variable. Dans cet exercice, vous allez calculer le nombre total de valeurs manquantes par colonne et déterminer également le pourcentage de valeurs manquantes par colonne.

Dans cet exercice, vous chargerez le jeu de données 'airquality' en analysant la colonne Date, puis vous calculerez la somme des valeurs manquantes et le degré de manquants, en pourcentage, sur le DataFrame de nullité.

Cet exercice fait partie du cours

Gérer les données manquantes en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load the air-quality.csv dataset
airquality = pd.read_csv(___, parse_dates=[___], index_col=___)
Modifier et exécuter le code