CommencerCommencer gratuitement

Traitement des données manquantes

Il est important de traiter les données manquantes avant de commencer votre analyse.

Une approche consiste à ne pas tenir compte des valeurs manquantes si elles ne représentent qu'une faible proportion, généralement 5 %, de vos données.

En travaillant avec un ensemble de données sur les prix des billets d'avion, stocké dans un DataFrame pandas appelé planes, vous devrez compter le nombre de valeurs manquantes dans toutes les colonnes, calculer cinq pour cent de toutes les valeurs, utiliser ce seuil pour supprimer des observations et vérifier combien de valeurs manquantes restent dans l'ensemble de données.

Cet exercice fait partie du cours

Analyse de données exploratoires en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Count the number of missing values in each column
print(____)
Modifier et exécuter le code