CommencerCommencer gratuitement

Détecter les valeurs manquantes

Les jeux de données contiennent souvent des valeurs manquantes masquées par des codes comme 'NA', '.' ou d’autres. Dans cet exercice, vous allez travailler avec le jeu de données college qui regroupe diverses informations sur des étudiants. Votre objectif est d’identifier les valeurs manquantes en analysant le jeu de données.

Pour ce faire, vous pouvez utiliser la méthode .info() de pandas et la fonction sort() de numpy avec la méthode .unique() afin de repérer clairement la valeur factice qui représente les données manquantes.

Le fichier college.csv a été chargé pour vous. Les packages numpy et pandas ont déjà été importés sous les alias np et pd respectivement.

Cet exercice fait partie du cours

Gérer les données manquantes en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Read the dataset 'college.csv'
college = ___
print(college.head())
Modifier et exécuter le code