Détecter les valeurs manquantes
Les jeux de données contiennent souvent des valeurs manquantes masquées par des codes comme 'NA', '.' ou d’autres. Dans cet exercice, vous allez travailler avec le jeu de données college qui regroupe diverses informations sur des étudiants. Votre objectif est d’identifier les valeurs manquantes en analysant le jeu de données.
Pour ce faire, vous pouvez utiliser la méthode .info() de pandas et la fonction sort() de numpy avec la méthode .unique() afin de repérer clairement la valeur factice qui représente les données manquantes.
Le fichier college.csv a été chargé pour vous. Les packages numpy et pandas ont déjà été importés sous les alias np et pd respectivement.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Read the dataset 'college.csv'
college = ___
print(college.head())