Remplacer les valeurs manquantes
Dans l’exercice précédent, vous avez analysé le jeu de données des universités et identifié que '.' représentait une valeur manquante dans les données. Dans cet exercice, vous allez voir la meilleure façon de traiter ce type de valeurs avec le module pandas.
Vous apprendrez à gérer ces valeurs lors de l’import d’un fichier CSV dans pandas grâce à la fonction read_csv() et à son paramètre na_values, qui vous permet d’indiquer quelles sont les valeurs manquantes du DataFrame.
Le jeu de données est disponible sous le nom college.csv. pandas et numpy ont déjà été importés sous les alias pd et np respectivement.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Read the dataset 'college.csv' with na_values set to '.'
college = pd.read_csv(___, ___)
print(college.head())