Valeurs manquantes
Il est très rare de trouver un jeu de données sans aucune valeur manquante. Dans pandas, les valeurs manquantes sont représentées par NaN. Vous pouvez utiliser la fonction pandas isnull() pour vérifier la présence de valeurs manquantes.
pd.isnull(df['column']) retournera True si la valeur est manquante,
ou False si aucune valeur n’est manquante.
Par rapport à R, les valeurs manquantes se comportent un peu différemment en Python.
Par exemple, la méthode .mean() ignore automatiquement les valeurs manquantes en Python.
Vous pouvez aussi recoder les valeurs manquantes avec la méthode .fillna(). Celle-ci remplacera toutes les valeurs manquantes de la colonne par la valeur fournie.
Dans cet exercice, nous avons modifié le jeu de données tips afin qu’il contienne quelques valeurs manquantes.
Cet exercice fait partie du cours
Python pour les utilisateurs de R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print the rows where total_bill is missing
print(tips.loc[____(____)])