CommencerCommencer gratuitement

Créer une variable indicatrice de valeur manquante

On vous donne un basetable contenant une variable prédictive "total_donations" qui correspond au nombre total de dons effectués par un donateur. Cette variable peut contenir des valeurs manquantes, ce qui indique que le donateur n’a encore jamais fait de don. C’est une information importante en soi, il est donc pertinent de créer une variable "no_donations" indiquant si "total_donations" est manquante.

Cet exercice fait partie du cours

Analytique prédictive intermédiaire en Python

Afficher le cours

Instructions

  • Créez une nouvelle colonne "no_donations" dans basetable qui prend la valeur 1 si total_donations est manquante et 0 sinon.
  • Calculez le nombre de valeurs manquantes dans total_donations et affectez-le à number_na.
  • Affichez le pourcentage de valeurs manquantes.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create dummy indicating missing values
basetable["____"] = pd.Series([____ if b else ____ for b in basetable["total_donations"].isna()])

# Calculate number of missing values
number_na = sum(____["no_donations"] == ____)

# Calculate percentage of missing values
print(round(____ / ____(____), 2))
Modifier et exécuter le code