CommencerCommencer gratuitement

Binariser des colonnes

Même si les valeurs numériques peuvent souvent être utilisées sans ingénierie des caractéristiques, il existe des cas où une transformation est utile. Par exemple, il arrive que l’on ne s’intéresse pas à l’ampleur d’une valeur, mais seulement à son signe, ou au simple fait qu’elle existe. Dans ces situations, vous voudrez binariser une colonne. Dans les données so_survey_df, de nombreux répondants au sondage travaillent bénévolement (sans rémunération). Vous allez créer une nouvelle colonne appelée Paid_Job indiquant si chaque personne est payée (son salaire est supérieur à zéro).

Cet exercice fait partie du cours

Feature engineering pour le Machine Learning en Python

Afficher le cours

Instructions

  • Créez une nouvelle colonne appelée Paid_Job remplie de zéros.
  • Remplacez toutes les valeurs de Paid_Job par 1 lorsque la valeur correspondante de ConvertedSalary est supérieure à 0.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____

# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1

# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())
Modifier et exécuter le code