Binariser des colonnes
Même si les valeurs numériques peuvent souvent être utilisées sans ingénierie des caractéristiques, il existe des cas où une transformation est utile. Par exemple, il arrive que l’on ne s’intéresse pas à l’ampleur d’une valeur, mais seulement à son signe, ou au simple fait qu’elle existe. Dans ces situations, vous voudrez binariser une colonne. Dans les données so_survey_df, de nombreux répondants au sondage travaillent bénévolement (sans rémunération). Vous allez créer une nouvelle colonne appelée Paid_Job indiquant si chaque personne est payée (son salaire est supérieur à zéro).
Cet exercice fait partie du cours
Feature engineering pour le Machine Learning en Python
Instructions
- Créez une nouvelle colonne appelée
Paid_Jobremplie de zéros. - Remplacez toutes les valeurs de
Paid_Jobpar 1 lorsque la valeur correspondante deConvertedSalaryest supérieure à 0.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____
# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1
# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())