Binarizzare le colonne
Sebbene i valori numerici possano spesso essere usati senza alcun feature engineering, ci sono casi in cui qualche manipolazione è utile. Ad esempio, a volte potresti non preoccuparti della grandezza di un valore, ma solo della sua direzione, o addirittura della sua semplice esistenza. In queste situazioni, vorrai binarizzare una colonna. Nei dati so_survey_df, hai un gran numero di rispondenti al sondaggio che lavorano volontariamente (senza retribuzione). Creerai una nuova colonna chiamata Paid_Job che indica se ciascuna persona è retribuita (il suo stipendio è maggiore di zero).
Questo esercizio fa parte del corso
Feature Engineering per il Machine Learning in Python
Istruzioni dell'esercizio
- Crea una nuova colonna chiamata
Paid_Jobriempita con zeri. - Sostituisci tutti i valori di
Paid_Jobcon 1 dove il corrispondenteConvertedSalaryè maggiore di 0.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____
# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1
# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())