IniziaInizia gratis

Binarizzare le colonne

Sebbene i valori numerici possano spesso essere usati senza alcun feature engineering, ci sono casi in cui qualche manipolazione è utile. Ad esempio, a volte potresti non preoccuparti della grandezza di un valore, ma solo della sua direzione, o addirittura della sua semplice esistenza. In queste situazioni, vorrai binarizzare una colonna. Nei dati so_survey_df, hai un gran numero di rispondenti al sondaggio che lavorano volontariamente (senza retribuzione). Creerai una nuova colonna chiamata Paid_Job che indica se ciascuna persona è retribuita (il suo stipendio è maggiore di zero).

Questo esercizio fa parte del corso

Feature Engineering per il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea una nuova colonna chiamata Paid_Job riempita con zeri.
  • Sostituisci tutti i valori di Paid_Job con 1 dove il corrispondente ConvertedSalary è maggiore di 0.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____

# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1

# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())
Modifica ed esegui il codice