Binarizar columnas
Aunque a menudo se pueden usar valores numéricos sin aplicar feature engineering, hay casos en los que alguna manipulación resulta útil. Por ejemplo, en algunas ocasiones puede que no te importe la magnitud de un valor, sino solo su dirección, o incluso simplemente si existe. En estas situaciones, te interesará binarizar una columna. En los datos de so_survey_df, hay muchas personas encuestadas que trabajan de forma voluntaria (sin remuneración). Vas a crear una columna nueva llamada Paid_Job que indique si cada persona cobra (su salario es mayor que cero).
Este ejercicio forma parte del curso
Ingeniería de características para Machine Learning en Python
Instrucciones del ejercicio
- Crea una columna nueva llamada
Paid_Jobrellena con ceros. - Sustituye todos los valores de
Paid_Jobpor 1 donde elConvertedSalarycorrespondiente sea mayor que 0.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____
# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1
# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())