ComenzarEmpieza gratis

Binarizar columnas

Aunque a menudo se pueden usar valores numéricos sin aplicar feature engineering, hay casos en los que alguna manipulación resulta útil. Por ejemplo, en algunas ocasiones puede que no te importe la magnitud de un valor, sino solo su dirección, o incluso simplemente si existe. En estas situaciones, te interesará binarizar una columna. En los datos de so_survey_df, hay muchas personas encuestadas que trabajan de forma voluntaria (sin remuneración). Vas a crear una columna nueva llamada Paid_Job que indique si cada persona cobra (su salario es mayor que cero).

Este ejercicio forma parte del curso

Ingeniería de características para Machine Learning en Python

Ver curso

Instrucciones del ejercicio

  • Crea una columna nueva llamada Paid_Job rellena con ceros.
  • Sustituye todos los valores de Paid_Job por 1 donde el ConvertedSalary correspondiente sea mayor que 0.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____

# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1

# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())
Editar y ejecutar código