ComeçarComece de graça

Binarizando colunas

Embora valores numéricos muitas vezes possam ser usados sem engenharia de atributos, há casos em que algum tipo de manipulação é útil. Por exemplo, em algumas situações, você pode não se importar com a magnitude de um valor, mas apenas com sua direção, ou se ele existe ou não. Nesses casos, você vai querer binarizar uma coluna. No conjunto de dados so_survey_df, há um grande número de respondentes trabalhando voluntariamente (sem remuneração). Você vai criar uma nova coluna chamada Paid_Job indicando se cada pessoa é paga (seu salário é maior que zero).

Este exercício faz parte do curso

Feature Engineering for Machine Learning in Python

Ver curso

Instruções do exercício

  • Crie uma nova coluna chamada Paid_Job preenchida com zeros.
  • Substitua todos os valores de Paid_Job por 1 onde o ConvertedSalary correspondente for maior que 0.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____

# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1

# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())
Editar e executar o código