Binarizando colunas
Embora valores numéricos muitas vezes possam ser usados sem engenharia de atributos, há casos em que algum tipo de manipulação é útil. Por exemplo, em algumas situações, você pode não se importar com a magnitude de um valor, mas apenas com sua direção, ou se ele existe ou não. Nesses casos, você vai querer binarizar uma coluna. No conjunto de dados so_survey_df, há um grande número de respondentes trabalhando voluntariamente (sem remuneração). Você vai criar uma nova coluna chamada Paid_Job indicando se cada pessoa é paga (seu salário é maior que zero).
Este exercício faz parte do curso
Feature Engineering for Machine Learning in Python
Instruções do exercício
- Crie uma nova coluna chamada
Paid_Jobpreenchida com zeros. - Substitua todos os valores de
Paid_Jobpor 1 onde oConvertedSalarycorrespondente for maior que 0.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____
# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1
# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())