ComeçarComece de graça

Selecionando features importantes

Neste exercício, sua tarefa é selecionar apenas as features mais importantes que serão usadas pelo modelo final. Lembre-se de que as importâncias relativas estão salvas na coluna importance do DataFrame chamado relative_importances.

Este exercício faz parte do curso

HR Analytics: prevendo rotatividade de funcionários em Python

Ver curso

Instruções do exercício

  • Selecione apenas as features com valor de importance maior que 1%.
  • Crie uma lista a partir dessas features e imprima (isso já foi feito para você).
  • Usando o índice salvo em selected_list, transforme features_train e features_test para incluir apenas as features com importância maior que 1%.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]

# create a list from those features: done
selected_list = selected_features.index

# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]
Editar e executar o código