Selecionando features importantes
Neste exercício, sua tarefa é selecionar apenas as features mais importantes que serão usadas pelo modelo final. Lembre-se de que as importâncias relativas estão salvas na coluna importance do DataFrame chamado relative_importances.
Este exercício faz parte do curso
HR Analytics: prevendo rotatividade de funcionários em Python
Instruções do exercício
- Selecione apenas as features com valor de
importancemaior que 1%. - Crie uma lista a partir dessas features e imprima (isso já foi feito para você).
- Usando o índice salvo em
selected_list, transformefeatures_trainefeatures_testpara incluir apenas as features com importância maior que 1%.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]
# create a list from those features: done
selected_list = selected_features.index
# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]