Seleccionar características importantes
En este ejercicio, tu tarea es seleccionar solo las características más importantes que usará el modelo final. Recuerda que las importancias relativas están guardadas en la columna importance del DataFrame llamado relative_importances.
Este ejercicio forma parte del curso
Analítica de RR. HH.: Predicción de rotación de empleados en Python
Instrucciones del ejercicio
- Selecciona únicamente las características con un valor de
importancesuperior al 1%. - Crea una lista con esas características e imprímelas (esto ya está hecho por ti).
- Usando el índice guardado en
selected_list, transforma tantofeatures_traincomofeatures_testpara incluir únicamente las características con una importancia superior al 1%.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]
# create a list from those features: done
selected_list = selected_features.index
# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]