ComenzarEmpieza gratis

Seleccionar características importantes

En este ejercicio, tu tarea es seleccionar solo las características más importantes que usará el modelo final. Recuerda que las importancias relativas están guardadas en la columna importance del DataFrame llamado relative_importances.

Este ejercicio forma parte del curso

Analítica de RR. HH.: Predicción de rotación de empleados en Python

Ver curso

Instrucciones del ejercicio

  • Selecciona únicamente las características con un valor de importance superior al 1%.
  • Crea una lista con esas características e imprímelas (esto ya está hecho por ti).
  • Usando el índice guardado en selected_list, transforma tanto features_train como features_test para incluir únicamente las características con una importancia superior al 1%.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]

# create a list from those features: done
selected_list = selected_features.index

# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]
Editar y ejecutar código