Desarrolla y prueba el mejor modelo

En el Capítulo 3, viste que los siguientes parámetros permiten obtener un modelo mejor:

max_depth = 8,
min_samples_leaf = 150,
class_weight = "balanced"

En este capítulo, descubriste que algunas variables tienen un impacto despreciable. Te diste cuenta de que podías obtener predicciones precisas usando solo un pequeño número de variables seleccionadas y relevantes, y actualizaste tus conjuntos de entrenamiento y prueba en consecuencia, creando las variables features_train_selected y features_test_selected.

Con toda esta información, ahora vas a desarrollar el mejor modelo para predecir la rotación de empleados y evaluarlo con las métricas adecuadas.

Las variables features_train_selected y features_test_selected están disponibles en tu espacio de trabajo, y las funciones recall_score y roc_auc_score ya se han importado por ti.

Este ejercicio forma parte del curso

Analítica de RR. HH.: Predicción de rotación de empleados en Python

Ver curso

Instrucciones del ejercicio

Inicializa el mejor modelo usando los parámetros indicados en la descripción.
Ajusta el modelo usando solo las variables seleccionadas del conjunto de entrenamiento.
Realiza una predicción basada en las variables seleccionadas del conjunto de prueba.
Imprime las puntuaciones de exactitud, recall y ROC/AUC del modelo.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Initialize the best model using parameters provided in description
model_best = DecisionTreeClassifier(____=____, ____=____, ____=____, random_state=42)

# Fit the model using only selected features from training set: done
model_best.fit(____, target_train)

# Make prediction based on selected list of features from test set
prediction_best = model_best.____(____)

# Print the general accuracy of the model_best
print(____.score(features_test_selected, target_test) * 100)

# Print the recall score of the model predictions
print(____(target_test, prediction_best) * 100)

# Print the ROC/AUC score of the model predictions
print(roc_auc_score(target_test, ____) * 100)

Editar y ejecutar código