Explorando los hiperparámetros de Random Forest
Entender qué hiperparámetros hay disponibles y el impacto de cada uno es una habilidad clave para cualquier data scientist. A medida que los modelos se vuelven más complejos, hay muchos ajustes posibles, pero solo algunos tendrán un gran efecto en tu modelo.
Ahora vas a evaluar un modelo existente de random forest (¡tiene algunas malas elecciones de hiperparámetros!) y luego tomarás mejores decisiones para un nuevo random forest y evaluarás su rendimiento.
Tendrás disponible:
- DataFrames
X_train,X_test,y_train,y_test - Un estimador de random forest ya entrenado,
rf_clf_old - Las predicciones del random forest existente sobre el conjunto de prueba,
rf_old_predictions
Este ejercicio forma parte del curso
Ajuste de hiperparámetros en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print out the old estimator, notice which hyperparameter is badly set
print(____)
# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
confusion_matrix(____, ____),
accuracy_score(____, ____)))