Un bosque de árboles de decisión
En este ejercicio vas a practicar con el Árbol de Decisión con bootstrap, también conocido como Random Forest. Como hiciste en el ejercicio anterior, después compararás su exactitud con la de un modelo al que le has ajustado los hiperparámetros con validación cruzada.
Esta vez ajustarás un hiperparámetro adicional, max_features, que le indica a tu modelo cuántas características utilizar. Cuando no se especifica, su valor por defecto es auto. Algo a recordar para una entrevista es que los Árboles de Decisión consideran todas las características por defecto, mientras que los Random Forest suelen considerar la raíz cuadrada del número de características.
La matriz de características X, la etiqueta objetivo y y train_test_split de sklearn.model_selection ya se han importado por ti.
Este ejercicio forma parte del curso
Practicing Machine Learning Interview Questions in Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import modules
from sklearn.ensemble import ____
from sklearn.metrics import accuracy_score
# Train/test split
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=0.30, random_state=123)
# Instantiate, Fit, Predict
loans_rf = ____()
loans_rf.____(____, ____)
y_pred = loans_rf.____(____)
# Evaluation metric
print("Random Forest Accuracy: {}".format(____(____,____)))