Uma floresta de árvores de decisão
Neste exercício, você vai praticar o uso da Árvore de Decisão com bootstrap, também conhecida como Random Forest. Como no exercício anterior, depois você vai comparar a acurácia com a de um modelo em que os hiperparâmetros foram ajustados com validação cruzada.
Desta vez, você vai ajustar um hiperparâmetro adicional, max_features, que permite ao seu modelo decidir quantas variáveis utilizar. Quando não é definido explicitamente, o valor padrão é auto. Algo para lembrar em uma entrevista: Árvores de Decisão consideram todas as variáveis por padrão, enquanto Random Forests geralmente consideram a raiz quadrada do número de variáveis.
A matriz de atributos X, o rótulo alvo y e train_test_split de sklearn.model_selection já foram importados para você.
Este exercício faz parte do curso
Praticando perguntas de entrevista de Machine Learning em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import modules
from sklearn.ensemble import ____
from sklearn.metrics import accuracy_score
# Train/test split
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=0.30, random_state=123)
# Instantiate, Fit, Predict
loans_rf = ____()
loans_rf.____(____, ____)
y_pred = loans_rf.____(____)
# Evaluation metric
print("Random Forest Accuracy: {}".format(____(____,____)))