Uma floresta de árvores de decisão

Neste exercício, você vai praticar o uso da Árvore de Decisão com bootstrap, também conhecida como Random Forest. Como no exercício anterior, depois você vai comparar a acurácia com a de um modelo em que os hiperparâmetros foram ajustados com validação cruzada.

Desta vez, você vai ajustar um hiperparâmetro adicional, max_features, que permite ao seu modelo decidir quantas variáveis utilizar. Quando não é definido explicitamente, o valor padrão é auto. Algo para lembrar em uma entrevista: Árvores de Decisão consideram todas as variáveis por padrão, enquanto Random Forests geralmente consideram a raiz quadrada do número de variáveis.

A matriz de atributos X, o rótulo alvo y e train_test_split de sklearn.model_selection já foram importados para você.

Este exercicio faz parte do curso

Praticando perguntas de entrevista de Machine Learning em Python

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Import modules
from sklearn.ensemble import ____
from sklearn.metrics import accuracy_score

# Train/test split
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=0.30, random_state=123)

# Instantiate, Fit, Predict
loans_rf = ____() 
loans_rf.____(____, ____)
y_pred = loans_rf.____(____)

# Evaluation metric
print("Random Forest Accuracy: {}".format(____(____,____)))

Editar e Executar Código