Explorando os hiperparâmetros de Random Forest
Entender quais hiperparâmetros estão disponíveis e o impacto de cada um é uma habilidade essencial para qualquer cientista de dados. À medida que os modelos ficam mais complexos, surgem muitas configurações possíveis, mas apenas algumas terão grande impacto no seu modelo.
Agora você vai avaliar um modelo existente de random forest (ele tem algumas escolhas ruins de hiperparâmetros!) e depois fazer escolhas melhores para um novo modelo de random forest e avaliar seu desempenho.
Você terá disponível:
- DataFrames
X_train,X_test,y_train,y_test - Um estimador de random forest pré-treinado,
rf_clf_old - As previsões do estimador de random forest existente no conjunto de teste,
rf_old_predictions
Este exercício faz parte do curso
Ajuste de Hiperparâmetros em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print out the old estimator, notice which hyperparameter is badly set
print(____)
# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
confusion_matrix(____, ____),
accuracy_score(____, ____)))