ComeçarComece de graça

Explorando os hiperparâmetros de Random Forest

Entender quais hiperparâmetros estão disponíveis e o impacto de cada um é uma habilidade essencial para qualquer cientista de dados. À medida que os modelos ficam mais complexos, surgem muitas configurações possíveis, mas apenas algumas terão grande impacto no seu modelo.

Agora você vai avaliar um modelo existente de random forest (ele tem algumas escolhas ruins de hiperparâmetros!) e depois fazer escolhas melhores para um novo modelo de random forest e avaliar seu desempenho.

Você terá disponível:

  • DataFrames X_train, X_test, y_train, y_test
  • Um estimador de random forest pré-treinado, rf_clf_old
  • As previsões do estimador de random forest existente no conjunto de teste, rf_old_predictions

Este exercício faz parte do curso

Ajuste de Hiperparâmetros em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print out the old estimator, notice which hyperparameter is badly set
print(____)

# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
  	confusion_matrix(____, ____),
  	accuracy_score(____, ____))) 
Editar e executar o código