ComeçarComece gratuitamente

Avaliação do Random Forest

Neste exercício final, você avaliará os resultados da validação cruzada em um modelo Random Forest.

Os seguintes já foram criados:

  • cv - um validador cruzado que já tenha sido ajustado aos dados de treinamento
  • evaluator - um objeto BinaryClassificationEvaluator e
  • flights_test - os dados de teste.

Este exercício faz parte do curso

Aprendizado de máquina com PySpark

Ver Curso

Instruções de exercício

  • Imprima uma lista de métricas médias de AUC em todos os modelos na grade de parâmetros.
  • Exiba a média AUC para o melhor modelo. Esse será o maior AUC da lista.
  • Imprima uma explicação dos parâmetros maxDepth e featureSubsetStrategy para o melhor modelo.
  • Exiba o endereço AUC para as melhores previsões de modelo nos dados de teste.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Average AUC for each parameter combination in grid
print(cv.____)

# Average AUC for the best model
print(____(____))

# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))

# AUC for best model on testing data
print(evaluator.____(____.____(____)))
Editar e executar código