Comece agoraComece grátis

Avaliação do Random Forest

Neste exercício final, você avaliará os resultados da validação cruzada em um modelo Random Forest.

Os seguintes já foram criados:

  • cv - um validador cruzado que já tenha sido ajustado aos dados de treinamento
  • evaluator - um objeto BinaryClassificationEvaluator e
  • flights_test - os dados de teste.

Este exercicio faz parte do curso

Machine learning com PySpark

Ver curso

Instruções do exercicio

  • Imprima uma lista de métricas AUC médias em todos os modelos na grade de parâmetros.
  • Exiba a AUC média para o melhor modelo. Esse será o maior AUC da lista.
  • Imprima uma explicação dos parâmetros maxDepth e featureSubsetStrategy para o melhor modelo.
  • Exiba o AUC para as melhores previsões de modelo nos dados de teste.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Average AUC for each parameter combination in grid
print(cv.____)

# Average AUC for the best model
print(____(____))

# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))

# AUC for best model on testing data
print(evaluator.____(____.____(____)))
Editar e Executar Código