Avaliação do Random Forest
Neste exercício final, você avaliará os resultados da validação cruzada em um modelo Random Forest.
Os seguintes já foram criados:
cv
- um validador cruzado que já tenha sido ajustado aos dados de treinamentoevaluator
- um objetoBinaryClassificationEvaluator
eflights_test
- os dados de teste.
Este exercício faz parte do curso
Aprendizado de máquina com PySpark
Instruções de exercício
- Imprima uma lista de métricas médias de AUC em todos os modelos na grade de parâmetros.
- Exiba a média AUC para o melhor modelo. Esse será o maior AUC da lista.
- Imprima uma explicação dos parâmetros
maxDepth
efeatureSubsetStrategy
para o melhor modelo. - Exiba o endereço AUC para as melhores previsões de modelo nos dados de teste.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Average AUC for each parameter combination in grid
print(cv.____)
# Average AUC for the best model
print(____(____))
# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))
# AUC for best model on testing data
print(evaluator.____(____.____(____)))