Avaliação do Random Forest
Neste exercício final, você avaliará os resultados da validação cruzada em um modelo Random Forest.
Os seguintes já foram criados:
cv- um validador cruzado que já tenha sido ajustado aos dados de treinamentoevaluator- um objetoBinaryClassificationEvaluatoreflights_test- os dados de teste.
Este exercício faz parte do curso
Machine learning com PySpark
Instruções do exercício
- Imprima uma lista de métricas AUC médias em todos os modelos na grade de parâmetros.
- Exiba a AUC média para o melhor modelo. Esse será o maior AUC da lista.
- Imprima uma explicação dos parâmetros
maxDepthefeatureSubsetStrategypara o melhor modelo. - Exiba o AUC para as melhores previsões de modelo nos dados de teste.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Average AUC for each parameter combination in grid
print(cv.____)
# Average AUC for the best model
print(____(____))
# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))
# AUC for best model on testing data
print(evaluator.____(____.____(____)))