Plotar curvas ROC
Você viu novamente que a boosted tree obteve o maior AUC. Números são ótimos, mas imagens falam mais! Que tal visualizar esses resultados?
Você vai ilustrar o desempenho dos modelos plotando todas as curvas ROC em um único gráfico. Como o AUC é literalmente a área sob essas curvas ROC, o modelo boosted deve ter a maior área sob sua curva e aparecer no canto superior esquerdo do gráfico.
O tibble de previsões, preds_combined, ainda está carregado.
Este exercício faz parte do curso
Machine Learning com modelos baseados em árvores em R
Instruções do exercício
- Reestruture o tibble
preds_combinedpara que todas as colunas que começam com"preds_"virem linhas em vez de colunas. Converta os nomes em uma coluna"model"e os valores em uma coluna chamada"predictions". - Agrupe os resultados por
model. - Calcule os valores da ROC para todos os cutoffs.
- Gere um gráfico das curvas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Reshape the predictions into long format
predictions_long <- tidyr::pivot_longer(___,
cols = starts_with("___"),
names_to = "___",
values_to = "___")
predictions_long %>%
# Group by model
___(___) %>%
# Calculate values for every cutoff
___(truth = ___,
estimate = ___) %>%
# Create a plot from the calculated data
___()