Comece agoraComece grátis

Random Forest: visualização

Agora você precisa plotar as previsões. Com o modelo de gradient boosted trees, você criou um gráfico de dispersão das respostas previstas vs. respostas reais e um gráfico de densidade dos resíduos. Agora você vai adaptar esses gráficos para exibir os resultados de ambos os modelos ao mesmo tempo.

Este exercicio faz parte do curso

Introdução ao Spark com sparklyr em R

Ver curso

Instruções do exercicio

Um tibble local both_responses, contendo anos previstos e reais para ambos os modelos, já foi predefinido.

  • Atualize o gráfico de dispersão de resposta prevista vs. real.
    • Use o conjunto de dados both_responses.
    • Adicione uma estética de cor para desenhar cada modelo em uma cor diferente. Use color = model.
    • Em vez de desenhar os pontos, use geom_smooth() para desenhar uma curva suavizada para cada modelo.
  • Crie um tibble de resíduos, chamado residuals.
    • Chame mutate() em both_responses.
    • A nova coluna deve se chamar residual.
    • residual deve ser igual à resposta prevista menos a resposta real.
  • Atualize o gráfico de densidade dos resíduos.
    • Adicione uma estética de cor para desenhar cada modelo em uma cor diferente.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# both_responses has been pre-defined
both_responses

# Draw a scatterplot of predicted vs. actual
ggplot(___, aes(actual, predicted, ___)) +
  # Add a smoothed line
  ___ +
  # Add a line at actual = predicted
  geom_abline(intercept = 0, slope = 1)

# Create a tibble of residuals
residuals <- ___

# Draw a density plot of residuals
ggplot(residuals, aes(residual, ___)) +
    # Add a density curve
    geom_density() +
    # Add a vertical line through zero
    geom_vline(xintercept = 0)
Editar e Executar Código