ComeçarComece de graça

Prevendo a partir do modelo de desemprego

Neste exercício, você vai usar seu modelo de desemprego unemployment_model para fazer previsões a partir dos dados unemployment e comparar as taxas de desemprego feminino previstas com as taxas de desemprego feminino observadas nos dados de treino, unemployment. Você também vai usar o modelo para prever nos novos dados em newrates, que consistem em apenas uma observação, na qual o desemprego masculino é de 5%.

A interface predict() (docs) para modelos lm tem a forma

predict(model, newdata)

Você usará o pacote ggplot2 para fazer os gráficos, então vai adicionar a coluna de previsão ao data frame unemployment. Você vai plotar o desfecho versus a previsão e compará-los com a linha que representa previsões perfeitas (isto é, quando o desfecho é igual ao valor previsto).

O comando ggplot2 para plotar um diagrama de dispersão de dframe$outcome versus dframe$pred (pred no eixo x, outcome no eixo y), junto com uma linha azul onde outcome == pred, é o seguinte:

ggplot(dframe, aes(x = pred, y = outcome)) + 
       geom_point() +  
       geom_abline(color = "blue")

unemployment, unemployment_model e newrates já foram pré-carregados para você.

Este exercício faz parte do curso

Aprendizado Supervisionado em R: Regressão

Ver curso

Instruções do exercício

  • Use predict() para prever as taxas de desemprego feminino a partir dos dados unemployment. Atribua a uma nova coluna: prediction.
  • Use o comando library() para carregar o pacote ggplot2.
  • Use ggplot() para comparar as previsões com as taxas reais de desemprego. Coloque as previsões no eixo x. Quão próximos os resultados estão da linha de previsão perfeita?
  • Use o data frame newrates para prever a taxa de desemprego feminino esperada quando o desemprego masculino é de 5%. Atribua a resposta à variável pred e imprima-a.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# unemployment is available
summary(unemployment)

# newrates is available
newrates

# Predict female unemployment in the unemployment dataset
unemployment$prediction <-  ___

# Load the ggplot2 package
___

# Make a plot to compare predictions to actual (prediction on x axis). 
ggplot(___, aes(x = ___, y = ___)) + 
  ___ +
  geom_abline(color = "blue")

# Predict female unemployment rate when male unemployment is 5%
pred <- ___
pred
Editar e executar o código