Prevedere con il modello di disoccupazione
In questo esercizio userai il tuo modello di disoccupazione unemployment_model per fare predizioni a partire dai dati unemployment e confronterai i tassi di disoccupazione femminile previsti con quelli effettivamente osservati nei dati di training, unemployment. Userai anche il modello per prevedere sul nuovo dato in newrates, che contiene una sola osservazione, in cui la disoccupazione maschile è al 5%.
L'interfaccia predict() (docs) per i modelli lm ha la forma
predict(model, newdata)
Userai il pacchetto ggplot2 per creare i grafici, quindi aggiungerai la colonna con le predizioni al data frame unemployment. Traccerai outcome vs predizione e li confronterai con la retta che rappresenta predizioni perfette (cioè quando l'outcome è uguale al valore previsto).
Il comando ggplot2 per disegnare uno scatter plot di dframe$outcome rispetto a dframe$pred (pred sull'asse x, outcome sull'asse y), insieme a una linea blu dove outcome == pred, è il seguente:
ggplot(dframe, aes(x = pred, y = outcome)) +
geom_point() +
geom_abline(color = "blue")
unemployment, unemployment_model e newrates sono già stati precaricati per te.
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Istruzioni dell'esercizio
- Usa
predict()per prevedere i tassi di disoccupazione femminile dai datiunemployment. Assegna il risultato a una nuova colonna:prediction. - Usa il comando
library()per caricare il pacchettoggplot2. - Usa
ggplot()per confrontare le predizioni con i tassi di disoccupazione effettivi. Metti le predizioni sull'asse x. Quanto sono vicini i risultati alla linea di predizione perfetta? - Usa il data frame
newratesper prevedere il tasso atteso di disoccupazione femminile quando la disoccupazione maschile è al 5%. Assegna la risposta alla variabileprede stampala.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# unemployment is available
summary(unemployment)
# newrates is available
newrates
# Predict female unemployment in the unemployment dataset
unemployment$prediction <- ___
# Load the ggplot2 package
___
# Make a plot to compare predictions to actual (prediction on x axis).
ggplot(___, aes(x = ___, y = ___)) +
___ +
geom_abline(color = "blue")
# Predict female unemployment rate when male unemployment is 5%
pred <- ___
pred