IniziaInizia gratis

Prevedere con il modello di disoccupazione

In questo esercizio userai il tuo modello di disoccupazione unemployment_model per fare predizioni a partire dai dati unemployment e confronterai i tassi di disoccupazione femminile previsti con quelli effettivamente osservati nei dati di training, unemployment. Userai anche il modello per prevedere sul nuovo dato in newrates, che contiene una sola osservazione, in cui la disoccupazione maschile è al 5%.

L'interfaccia predict() (docs) per i modelli lm ha la forma

predict(model, newdata)

Userai il pacchetto ggplot2 per creare i grafici, quindi aggiungerai la colonna con le predizioni al data frame unemployment. Traccerai outcome vs predizione e li confronterai con la retta che rappresenta predizioni perfette (cioè quando l'outcome è uguale al valore previsto).

Il comando ggplot2 per disegnare uno scatter plot di dframe$outcome rispetto a dframe$pred (pred sull'asse x, outcome sull'asse y), insieme a una linea blu dove outcome == pred, è il seguente:

ggplot(dframe, aes(x = pred, y = outcome)) + 
       geom_point() +  
       geom_abline(color = "blue")

unemployment, unemployment_model e newrates sono già stati precaricati per te.

Questo esercizio fa parte del corso

Supervised Learning in R: Regression

Visualizza il corso

Istruzioni dell'esercizio

  • Usa predict() per prevedere i tassi di disoccupazione femminile dai dati unemployment. Assegna il risultato a una nuova colonna: prediction.
  • Usa il comando library() per caricare il pacchetto ggplot2.
  • Usa ggplot() per confrontare le predizioni con i tassi di disoccupazione effettivi. Metti le predizioni sull'asse x. Quanto sono vicini i risultati alla linea di predizione perfetta?
  • Usa il data frame newrates per prevedere il tasso atteso di disoccupazione femminile quando la disoccupazione maschile è al 5%. Assegna la risposta alla variabile pred e stampala.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# unemployment is available
summary(unemployment)

# newrates is available
newrates

# Predict female unemployment in the unemployment dataset
unemployment$prediction <-  ___

# Load the ggplot2 package
___

# Make a plot to compare predictions to actual (prediction on x axis). 
ggplot(___, aes(x = ___, y = ___)) + 
  ___ +
  geom_abline(color = "blue")

# Predict female unemployment rate when male unemployment is 5%
pred <- ___
pred
Modifica ed esegui il codice