IniziaInizia gratis

Scrivi una regressione semplice a una variabile

Nel primo esercizio di coding, creerai una formula per definire un compito di modellazione a una variabile e poi adatterai un modello lineare ai dati. Ti vengono forniti i tassi di disoccupazione maschile e femminile negli Stati Uniti su più anni (Fonte).

Il compito è prevedere il tasso di disoccupazione femminile a partire dal tasso osservato di disoccupazione maschile. L'outcome è female_unemployment e l'input è male_unemployment.

Il segno del coefficiente della variabile ti indica se l'outcome aumenta (+) o diminuisce (-) al crescere della variabile.

Ricorda che l'interfaccia di chiamata di lm() (docs) è:

lm(formula, data = ___)

Il data frame unemployment è già stato caricato.

Questo esercizio fa parte del corso

Supervised Learning in R: Regression

Visualizza il corso

Istruzioni dell'esercizio

  • Definisci una formula che esprima female_unemployment come funzione di male_unemployment. Assegna la formula alla variabile fmla e stampala.
  • Poi usa lm() e fmla per adattare un modello lineare che predica la disoccupazione femminile a partire da quella maschile utilizzando il dataset unemployment.
  • Stampa il modello. Il coefficiente per la disoccupazione maschile è coerente con ciò che ti aspetteresti? La disoccupazione femminile aumenta al crescere di quella maschile?

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# unemployment is available
summary(unemployment)

# Define a formula to express female_unemployment as a function of male_unemployment
fmla <- ___

# Print it
___

# Use the formula to fit a model: unemployment_model
unemployment_model <- ___

# Print it
___
Modifica ed esegui il codice