Scrivi una regressione semplice a una variabile
Nel primo esercizio di coding, creerai una formula per definire un compito di modellazione a una variabile e poi adatterai un modello lineare ai dati. Ti vengono forniti i tassi di disoccupazione maschile e femminile negli Stati Uniti su più anni (Fonte).
Il compito è prevedere il tasso di disoccupazione femminile a partire dal tasso osservato di disoccupazione maschile.
L'outcome è female_unemployment e l'input è male_unemployment.
Il segno del coefficiente della variabile ti indica se l'outcome aumenta (+) o diminuisce (-) al crescere della variabile.
Ricorda che l'interfaccia di chiamata di lm() (docs) è:
lm(formula, data = ___)
Il data frame unemployment è già stato caricato.
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Istruzioni dell'esercizio
- Definisci una formula che esprima
female_unemploymentcome funzione dimale_unemployment. Assegna la formula alla variabilefmlae stampala. - Poi usa
lm()efmlaper adattare un modello lineare che predica la disoccupazione femminile a partire da quella maschile utilizzando il datasetunemployment. - Stampa il modello. Il coefficiente per la disoccupazione maschile è coerente con ciò che ti aspetteresti? La disoccupazione femminile aumenta al crescere di quella maschile?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# unemployment is available
summary(unemployment)
# Define a formula to express female_unemployment as a function of male_unemployment
fmla <- ___
# Print it
___
# Use the formula to fit a model: unemployment_model
unemployment_model <- ___
# Print it
___