Lineaire regressie voor de Verenigde Staten
Een lineaire regressie is een model waarmee je kunt onderzoeken hoe de ene variabele verandert ten opzichte van een andere door er een best passende lijn op te leggen. In R doe je dit met de functie lm().
Hier pas je een lineaire regressie toe op alleen het percentage "yes"-stemmen van de Verenigde Staten.
Deze oefening maakt deel uit van de cursus
Casestudy: Exploratory Data Analysis in R
Oefeninstructies
- Print de gegevens
US_by_yearnaar de console. - Gebruik alleen de US-gegevens in
US_by_yearen gebruiklm()om een lineaire regressie uit te voeren waarbij jepercent_yesvoorspelt op basis vanyear. Sla dit op in de variabeleUS_fit. - Vat
US_fitsamen met de functiesummary().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Percentage of yes votes from the US by year: US_by_year
US_by_year <- by_year_country %>%
filter(country == "United States")
# Print the US_by_year data
# Perform a linear regression of percent_yes by year: US_fit
# Perform summary() on the US_fit object