Een voorlopig model
Je krijgt een gegevensset met metingen van de zwaartekracht tussen twee objecten op verschillende afstanden en je krijgt de uitdaging om een eenvoudig model te bouwen dat die kracht voorspelt op basis van een specifieke afstand. In eerste instantie wil je bij eenvoudige lineaire regressie blijven. De gegevens bestaan uit 120 paren van distance en force en zijn voor je geladen als newton.
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Oefeninstructies
- Bouw een lineair model voor de
newton-gegevens met de basisfunctie vanRvoor lineaire modellen en sla het op alslr_force. - Maak een nieuw gegevensframe
dfdoor de voorspelde waarden aan de oorspronkelijkenewton-gegevens te binden. - Genereer een spreidingsdiagram van
forcetegenoverdistancemetggplot(). - Voeg een regressielijn toe aan het spreidingsdiagram met de gefitte waarden.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build a linear model for the newton the data and assign it to lr_force
lr_force <- ___(force ~ distance, data = ___)
# Create a new data frame by binding the prediction values to the original data
df <- newton %>% ___(lr_pred = predict(lr_force))
# Generate a scatterplot of force vs. distance
df %>%
ggplot(aes(x = distance, y = force)) +
geom____() +
# Add a regression line with the fitted values
geom_line(aes(y = ___), color = "blue", lwd = .75) +
ggtitle("Linear regression of force vs. distance") +
theme_classic()