Un modèle exploratoire
On vous fournit un jeu de données avec des mesures de la force gravitationnelle entre deux corps à différentes distances, et l’on vous met au défi de construire un modèle simple pour prédire cette force à partir d’une distance donnée. Pour commencer, vous souhaitez vous en tenir à une régression linéaire simple. Les données comprennent 120 paires distance et force, et sont chargées pour vous sous le nom newton.
Cet exercice fait partie du cours
Feature engineering en R
Instructions
- Créez un modèle linéaire pour les données
newtonen utilisant la fonction de modèle linéaire de base deRet assignez-le àlr_force. - Créez un nouveau data frame
dfen liant les valeurs prédites aux donnéesnewtond’origine. - Générez un nuage de points de
forceen fonction dedistanceavecggplot(). - Ajoutez une droite de régression au nuage de points à l’aide des valeurs ajustées.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Build a linear model for the newton the data and assign it to lr_force
lr_force <- ___(force ~ distance, data = ___)
# Create a new data frame by binding the prediction values to the original data
df <- newton %>% ___(lr_pred = predict(lr_force))
# Generate a scatterplot of force vs. distance
df %>%
ggplot(aes(x = distance, y = force)) +
geom____() +
# Add a regression line with the fitted values
geom_line(aes(y = ___), color = "blue", lwd = .75) +
ggtitle("Linear regression of force vs. distance") +
theme_classic()