CommencerCommencer gratuitement

Un modèle exploratoire

On vous fournit un jeu de données avec des mesures de la force gravitationnelle entre deux corps à différentes distances, et l’on vous met au défi de construire un modèle simple pour prédire cette force à partir d’une distance donnée. Pour commencer, vous souhaitez vous en tenir à une régression linéaire simple. Les données comprennent 120 paires distance et force, et sont chargées pour vous sous le nom newton.

Cet exercice fait partie du cours

Feature engineering en R

Afficher le cours

Instructions

  • Créez un modèle linéaire pour les données newton en utilisant la fonction de modèle linéaire de base de R et assignez-le à lr_force.
  • Créez un nouveau data frame df en liant les valeurs prédites aux données newton d’origine.
  • Générez un nuage de points de force en fonction de distance avec ggplot().
  • Ajoutez une droite de régression au nuage de points à l’aide des valeurs ajustées.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Build a linear model for the newton the data and assign it to lr_force
lr_force <- ___(force ~ distance, data = ___)

# Create a new data frame by binding the prediction values to the original data
df <- newton %>% ___(lr_pred = predict(lr_force))

# Generate a scatterplot of force vs. distance
df %>%
  ggplot(aes(x = distance, y = force)) +
  geom____() +
# Add a regression line with the fitted values
  geom_line(aes(y = ___), color = "blue", lwd = .75) +
  ggtitle("Linear regression of force vs. distance") +
  theme_classic()
Modifier et exécuter le code