Ein Feature manuell entwickeln
Nach etwas Recherche mit deinem Team erinnerst du dich daran, dass die Gravitationskraft zwischen zwei Körpern Newtons Formel folgt:
$$F = G\frac{m_1m_2}{r^2}$$.
Du kannst die Formel nicht direkt verwenden, weil die Massen unbekannt sind. Aber du kannst ein Regressionsmodell für force als Funktion von inv_square_distance fitten. Der erweiterte Datensatz df, den du in der letzten Übung erstellt hast, wurde für dich geladen.
Diese Übung ist Teil des Kurses
Feature Engineering in R
Anleitung zur Übung
- Erstelle eine neue Variable
inv_square_distance, definiert als Kehrwert der quadrierten Entfernung, und füge sie dem Data Framedfhinzu. - Baue ein einfaches Regressionsmodell mit
lm()vonforcegegeninv_square_distanceund speichere es alslr_force_2. - Hänge deine Vorhersagen an
df_inversean.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a new variable inv_square_distance
df_inverse <- df %>% ___(inv_square_distance = 1/distance^2)
# Build a simple regression model
lr_force_2 <- lm(force ~ ___, data = df_inverse)
# Bind your predictions to df_inverse
df_inverse <- df_inverse %>% ___(lr2_pred = predict(lr_force_2))
df_inverse %>% ggplot(aes(x = distance, y = force)) +
geom_point() +
geom_line(aes(y = lr2_pred), col = "blue", lwd = .75) +
ggtitle("Linear regression of force vs. inv_square_distance") +
theme_classic()