Engenharia manual de uma feature
Depois de pesquisar com sua equipe, você se lembra de que a força gravitacional de atração entre dois corpos obedece à fórmula de Newton:
$$F = G\frac{m_1m_2}{r^2}$$.
Você não pode usar a fórmula diretamente porque as massas são desconhecidas, mas pode ajustar um modelo de regressão de force como função de inv_square_distance. O conjunto de dados aumentado df que você construiu no exercício anterior já foi carregado para você.
Este exercício faz parte do curso
Feature Engineering em R
Instruções do exercício
- Crie uma nova variável
inv_square_distancedefinida como o recíproco da distância ao quadrado e adicione-a ao data framedf. - Construa um modelo de regressão simples usando
lm()deforceversusinv_square_distancee salve-o comolr_force_2. - Faça o bind das suas previsões com
df_inverse.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a new variable inv_square_distance
df_inverse <- df %>% ___(inv_square_distance = 1/distance^2)
# Build a simple regression model
lr_force_2 <- lm(force ~ ___, data = df_inverse)
# Bind your predictions to df_inverse
df_inverse <- df_inverse %>% ___(lr2_pred = predict(lr_force_2))
df_inverse %>% ggplot(aes(x = distance, y = force)) +
geom_point() +
geom_line(aes(y = lr2_pred), col = "blue", lwd = .75) +
ggtitle("Linear regression of force vs. inv_square_distance") +
theme_classic()