Merekayasa fitur secara manual
Setelah melakukan riset bersama tim, Anda ingat bahwa gaya tarik gravitasi antara dua benda mengikuti rumus Newton:
$$F = G\frac{m_1m_2}{r^2}$$.
Anda tidak dapat menggunakan rumus tersebut secara langsung karena massanya tidak diketahui, tetapi Anda dapat menyesuaikan model regresi dari force sebagai fungsi inv_square_distance. Himpunan data tambahan df yang Anda bangun pada latihan sebelumnya telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur di R
Petunjuk latihan
- Buat variabel baru
inv_square_distanceyang didefinisikan sebagai kebalikan dari jarak kuadrat, lalu tambahkan ke data framedf. - Bangun model regresi sederhana menggunakan
lm()dariforceterhadapinv_square_distancedan simpan sebagailr_force_2. - Gabungkan prediksi Anda ke
df_inverse.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a new variable inv_square_distance
df_inverse <- df %>% ___(inv_square_distance = 1/distance^2)
# Build a simple regression model
lr_force_2 <- lm(force ~ ___, data = df_inverse)
# Bind your predictions to df_inverse
df_inverse <- df_inverse %>% ___(lr2_pred = predict(lr_force_2))
df_inverse %>% ggplot(aes(x = distance, y = force)) +
geom_point() +
geom_line(aes(y = lr2_pred), col = "blue", lwd = .75) +
ggtitle("Linear regression of force vs. inv_square_distance") +
theme_classic()