Memodelkan pertumbuhan kedelai dengan GAM
Dalam latihan ini, Anda akan memodelkan rata-rata bobot daun pada tanaman kedelai sebagai fungsi waktu (setelah penanaman). Seperti akan Anda lihat, tanaman kedelai tidak tumbuh dengan laju yang konstan, melainkan mengalami "lonjakan pertumbuhan" yang kemudian melambat. Karena itu, bobot daun tidak cocok dijelaskan oleh model linear.
Ingat bahwa Anda dapat menentukan variabel mana yang ingin dimodelkan secara non-linear dalam sebuah formula dengan fungsi s() (docs):
y ~ s(x)
Juga ingat bahwa gam() (docs) dari paket mgcv memiliki antarmuka pemanggilan
gam(formula, family, data)
Untuk regresi standar, gunakan family = gaussian (bawaan/default).
Data pelatihan kedelai, soybean_train, telah dimuat sebelumnya. Data ini memiliki dua kolom: hasil weight dan variabel Time. Sebagai pembanding, model linear model.lin, yang dipasang menggunakan formula weight ~ Time, juga telah dimuat.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# soybean_train is available
summary(soybean_train)
# Plot weight vs Time (Time on x axis)
ggplot(soybean_train, aes(x = ___, y = ___)) +
geom_point()