Modella la crescita della soia con un GAM
In questo esercizio modellerai il peso medio delle foglie di una pianta di soia in funzione del tempo (dopo la semina). Come vedrai, la pianta di soia non cresce a un ritmo costante, ma ha un "picco di crescita" che poi rallenta. Per questo, il peso delle foglie non è ben descritto da un modello lineare.
Ricorda che puoi indicare quale variabile vuoi modellare in modo non lineare in una formula con la funzione s() (docs):
y ~ s(x)
Ricorda anche che gam() (docs) del pacchetto mgcv ha la seguente interfaccia di chiamata
gam(formula, family, data)
Per la regressione standard, usa family = gaussian (il valore predefinito).
I dati di training sulla soia, soybean_train, sono già stati caricati. Hanno due colonne: l'output weight e la variabile Time. Per confronto, è già stato caricato anche il modello lineare model.lin, stimato usando la formula weight ~ Time.
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# soybean_train is available
summary(soybean_train)
# Plot weight vs Time (Time on x axis)
ggplot(soybean_train, aes(x = ___, y = ___)) +
geom_point()