IniziaInizia gratis

Modella la crescita della soia con un GAM

In questo esercizio modellerai il peso medio delle foglie di una pianta di soia in funzione del tempo (dopo la semina). Come vedrai, la pianta di soia non cresce a un ritmo costante, ma ha un "picco di crescita" che poi rallenta. Per questo, il peso delle foglie non è ben descritto da un modello lineare.

Ricorda che puoi indicare quale variabile vuoi modellare in modo non lineare in una formula con la funzione s() (docs):

y ~ s(x)

Ricorda anche che gam() (docs) del pacchetto mgcv ha la seguente interfaccia di chiamata

gam(formula, family, data)

Per la regressione standard, usa family = gaussian (il valore predefinito).

I dati di training sulla soia, soybean_train, sono già stati caricati. Hanno due colonne: l'output weight e la variabile Time. Per confronto, è già stato caricato anche il modello lineare model.lin, stimato usando la formula weight ~ Time.

Questo esercizio fa parte del corso

Supervised Learning in R: Regression

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# soybean_train is available
summary(soybean_train)

# Plot weight vs Time (Time on x axis)
ggplot(soybean_train, aes(x = ___, y = ___)) + 
  geom_point() 
Modifica ed esegui il codice