Modelar o crescimento da soja com GAM
Neste exercício, você vai modelar o peso médio das folhas de uma planta de soja em função do tempo (após o plantio). Como você verá, a planta de soja não cresce a uma taxa constante; ela tem um “pico de crescimento” que depois desacelera. Por isso, o peso das folhas não é bem descrito por um modelo linear.
Lembre-se de que você pode indicar qual variável deseja modelar de forma não linear em uma fórmula usando a função s() (docs):
y ~ s(x)
Também lembre que gam() (docs) do pacote mgcv tem a seguinte interface de chamada
gam(formula, family, data)
Para regressão padrão, use family = gaussian (o padrão).
Os dados de treino da soja, soybean_train, já foram carregados. Eles têm duas colunas: o desfecho weight e a variável Time. Para comparação, o modelo linear model.lin, ajustado com a fórmula weight ~ Time, também já foi carregado.
Este exercício faz parte do curso
Aprendizado Supervisionado em R: Regressão
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# soybean_train is available
summary(soybean_train)
# Plot weight vs Time (Time on x axis)
ggplot(soybean_train, aes(x = ___, y = ___)) +
geom_point()