Aan de slagGa gratis aan de slag

Modelleren met categorische inputs

In deze oefening pas je een lineair model toe op de flowers-data om Flowers te voorspellen op basis van Time en Intensity.

De modelformule fmla die je in de vorige oefening hebt gemaakt is nog beschikbaar, net als de modelmatrix mmat.

Deze oefening maakt deel uit van de cursus

Supervised Learning in R: Regressie

Cursus bekijken

Oefeninstructies

  • Gebruik fmla en lm om een lineair model te trainen dat Flowers voorspelt op basis van Intensity en Time. Ken het model toe aan de variabele flower_model.
  • Gebruik summary() om jezelf te herinneren aan de structuur van mmat.
  • Gebruik summary() om flower_model te onderzoeken. Komen de variabelen overeen met wat je in mmat zag?
  • Gebruik flower_model om het aantal bloemen te voorspellen. Voeg de voorspellingen toe aan flowers als de kolom predictions.
  • Vul de lege plekken in om voorspellingen vs. werkelijke bloemen te plotten (voorspellingen op de x-as).

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# flowers is available
str(flowers)

# fmla is available
fmla

# Fit a model to predict Flowers from Intensity and Time : flower_model
flower_model <- ___

# Use summary on mmat to remind yourself of its structure
___

# Use summary to examine flower_model 
___

# Predict the number of flowers on each plant
flowers$predictions <- ___

# Plot predictions vs actual flowers (predictions on x-axis)
ggplot(___, aes(x = ___, y = ___)) + 
  geom_point() +
  geom_abline(color = "blue") 
Code bewerken en uitvoeren