Modelleren met categorische inputs
In deze oefening pas je een lineair model toe op de flowers-data om Flowers te voorspellen op basis van Time en Intensity.
De modelformule fmla die je in de vorige oefening hebt gemaakt is nog beschikbaar, net als de modelmatrix mmat.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Regressie
Oefeninstructies
- Gebruik
fmlaenlmom een lineair model te trainen datFlowersvoorspelt op basis vanIntensityenTime. Ken het model toe aan de variabeleflower_model. - Gebruik
summary()om jezelf te herinneren aan de structuur vanmmat. - Gebruik
summary()omflower_modelte onderzoeken. Komen de variabelen overeen met wat je inmmatzag? - Gebruik
flower_modelom het aantal bloemen te voorspellen. Voeg de voorspellingen toe aanflowersals de kolompredictions. - Vul de lege plekken in om voorspellingen vs. werkelijke bloemen te plotten (voorspellingen op de x-as).
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# flowers is available
str(flowers)
# fmla is available
fmla
# Fit a model to predict Flowers from Intensity and Time : flower_model
flower_model <- ___
# Use summary on mmat to remind yourself of its structure
___
# Use summary to examine flower_model
___
# Predict the number of flowers on each plant
flowers$predictions <- ___
# Plot predictions vs actual flowers (predictions on x-axis)
ggplot(___, aes(x = ___, y = ___)) +
geom_point() +
geom_abline(color = "blue")