Model fitten op gereduceerde blood-brain-data
Nu je je gegevensset hebt verkleind, kun je er met train() een glm-model op fitten. Dit model draait sneller dan met de volledige gegevensset en levert een vergelijkbare voorspellende nauwkeurigheid op.
Bovendien kunnen variabelen met nulvariantie problemen veroorzaken bij cross-validatie (bijv. als één fold uiteindelijk maar één unieke waarde voor die variabele bevat). Door ze vóór het modelleren te verwijderen, is de kans op fouten tijdens het fitten kleiner.
Deze oefening maakt deel uit van de cursus
Machine Learning met caret in R
Oefeninstructies
bloodbrain_x, bloodbrain_y, remove en bloodbrain_x_small zijn geladen in je werkruimte.
- Fit een
glm-model met de functietrain()op de gereduceerde blood-brain-gegevensset die je in de vorige oefening hebt gemaakt. - Print het resultaat naar de console.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit model on reduced data: model
model <- train(
x = ___,
y = ___,
method = "glm"
)
# Print model to console