Train dat model
Een modelspecificatie is een goed begin, net als het canvas voor een schilder. Maar zoals een schilder verf nodig heeft, heeft de specificatie data nodig. Alleen het uiteindelijke model kan voorspellingen doen:
Modelspecificatie + data = model
In deze oefening train je een beslissingsboom die het risico op diabetes modelleert met gezondheidsvariabelen als voorspellers. De responsvariabele, outcome, geeft aan of de patiënt wel of geen diabetes heeft; dit is dus een binaire classificatie (er zijn slechts twee klassen). De gegevensset bevat ook gezondheidsvariabelen van patiënten zoals blood_pressure, age en bmi.
Voor de rest van de cursus is het tidymodels -pakket altijd vooraf geladen. In deze oefening is de diabetes-gegevensset ook beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Oefeninstructies
- Maak
tree_spec, een specificatie voor een beslissingsboom met eenrpart-engine. - Train een model
tree_model_bmi, waarbijoutcomealleen afhangt van de voorspellerbmi, door dediabetes-gegevensset aan de specificatie te fitten. - Print het model naar de console.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the specification
tree_spec <- ___() %>%
___("rpart") %>%
___
# Train the model
tree_model_bmi <- tree_spec %>%
___
# Print the model
___