Aan de slagGa gratis aan de slag

Train dat model

Een modelspecificatie is een goed begin, net als het canvas voor een schilder. Maar zoals een schilder verf nodig heeft, heeft de specificatie data nodig. Alleen het uiteindelijke model kan voorspellingen doen:

Modelspecificatie + data = model

In deze oefening train je een beslissingsboom die het risico op diabetes modelleert met gezondheidsvariabelen als voorspellers. De responsvariabele, outcome, geeft aan of de patiënt wel of geen diabetes heeft; dit is dus een binaire classificatie (er zijn slechts twee klassen). De gegevensset bevat ook gezondheidsvariabelen van patiënten zoals blood_pressure, age en bmi.

Voor de rest van de cursus is het tidymodels -pakket altijd vooraf geladen. In deze oefening is de diabetes-gegevensset ook beschikbaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Cursus bekijken

Oefeninstructies

  • Maak tree_spec, een specificatie voor een beslissingsboom met een rpart-engine.
  • Train een model tree_model_bmi, waarbij outcome alleen afhangt van de voorspeller bmi, door de diabetes-gegevensset aan de specificatie te fitten.
  • Print het model naar de console.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create the specification
tree_spec <- ___() %>% 
  ___("rpart") %>% 
  ___

# Train the model
tree_model_bmi <- tree_spec %>% 
  ___

# Print the model
___
Code bewerken en uitvoeren