Aan de slagGa gratis aan de slag

Een workflow bouwen

Met je gegevens klaar voor analyse, declareer je een logistic_model() om te voorspellen of ze al dan niet te laat aankomen.

Je geeft de variabele flight de rol "ID" zodat je die kunt behouden als referentie voor analyse en debuggen. Op basis van de variabele date maak je nieuwe features om het effect van feestdagen expliciet te modelleren en stel je factors voor als dummyvariabelen.

Door je model en recipe() samen te bundelen met workflow() zorg je ervoor dat latere fits of voorspellingen consistente feature-engineeringstappen toepassen.

Deze oefening maakt deel uit van de cursus

Feature engineering in R

Cursus bekijken

Oefeninstructies

  • Ken een "ID"-rol toe aan flight.
  • Bundel het model en de recipe in een workflow-object.
  • Fit lr_workflow op de test-gegevens.
  • Maak de gefitte workflow netjes met tidy().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

lr_model <- logistic_reg()

# Assign an "ID" role to flight
lr_recipe <- recipe(arrival ~., data = train) %>% update_role(flight, new_role = ___) %>%
  step_holiday(date, holidays = timeDate::listHolidays("US")) %>% step_dummy(all_nominal_predictors())

# Bundle the model and the recipe into a workflow object
lr_workflow <- workflow() %>% add_model(___) %>% add_recipe(___)
lr_workflow

# Fit lr_workflow workflow to the test data  
lr_fit <- lr_workflow %>% ___(data = test)

# Tidy the fitted workflow  
tidy(___)
Code bewerken en uitvoeren