Een workflow bouwen
Met je gegevens klaar voor analyse, declareer je een logistic_model() om te voorspellen of ze al dan niet te laat aankomen.
Je geeft de variabele flight de rol "ID" zodat je die kunt behouden als referentie voor analyse en debuggen. Op basis van de variabele date maak je nieuwe features om het effect van feestdagen expliciet te modelleren en stel je factors voor als dummyvariabelen.
Door je model en recipe() samen te bundelen met workflow() zorg je ervoor dat latere fits of voorspellingen consistente feature-engineeringstappen toepassen.
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Oefeninstructies
- Ken een "ID"-rol toe aan
flight. - Bundel het model en de recipe in een
workflow-object. - Fit
lr_workflowop detest-gegevens. - Maak de gefitte workflow netjes met
tidy().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
lr_model <- logistic_reg()
# Assign an "ID" role to flight
lr_recipe <- recipe(arrival ~., data = train) %>% update_role(flight, new_role = ___) %>%
step_holiday(date, holidays = timeDate::listHolidays("US")) %>% step_dummy(all_nominal_predictors())
# Bundle the model and the recipe into a workflow object
lr_workflow <- workflow() %>% add_model(___) %>% add_recipe(___)
lr_workflow
# Fit lr_workflow workflow to the test data
lr_fit <- lr_workflow %>% ___(data = test)
# Tidy the fitted workflow
tidy(___)