Hotelboekingen voorspellen
Je hebt net een baan bij een onderzoeksbureau in de hospitalitysector, en je eerste taak is een model bouwen dat voorspelt of een hotelverblijf kinderen omvat of niet. Om je model te trainen, gebruik je een aangepaste versie van de hotel booking demands-gegevensset van Antonio, Almeida en Nunes (2019). Je beperkt je data tot de volgende features:
features <- c('hotel', 'adults',
'children', 'meal',
'reserved_room_type',
'customer_type',
'arrival_date')
De data is voor je geladen als hotels, samen met de bijbehorende test- en train-splits, en het model is gedeclareerd als lr_model <- logistic_reg().
Je beoordeelt de modelprestatie op accuracy en de area under the ROC curve (AUC).
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
lr_recipe <-
recipe(children ~., data = train) %>%
# Generate "day of the week", "week" and "month" features
step_date(arrival_date, features = c(___, ___, ___)) %>%
# Create dummy variables for all nominal predictors
step_dummy(___)