Prédire les réservations d’hôtel
Vous venez d’être embauqué·e dans une société d’études spécialisée dans l’hôtellerie. Votre première mission consiste à créer un modèle qui prédit si un séjour à l’hôtel inclura des enfants ou non. Pour entraîner votre modèle, vous utiliserez une version modifiée du jeu de données sur la demande de réservation d’hôtels de Antonio, Almeida et Nunes (2019). Vous limitez vos données aux variables suivantes :
features <- c('hotel', 'adults',
'children', 'meal',
'reserved_room_type',
'customer_type',
'arrival_date')
Les données ont été chargées pour vous sous le nom hotels, ainsi que les partitions correspondantes test et train, et le modèle a été déclaré comme lr_model <- logistic_reg().
Vous évaluerez les performances du modèle avec l’accuracy et l’aire sous la courbe ROC (AUC).
Cet exercice fait partie du cours
Feature engineering en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
lr_recipe <-
recipe(children ~., data = train) %>%
# Generate "day of the week", "week" and "month" features
step_date(arrival_date, features = c(___, ___, ___)) %>%
# Create dummy variables for all nominal predictors
step_dummy(___)