Mettre à jour des colonnes par groupe
Vous devez souvent créer de nouvelles colonnes intermédiaires pour obtenir le résultat final, sans forcément en avoir besoin dans ce résultat final. C’est un schéma très courant en analyse de données.
Dans cet exercice, vous allez utiliser un nouveau data.table, batrips_new, presque identique à batrips, sauf que nous avons introduit aléatoirement des valeurs manquantes dans la colonne duration.
Cet exercice fait partie du cours
Manipulation de données avec data.table en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the mean duration for each month
batrips_new[, ___,
by = month(start_date)]