Utiliser .SD (I)
.SD associé à .SDcols est une fonctionnalité extrêmement puissante qui facilite grandement les calculs sur plusieurs colonnes.
.SDest un symbole spécial qui signifie Subset of Data (sous-ensemble des données).SDcolscontient les colonnes qui doivent être incluses dans.SD
Cet exercice fait partie du cours
Manipulation de données avec data.table en R
Instructions
- Pour chaque mois, trouvez la ligne correspondant au trajet le plus court (en utilisant
which.min()surduration). - Le résultat doit contenir les colonnes
month,start_station,end_station,start_date,end_dateetduration.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
relevant_cols <- c("start_station", "end_station",
"start_date", "end_date", "duration")
# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___,
by = month(start_date),
.SDcols = ___]
shortest