CommencerCommencer gratuitement

Utiliser .SD (I)

.SD associé à .SDcols est une fonctionnalité extrêmement puissante qui facilite grandement les calculs sur plusieurs colonnes.

  • .SD est un symbole spécial qui signifie Subset of Data (sous-ensemble des données)
  • .SDcols contient les colonnes qui doivent être incluses dans .SD

Cet exercice fait partie du cours

Manipulation de données avec data.table en R

Afficher le cours

Instructions

  • Pour chaque mois, trouvez la ligne correspondant au trajet le plus court (en utilisant which.min() sur duration).
  • Le résultat doit contenir les colonnes month, start_station, end_station, start_date, end_date et duration.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

relevant_cols <- c("start_station", "end_station", 
                   "start_date", "end_date", "duration")

# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___, 
                    by = month(start_date), 
                    .SDcols = ___]
shortest
Modifier et exécuter le code