Uso di .SD (I)
.SD insieme a .SDcols è una funzionalità incredibilmente potente che rende molto più semplice calcolare su più colonne.
.SDè un simbolo speciale che sta per Subset of Data (sottoinsieme dei dati).SDcolscontiene le colonne che devono essere incluse in.SD
Questo esercizio fa parte del corso
Manipolazione dei dati con data.table in R
Istruzioni dell'esercizio
- Per ogni mese, trova la riga corrispondente al viaggio più breve (usando
which.min()suduration). - Il risultato deve contenere le colonne
month,start_station,end_station,start_date,end_dateeduration.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
relevant_cols <- c("start_station", "end_station",
"start_date", "end_date", "duration")
# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___,
by = month(start_date),
.SDcols = ___]
shortest