Uso di .SD (I)
.SD insieme a .SDcols è una funzionalità incredibilmente potente che rende molto più semplice calcolare su più colonne.
.SDè un simbolo speciale che sta per Subset of Data (sottoinsieme dei dati).SDcolscontiene le colonne che devono essere incluse in.SD
Questo esercizio fa parte del corso
Manipolazione dei dati con data.table in R
Istruzioni dell'esercizio
- Per ogni mese, trova la riga corrispondente al viaggio più breve (usando
which.min()suduration). - Il risultato deve contenere le colonne
month,start_station,end_station,start_date,end_dateeduration.
esercizio interattivo pratico
Prova questo esercizio completando questo codice di esempio.
relevant_cols <- c("start_station", "end_station",
"start_date", "end_date", "duration")
# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___,
by = month(start_date),
.SDcols = ___]
shortest