IniziaInizia gratis

Uso di .SD (I)

.SD insieme a .SDcols è una funzionalità incredibilmente potente che rende molto più semplice calcolare su più colonne.

  • .SD è un simbolo speciale che sta per Subset of Data (sottoinsieme dei dati)
  • .SDcols contiene le colonne che devono essere incluse in .SD

Questo esercizio fa parte del corso

Manipolazione dei dati con data.table in R

Visualizza il corso

Istruzioni dell'esercizio

  • Per ogni mese, trova la riga corrispondente al viaggio più breve (usando which.min() su duration).
  • Il risultato deve contenere le colonne month, start_station, end_station, start_date, end_date e duration.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

relevant_cols <- c("start_station", "end_station", 
                   "start_date", "end_date", "duration")

# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___, 
                    by = month(start_date), 
                    .SDcols = ___]
shortest
Modifica ed esegui il codice