Aan de slagGa gratis aan de slag

Gebruik van .SD (I)

.SD samen met .SDcols is een enorm krachtige functie die berekeningen op meerdere kolommen veel makkelijker maakt.

  • .SD is een speciaal symbool dat staat voor Subset of Data (subset van de data)
  • .SDcols bevat de kolommen die in .SD moeten worden opgenomen

Deze oefening maakt deel uit van de cursus

Gegevens manipuleren met data.table in R

Cursus bekijken

Oefeninstructies

  • Zoek voor elke maand de rij die overeenkomt met de kortste rit (door which.min() te gebruiken op duration).
  • Het resultaat moet de kolommen month, start_station, end_station, start_date, end_date en duration bevatten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

relevant_cols <- c("start_station", "end_station", 
                   "start_date", "end_date", "duration")

# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___, 
                    by = month(start_date), 
                    .SDcols = ___]
shortest
Code bewerken en uitvoeren