Gebruik van .SD (I)
.SD samen met .SDcols is een enorm krachtige functie die berekeningen op meerdere kolommen veel makkelijker maakt.
.SDis een speciaal symbool dat staat voor Subset of Data (subset van de data).SDcolsbevat de kolommen die in.SDmoeten worden opgenomen
Deze oefening maakt deel uit van de cursus
Gegevens manipuleren met data.table in R
Oefeninstructies
- Zoek voor elke maand de rij die overeenkomt met de kortste rit (door
which.min()te gebruiken opduration). - Het resultaat moet de kolommen
month,start_station,end_station,start_date,end_dateendurationbevatten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
relevant_cols <- c("start_station", "end_station",
"start_date", "end_date", "duration")
# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___,
by = month(start_date),
.SDcols = ___]
shortest