Mit .SD arbeiten (I)
.SD zusammen mit .SDcols ist ein unglaublich leistungsstarkes Feature, das Berechnungen über mehrere Spalten deutlich vereinfacht.
.SDist ein spezielles Symbol und steht für Subset of Data (Teilmenge der Daten).SDcolsenthält die Spalten, die in.SDeinbezogen werden sollen
Diese Übung ist Teil des Kurses
Datenmanipulation mit data.table in R
Anleitung zur Übung
- Finde für jeden Monat die Zeile, die zur kürzesten Fahrt gehört (verwende dazu
which.min()aufduration). - Das Ergebnis soll die Spalten
month,start_station,end_station,start_date,end_dateunddurationenthalten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
relevant_cols <- c("start_station", "end_station",
"start_date", "end_date", "duration")
# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___,
by = month(start_date),
.SDcols = ___]
shortest