Mit .SD arbeiten (I)
.SD zusammen mit .SDcols ist ein unglaublich leistungsstarkes Feature, das Berechnungen über mehrere Spalten deutlich vereinfacht.
.SDist ein spezielles Symbol und steht für Subset of Data (Teilmenge der Daten).SDcolsenthält die Spalten, die in.SDeinbezogen werden sollen
Diese Übung ist Teil des Kurses
<Kurs>Datenmanipulation mit data.table in R</Kurs>Übungsanweisungen
- Finde für jeden Monat die Zeile, die zur kürzesten Fahrt gehört (verwende dazu
which.min()aufduration). - Das Ergebnis soll die Spalten
month,start_station,end_station,start_date,end_dateunddurationenthalten.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
relevant_cols <- c("start_station", "end_station",
"start_date", "end_date", "duration")
# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___,
by = month(start_date),
.SDcols = ___]
shortest