LoslegenKostenlos loslegen

Mit .SD arbeiten (I)

.SD zusammen mit .SDcols ist ein unglaublich leistungsstarkes Feature, das Berechnungen über mehrere Spalten deutlich vereinfacht.

  • .SD ist ein spezielles Symbol und steht für Subset of Data (Teilmenge der Daten)
  • .SDcols enthält die Spalten, die in .SD einbezogen werden sollen

Diese Übung ist Teil des Kurses

Datenmanipulation mit data.table in R

Kurs anzeigen

Anleitung zur Übung

  • Finde für jeden Monat die Zeile, die zur kürzesten Fahrt gehört (verwende dazu which.min() auf duration).
  • Das Ergebnis soll die Spalten month, start_station, end_station, start_date, end_date und duration enthalten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

relevant_cols <- c("start_station", "end_station", 
                   "start_date", "end_date", "duration")

# Find the row corresponding to the shortest trip per month
shortest <- batrips[, ___, 
                    by = month(start_date), 
                    .SDcols = ___]
shortest
Code bearbeiten und ausführen