LoslegenKostenlos loslegen

Overplotting 1: große Datensätze

Streudiagramme (mit geom_point()) sind intuitiv, leicht zu verstehen und weit verbreitet, aber wir müssen immer überlegen, ob wir sie überzeichnen, vor allem in den folgenden vier Situationen:

  1. Große Datensätze
  2. Ausgerichtete Werte auf einer einzigen Achse
  3. Daten mit geringer Genauigkeit
  4. Ganzzahlige Daten

In der Regel wird empfohlen, bei der Verwendung von Volumenkörpern Alpha-Blending (d. h. das Hinzufügen von Transparenz) zu verwenden. Alternativ kannst du auch undurchsichtige, hohle Formen verwenden.

Kleine Punkte eignen sich für große Datensätze mit Regionen mit hoher Dichte (viele Überschneidungen).

Verwenden wir den Datensatz diamonds, um den Umgang mit großen Datensätzen zu üben.

Diese Übung ist Teil des Kurses

Einführung in die Datenvisualisierung mit ggplot2

Kurs anzeigen

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))

# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___
Code bearbeiten und ausführen