Boxplots und Dichteplots
Der Verbrauch eines Autos hängt oft mit der Größe seines Motors zusammen (gemessen an der Anzahl der Zylinder). Um die Beziehung zwischen diesen beiden Variablen zu untersuchen, könntest du bei Histogrammen bleiben, aber in dieser Übung probierst du zwei Alternativen aus: den Boxplot und den Dichteplot.
Diese Übung ist Teil des Kurses
Explorative Datenanalyse in R
Anleitung zur Übung
Ein kurzer Blick auf unique(cars$ncyl) zeigt, dass es mehr mögliche Ausprägungen von ncyl gibt, als du vielleicht denkst. Beschränke dich hier auf die am häufigsten vorkommenden Ausprägungen.
- Filtere
carsso, dass nur Autos mit 4, 6 oder 8 Zylindern enthalten sind, und speichere das Ergebnis alscommon_cyl. Der Operator%in%kann hier nützlich sein. - Erstelle nebeneinanderstehende Boxplots von
city_mpg, aufgeteilt nachncyl. - Erstelle überlagerte Dichteplots von
city_mpg, eingefärbt nachncyl.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Filter cars with 4, 6, 8 cylinders
common_cyl <- filter(___, ___)
# Create box plots of city mpg by ncyl
ggplot(___, aes(x = as.factor(___), y = ___)) +
geom_boxplot()
# Create overlaid density plots for same data
ggplot(common_cyl, aes(x = ___, fill = as.factor(___))) +
geom_density(alpha = .3)