Stapelreihenfolge für bessere Lesbarkeit
Im letzten Diagramm haben wir alle Krankheiten, die nicht Masern oder Mumps sind, in eine eigene Kategorie zusammengefasst. Daher können wir annehmen, dass uns der Verlauf der Kategorie „other“ weniger interessiert als der von Masern und Mumps.
Deshalb hat das erstellte Diagramm ein Problem: Die Balken sind so gestapelt, dass Masern oben, Mumps in der Mitte und other unten liegt. Dadurch ist es schwer, ein gutes Gefühl für das Verhalten von Mumps über die Zeit zu bekommen, weil seine Basislinie nicht konstant ist – sie hängt von den sich ändernden Anteilen bei Masern ab.
Ggplot ordnet die Balken und die Legende nach der Reihenfolge, in der es die Variablen im Datensatz sieht. Um das zu überschreiben, verwandle die Spalte disease in einen Faktor mit den levels in der Reihenfolge, die unser Plot verwenden soll.
Diese Übung ist Teil des Kurses
Best Practices für Visualisierung in R
Anleitung zur Übung
- Ändere die mutate-Funktion in der Datenverarbeitungspipeline so, dass
diseasein einen Faktor umgewandelt wird mitlevels = c('measles', 'other', 'mumps'). - Zeichne das Diagramm erneut mit demselben Code wie in der letzten Übung.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
disease_counts <- who_disease %>%
mutate(
disease = ifelse(disease %in% c('measles', 'mumps'), disease, 'other') %>%
factor(___) # change factor levels to desired ordering
) %>%
group_by(disease, year) %>%
summarise(total_cases = sum(cases))
# plot
ggplot(disease_counts, aes(x = year, y = total_cases, fill = disease)) +
geom_col(position = 'fill')