Kastendiagramme anordnen
Wie du die Kastendiagramme anordnest, beeinflusst die Art der Fragen, die leicht zu beantworten sind.
Hier kannst du dir nochmal die Daten zum Zigarettenkonsum in den USA anschauen. Dieses Mal zeigt jedes Boxplot die Verteilung des Zigarettenkonsums über die Zeit für einen bestimmten US-Bundesstaat. Jedes Kastendiagramm besteht also aus 11 Datenpunkten, die die Jahre 1985 bis 1995 repräsentieren.
Standardmäßig sind die Kastendiagramme alphabetisch nach den Namen der Bundesstaaten geordnet. Das macht es sehr einfach, die Details für einen bestimmten Bundesstaat nachzuschlagen, aber schwierig, Fragen zu beantworten, wo der höchste oder niedrigste Verbrauch zu finden ist. Wenn du die Zeilen nach dem mittleren Zigarettenkonsum sortierst, lassen sich diese Fragen leichter beantworten.
Der Interquartilsabstand (IQR) zeigt, wie stark die Werte in der „mittleren Hälfte“ der Population (vom 25. bis zum 75. Perzentil) auseinandergehen. Das heißt, dass man mit der Sortierung nach dem IQR besser beantworten kann, wie groß die Unterschiede in der „typischen“ Population waren.
Welche Aussage ist falsch?
Diese Übung ist Teil des Kurses
Datenvisualisierung verstehen
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
