Aan de slagGa gratis aan de slag

Boxplots ordenen

Hoe je de boxplots ordent, beïnvloedt welke vragen je makkelijk kunt beantwoorden.

Hier zie je opnieuw de gegevensset over sigarettenconsumptie in de VS. Dit keer staat elke boxplot voor de verdeling van sigarettenconsumptie in de tijd voor een bepaalde Amerikaanse staat. Elke boxplot is dus opgebouwd uit 11 datapunten voor de jaren 1985 tot en met 1995.

Standaard zijn de boxplots alfabetisch geordend op staatsnaam. Dat maakt het heel makkelijk om de details voor een specifieke staat op te zoeken, maar moeilijk om vragen te beantwoorden over waar de hoogste of laagste consumptie voorkomt. Door de rijen te sorteren op mediane sigarettenconsumptie worden die vragen makkelijker te beantwoorden.

De interkwartielafstand (IQR) meet de variatie in de “middelste helft” van de populatie (van het 25e percentiel tot het 75e percentiel). Dat betekent dat sorteren op de IQR het makkelijker maakt om vragen te beantwoorden over hoeveel variatie er was binnen de “typische” populatie.

Welke uitspraak is onjuist?

Deze oefening maakt deel uit van de cursus

Data­visualisatie begrijpen

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen