Boxplot
De gegevensset die je gaat gebruiken is afgeleid van de Quarterly Interview Survey van de Consumer Expenditure Survey (CES) van het U.S. Department of Labor, Bureau of Labor Statistics. Hij is beschikbaar op de cursuspagina. De oorspronkelijke gegevensset bevat 869 huishoudens en 34 variabelen.
Eén kenmerk is een unieke ID, vijf beschrijven de grootte van het huishouden, zes bevatten andere kenmerken van het huishouden zoals leeftijd, opleiding, etniciteit, enzovoort. De overige variabelen staan voor de uitgaven van het huishouden. We focussen op de variabele thexp, al voor je uitgehaald en beschikbaar in de workspace, die overeenkomt met de totale huishoudelijke uitgaven.
Tot nu toe kreeg je visualisaties aangereikt. Nu ga je zelf een boxplot maken! Het pakket robustbase is alvast voor je geladen.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create boxplot
bp.thexp <- ___(___, col = "lightblue", main = "Standard boxplot", ylab = "Total household expenditure")