Analyse van enquêtegegevens
Een categorische variabele is een variabele die één van een beperkt aantal mogelijke waarden kan aannemen.
Laten we het werken met categorische data oefenen voor je sollicitatiegesprek, met de survey-gegevensset uit het MASS-pakket.
De gegevensset bevat antwoorden van studenten statistiek op verschillende vragen.
Een van de vragen gaat over hoe vaak de studenten sporten. De antwoorden op deze vraag staan in de kolom Exer.
De mogelijke antwoorden waren:
"None""Some", en"Freq"(frequent).
Let op dat deze antwoorden in een volgorde gezet kunnen worden.
Onthoud dat tapply() een functie toepast op elke groep waarden binnen categorieën.
Bijvoorbeeld,
tapply(survey$Age, survey$Sex, median)
berekent de mediaanleeftijd per geslacht.
De gegevensset is vooraf geladen en opgeslagen in de variabele survey.
Deze oefening maakt deel uit van de cursus
Oefenen met statistiek-vragen voor sollicitaties in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Return the structure of Exer
str(___)
# Create the ordered factor
survey$Exer_ordered <- ___(survey$Exer, ___ = c("None", ___, ___), ordered = ___)
# Return the structure of Exer_ordered
___(___)