Aan de slagGa gratis aan de slag

Wat is een factor en waarom zou je die gebruiken? (3)

Er zijn twee soorten categorische variabelen: een nominale categorische variabele en een ordinale categorische variabele.

Een nominale variabele is een categorische variabele zonder impliciete volgorde. Dat betekent dat je niet kunt zeggen dat "de ene meer waard is dan de andere". Denk bijvoorbeeld aan de categorische variabele animals_vector met de categorieën "Olifant", "Giraf", "Ezel" en "Paard". Hier is het onmogelijk te zeggen dat de ene boven of onder de andere staat. (Sommigen van jullie zijn het daar misschien niet mee eens ;-) ).

Daarentegen hebben ordinale variabelen wel een natuurlijke volgorde. Neem bijvoorbeeld de categorische variabele temperature_vector met de categorieën: "Low", "Medium" en "High". Hier is het duidelijk dat "Medium" boven "Low" staat en "High" boven "Medium".

Deze oefening maakt deel uit van de cursus

Inleiding tot R

Cursus bekijken

Oefeninstructies

Verzend het antwoord om te zien hoe R nominale en ordinale variabelen opbouwt en afdrukt. Maak je geen zorgen als je nog niet alle code begrijpt; daar komen we zo op terug.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Animals
animals_vector <- c("Elephant", "Giraffe", "Donkey", "Horse")
factor_animals_vector <- factor(animals_vector)
factor_animals_vector

# Temperature
temperature_vector <- c("High", "Low", "High","Low", "Medium")
factor_temperature_vector <- factor(temperature_vector, order = TRUE, levels = c("Low", "Medium", "High"))
factor_temperature_vector
Code bewerken en uitvoeren