Was ist ein Faktor und warum sollen Sie ihn verwenden? (3)
Es gibt zwei Arten von kategorialen Variablen: eine nominalskalierte Variable und eine ordinalskalierte Variable.
Eine nominale Variable ist eine kategoriale Variable ohne eine implizite Ordnung. Dies bedeutet, dass es unmöglich ist zu sagen, dass 'eine Variable mehr Wert als die andere Variable hat'. Ein Beispiel: Denken Sie an die kategoriale Variable animals_vector
mit den Kategorien"Elephant"
, "Giraffe"
, "Donkey"
und "Horse"
. Hier ist es unmöglich zu sagen, dass ein Tier über oder unter dem anderen Tier steht. (Beachten Sie, dass einige von Ihnen vielleicht nicht zustimmen werden ;-) ).
Im Gegensatz dazu, haben die ordinalen Variablen eine natürliche Ordnung. Betrachten wir, zum Beispiel, die kategorialen Variablen temperature_vector
mit den Kategorien: "Low"
, "Medium"
und "High"
. Hier ist es offensichtlich, dass "Medium"
über "Low"
steht und "High"
über "Medium"
.
This exercise is part of the course
Einführung in R
Exercise instructions
Klicken Sie auf 'Antwort abschicken', um zu überprüfen, wie R nominale und ordinale Variablen konstruiert und ausgibt. Keine Sorge, wenn Sie noch nicht den gesamten Code verstehen-, wir kommen später dazu.
Hands-on interactive exercise
Have a go at this exercise by completing this sample code.
# Tiere
animals_vector <- c("Elephant", "Giraffe", "Donkey", "Horse")
factor_animals_vector <- factor(animals_vector)
factor_animals_vector
# Temperaturen
temperature_vector <- c("High", "Low", "High","Low", "Medium")
factor_temperature_vector <- factor(temperature_vector, order = TRUE, levels = c("Low", "Medium", "High"))
factor_temperature_vector