1. Leren
  2. /
  3. Cursussen
  4. /
  5. Introductie tot R

Connected

Opdracht

Factorlevels

Als je voor het eerst met een gegevensset werkt, merk je vaak dat die factoren bevat met bepaalde factorlevels. Soms wil je de namen van die levels aanpassen voor duidelijkheid of andere redenen. In R kan dat met de functie levels():

levels(factor_vector) <- c("name1", "name2",...)

Een goed voorbeeld is ruwe data uit een enquête. Een veelgestelde vraag in elke vragenlijst is het geslacht van de respondent. Hier zijn, voor de eenvoud, slechts twee categorieën vastgelegd: "M" en "F". (Voor enquêtegegevens heb je doorgaans meer categorieën nodig; hoe dan ook, je gebruikt een factor om categorische data op te slaan.)

survey_vector <- c("M", "F", "F", "M", "M")

Het noteren van geslacht met de afkortingen "M" en "F" is handig als je met pen en papier gegevens verzamelt, maar kan tijdens de analyse voor verwarring zorgen. Op dat moment wil je de factorlevels vaak aanpassen naar "Male" en "Female" in plaats van "M" en "F" voor meer duidelijkheid.

Let op: de volgorde waarin je de levels toewijst is belangrijk. Als je levels(factor_survey_vector) typt, zie je als output [1] "F" "M". Als je de levels niet opgeeft bij het maken van de vector, wijst R ze automatisch alfabetisch toe. Om "F" correct te koppelen aan "Female" en "M" aan "Male", moeten de levels worden ingesteld op c("Female", "Male"), in deze volgorde.

Instructies

100 XP
  • Bekijk de code die een factorvector maakt van survey_vector. Je gebruikt factor_survey_vector in de volgende stap.
  • Pas de factorlevels van factor_survey_vector aan naar c("Female", "Male"). Let op de volgorde van de vectorelementen.