1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to R

Connected

cvičení

Úrovně faktoru

Když dostaneš nový dataset, často zjistíš, že obsahuje faktory s konkrétními úrovněmi. Někdy ale budeš chtít názvy těchto úrovní změnit – třeba pro větší srozumitelnost nebo z jiných důvodů. V R to umožňuje funkce levels():

levels(factor_vector) <- c("name1", "name2",...)

Názorným příkladem jsou surová data z dotazníkového průzkumu. Jedna z nejčastějších otázek v každém dotazníku se týká pohlaví respondenta. Pro jednoduchost byly zde zaznamenány jen dvě kategorie: "M" a "F". (V praxi bývá kategorií více; v každém případě se ke ukládání kategoriálních dat používá faktor.)

survey_vector <- c("M", "F", "F", "M", "M")

Zkratky "M" a "F" se hodí při sběru dat tužkou na papíře, ale při analýze dat mohou způsobit zmatek. Proto se v takový moment obvykle vyplatí změnit úrovně faktoru na "Male" a "Female" místo "M" a "F".

Pozor: záleží na pořadí, ve kterém úrovně přiřazuješ. Po zadání levels(factor_survey_vector) uvidíš výstup [1] "F" "M". Pokud při vytváření vektoru úrovně faktoru neurčíš, R je automaticky přiřadí abecedně. Aby se "F" správně namapovalo na "Female" a "M" na "Male", musíš úrovně nastavit jako c("Female", "Male") – právě v tomto pořadí.

Pokyny

100 XP
  • Prohlédni si kód, který vytváří faktorový vektor z survey_vector. V dalším kroku budeš pracovat s factor_survey_vector.
  • Změň úrovně faktoru factor_survey_vector na c("Female", "Male"). Dej pozor na pořadí prvků vektoru.