1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do R

Connected

ćwiczenie

Poziomy czynnika

Pracując z nowym zbiorem danych, często zauważysz, że zawiera on czynniki z określonymi poziomami. Czasem jednak warto zmienić nazwy tych poziomów, aby były bardziej czytelne. W R możesz to zrobić za pomocą funkcji levels():

levels(factor_vector) <- c("name1", "name2",...)

Dobrym przykładem są dane surowe pochodzące z ankiety. Jedno z najczęstszych pytań w kwestionariuszach dotyczy płci respondenta. Dla uproszczenia zapisano tu tylko dwie kategorie: "M" i "F". (W praktyce ankietowej zazwyczaj stosuje się więcej kategorii, ale w każdym przypadku do przechowywania danych kategorycznych używa się czynnika.)

survey_vector <- c("M", "F", "F", "M", "M")

Zapisywanie płci za pomocą skrótów "M" i "F" jest wygodne przy zbieraniu danych na papierze, ale podczas analizy może powodować nieporozumienia. Dlatego warto wtedy zmienić poziomy czynnika na "Male" i "Female", zamiast zostawiać "M" i "F".

Uwaga: kolejność przypisywania poziomów ma znaczenie. Po wpisaniu levels(factor_survey_vector) zobaczysz wynik [1] "F" "M". Jeśli poziomy nie zostaną jawnie określone podczas tworzenia wektora, R przypisze je automatycznie w kolejności alfabetycznej. Aby poprawnie przyporządkować "F" do "Female" i "M" do "Male", poziomy należy ustawić jako c("Female", "Male") — właśnie w tej kolejności.

Instrukcje

100 XP
  • Przejrzyj kod, który tworzy wektor czynnikowy na podstawie survey_vector. W następnym kroku będziesz korzystać z factor_survey_vector.
  • Zmień poziomy czynnika factor_survey_vector na c("Female", "Male"). Zwróć uwagę na kolejność elementów wektora.