Faktör seviyeleri
Bir veri kümesini ilk gördüğünüzde genellikle belirli faktör seviyelerine sahip faktörler içerdiğini fark edersiniz. Ancak bazen netlik veya başka nedenlerle bu seviyelerin adlarını değiştirmek isteyebilirsiniz. R, levels()
fonksiyonu ile bunu yapmanıza olanak tanır:
levels(factor_vector) <- c("name1", "name2",...)
Bir ankette size sunulan ham veriler bunun güzel bir örneğidir. Her ankette bulunan yaygın bir soru, katılımcının cinsiyetidir. Burada basitlik için sadece iki kategori kaydedilmiştir: "M"
ve "F"
. (Anket verileri için genellikle daha fazla kategori gerekir ancak her iki durumda da kategorik verileri depolamak için bir faktör kullanırsınız).
survey_vector <- c("M", "F", "F", "M", "M")
Cinsiyeti "M"
ve "F"
kısaltmalarıyla kaydetmek, verileri kalem ve kağıtla topluyorsanız kullanışlı olabilir ancak verileri analiz ederken karışıklığa yol açabilir. Bu noktada netlik sağlamak için faktör seviyelerini "M"
ve "F"
yerine "Male"
ve "Female"
olarak değiştirmeniz gerekir.
Dikkat edin: Seviyeleri atadığınız sıra önemlidir. levels(factor_survey_vector)
yazarsanız çıktının [1] "F" "M"
olduğunu görürsünüz. Vektörü oluştururken faktör seviyelerini belirtmezseniz R
bunları otomatik olarak alfabetik sırayla atar. "F"
değerini "Female"
ve "M"
değerini "Male"
ile doğru şekilde eşlemek için seviyeler c("Female", "Male")
sırasıyla ayarlanmalıdır.
Bu egzersiz
R’ye Giriş
kursunun bir parçasıdırEgzersiz talimatları
survey_vector
içinden bir faktör vektörü oluşturan kodu inceleyin. Bir sonraki talimattafactor_survey_vector
kullanmalısınız.factor_survey_vector
faktör seviyelerinic("Female", "Male")
olarak değiştirin. Burada vektör elemanlarının sırasına dikkat edin.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Code to build factor_survey_vector
survey_vector <- c("M", "F", "F", "M", "M")
factor_survey_vector <- factor(survey_vector)
# Specify the levels of factor_survey_vector
levels(factor_survey_vector) <-
factor_survey_vector