Seviye sayısını elde etme
dplyr içinde mutate() ve summarize() ile, across() fonksiyonunu kullanarak ilk argümanının doğru olduğu tüm sütunlara ikinci argüman, yani bir fonksiyon, uygulanacak şekilde belirtebilirsin.
Bunları tidyr ile birlikte kullanarak multiple_choice_responses içindeki her faktör değişkeninin seviye sayısını elde edeceğiz. tidyr'dan pivot_longer() bir veri kümesini geniş formattan uzun formata dönüştürür. İki argümanı, yeni sütun adlarıdır — biri eski sütun adlarını, diğeri tüm değerleri içerir.
Bu egzersiz, kursun bir parçasıdır
Tidyverse'te Kategorik Veriler
Egzersiz talimatları
- Tüm karakter sütunlarını faktör sütunlarına çevir ve yeni veri kümesini
responses_as_factorsolarak kaydet. number_of_levelsadlı yeni bir veri kümesi oluştur, burada:- Her sütuna
nlevels()fonksiyonunu uygulamak içinsummarizeileacrosskullan. - Veri kümesinin biçimini genişten uzuna çevir.
- Her sütuna
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Change all the character columns to factors
responses_as_factors <- multiple_choice_responses %>%
mutate(___(is.character, as.factor))
number_of_levels <- responses_as_factors %>%
# Apply the function nlevels to each column
summarize(___(everything(), ___)) %>%
# Change the dataset from wide to long
___(everything(), names_to = "variable", values_to = "num_levels")