Seviye sayısını elde etme
dplyr içinde mutate() ve summarize() ile, across() fonksiyonunu kullanarak ilk argümanının doğru olduğu tüm sütunlara ikinci argüman, yani bir fonksiyon, uygulanacak şekilde belirtebilirsin.
Bunları tidyr ile birlikte kullanarak multiple_choice_responses içindeki her faktör değişkeninin seviye sayısını elde edeceğiz. tidyr'dan pivot_longer() bir veri kümesini geniş formattan uzun formata dönüştürür. İki argümanı, yeni sütun adlarıdır — biri eski sütun adlarını, diğeri tüm değerleri içerir.
Bu egzersiz
Tidyverse'te Kategorik Veriler
kursunun bir parçasıdırEgzersiz talimatları
- Tüm karakter sütunlarını faktör sütunlarına çevir ve yeni veri kümesini
responses_as_factorsolarak kaydet. number_of_levelsadlı yeni bir veri kümesi oluştur, burada:- Her sütuna
nlevels()fonksiyonunu uygulamak içinsummarizeileacrosskullan. - Veri kümesinin biçimini genişten uzuna çevir.
- Her sütuna
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Change all the character columns to factors
responses_as_factors <- multiple_choice_responses %>%
mutate(___(is.character, as.factor))
number_of_levels <- responses_as_factors %>%
# Apply the function nlevels to each column
summarize(___(everything(), ___)) %>%
# Change the dataset from wide to long
___(everything(), names_to = "variable", values_to = "num_levels")