Benzer sütunları gruplayıp yeniden biçimlendirme
Bu derste, Kaggle veri bilimi anketi veri kümesindeki bazı sütunların birbiriyle ilişkili olduğunu gördük; örneğin farklı iş zorluklarının sıklığını ele alan sütunlar gibi. Genellikle bu değişkenlere birlikte bakmak isteriz ama önce onları bulup kullanımı daha kolay bir formata dönüştürmemiz gerekir. Bunu, katılımcıların öğrenme için farklı platformları ne kadar faydalı bulduğuna dair sorularla deneyelim.
multiple_choice_responses veri kümesi senin için yüklendi.
Bu egzersiz, kursun bir parçasıdır
Tidyverse'te Kategorik Veriler
Egzersiz talimatları
- Adında
"LearningPlatformUsefulness"geçen sütunları seç. - Veriyi geniş formattan iki sütunlu uzun formata çevir:
learning_platformveusefulness. usefulnessdeğeri NA olan satırları kaldır.learning_platformiçindeki her dizgeden"LearningPlatformUsefulness"ifadesini kaldır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
learning_platform_usefulness <- multiple_choice_responses %>%
# Select columns with LearningPlatformUsefulness in title
___(___("LearningPlatformUsefulness")) %>%
# Change data from wide to long
___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
# Remove rows where usefulness is NA
___(___()) %>%
# Remove "LearningPlatformUsefulness" from each string in learning_platform
mutate(learning_platform = ___())