Mengelompokkan dan mengubah bentuk kolom yang serupa
Dalam pelajaran ini, kita melihat bagaimana beberapa kolom dalam himpunan data survei data science dari Kaggle saling terkait, seperti kolom-kolom yang masing-masing membahas frekuensi berbagai tantangan kerja. Kita biasanya ingin meninjau variabel-variabel tersebut secara bersama-sama, tetapi pertama-tama, kita perlu menemukannya dan mengubahnya ke format yang lebih mudah digunakan. Mari kita coba prosesnya pada pertanyaan tentang seberapa bermanfaat berbagai platform pembelajaran menurut responden survei.
Himpunan data multiple_choice_responses telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Data Kategorikal di Tidyverse
Petunjuk latihan
- Pilih hanya kolom yang namanya mengandung
"LearningPlatformUsefulness". - Ubah data dari format lebar ke format panjang dengan dua kolom,
learning_platformdanusefulness. - Hapus baris dengan
usefulnessbernilai NA. - Hapus
"LearningPlatformUsefulness"dari setiap string dilearning_platform.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
learning_platform_usefulness <- multiple_choice_responses %>%
# Select columns with LearningPlatformUsefulness in title
___(___("LearningPlatformUsefulness")) %>%
# Change data from wide to long
___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
# Remove rows where usefulness is NA
___(___()) %>%
# Remove "LearningPlatformUsefulness" from each string in learning_platform
mutate(learning_platform = ___())