MulaiMulai sekarang secara gratis

Mengelompokkan dan mengubah bentuk kolom yang serupa

Dalam pelajaran ini, kita melihat bagaimana beberapa kolom dalam himpunan data survei data science dari Kaggle saling terkait, seperti kolom-kolom yang masing-masing membahas frekuensi berbagai tantangan kerja. Kita biasanya ingin meninjau variabel-variabel tersebut secara bersama-sama, tetapi pertama-tama, kita perlu menemukannya dan mengubahnya ke format yang lebih mudah digunakan. Mari kita coba prosesnya pada pertanyaan tentang seberapa bermanfaat berbagai platform pembelajaran menurut responden survei.

Himpunan data multiple_choice_responses telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Data Kategorikal di Tidyverse

Lihat Kursus

Petunjuk latihan

  • Pilih hanya kolom yang namanya mengandung "LearningPlatformUsefulness".
  • Ubah data dari format lebar ke format panjang dengan dua kolom, learning_platform dan usefulness.
  • Hapus baris dengan usefulness bernilai NA.
  • Hapus "LearningPlatformUsefulness" dari setiap string di learning_platform.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

learning_platform_usefulness <- multiple_choice_responses %>%
  # Select columns with LearningPlatformUsefulness in title
  ___(___("LearningPlatformUsefulness")) %>%
  # Change data from wide to long
  ___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
  # Remove rows where usefulness is NA
  ___(___()) %>%
  # Remove "LearningPlatformUsefulness" from each string in learning_platform 
  mutate(learning_platform = ___())
Edit dan Jalankan Kode