Mulai sekarangMulai gratis

Mengelompokkan dan mengubah bentuk kolom yang serupa

Dalam pelajaran ini, kita melihat bagaimana beberapa kolom dalam himpunan data survei data science dari Kaggle saling terkait, seperti kolom-kolom yang masing-masing membahas frekuensi berbagai tantangan kerja. Kita biasanya ingin meninjau variabel-variabel tersebut secara bersama-sama, tetapi pertama-tama, kita perlu menemukannya dan mengubahnya ke format yang lebih mudah digunakan. Mari kita coba prosesnya pada pertanyaan tentang seberapa bermanfaat berbagai platform pembelajaran menurut responden survei.

Himpunan data multiple_choice_responses telah dimuat untuk Anda.

Latihan ini merupakan bagian dari kursus

Data Kategorikal di Tidyverse

Lihat Kursus

Instruksi latihan

  • Pilih hanya kolom yang namanya mengandung "LearningPlatformUsefulness".
  • Ubah data dari format lebar ke format panjang dengan dua kolom, learning_platform dan usefulness.
  • Hapus baris dengan usefulness bernilai NA.
  • Hapus "LearningPlatformUsefulness" dari setiap string di learning_platform.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

learning_platform_usefulness <- multiple_choice_responses %>%
  # Select columns with LearningPlatformUsefulness in title
  ___(___("LearningPlatformUsefulness")) %>%
  # Change data from wide to long
  ___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
  # Remove rows where usefulness is NA
  ___(___()) %>%
  # Remove "LearningPlatformUsefulness" from each string in learning_platform 
  mutate(learning_platform = ___())
Edit dan Jalankan Kode