Menghapus level
Tabel kontingensi dari latihan sebelumnya menunjukkan bahwa ada beberapa level dengan jumlah yang sangat rendah. Untuk menyederhanakan analisis, sering kali membantu untuk menghapus level-level tersebut.
Di R, ini memerlukan dua langkah: pertama memfilter baris mana pun dengan level yang jumlahnya sangat rendah, lalu menghapus level tersebut dari variabel faktor dengan droplevels(). Ini karena fungsi droplevels() akan tetap mempertahankan level yang hanya memiliki 1 atau 2 hitungan; fungsi ini hanya menghapus level yang tidak ada dalam himpunan data.
Latihan ini adalah bagian dari kursus
Analisis Data Eksploratori dengan R
Petunjuk latihan
Tabel kontingensi dari latihan sebelumnya tersedia di ruang kerja Anda sebagai tab.
- Muat paket
dplyr. - Cetak
tabuntuk mengetahui levelalignmana yang memiliki total entri paling sedikit. - Gunakan
filter()untuk memfilter semua bariscomicsdengan level tersebut, lalu hapus level yang tidak terpakai dengandroplevels(). Simpan himpunan data yang disederhanakan sebagaicomics_filtered.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load dplyr
___
# Print tab
___
# Remove align level
comics_filtered <- ___ %>%
___(align != ___) %>%
___()
# See the result
comics_filtered