Menghitung jenis pengguna
Hitungan adalah ringkasan esensial untuk data kategorikal. Karena teks bersifat kategorikal, penting untuk terbiasa menghitung jumlah kemunculan. twitter_data terdiri dari keluhan dan non-keluhan, seperti ditunjukkan oleh kolom complaint_label, dan juga mencakup kolom yang menunjukkan apakah pengguna terverifikasi atau tidak (artinya, mereka telah dikonfirmasi oleh Twitter sebagai identitas yang mereka klaim) bernama usr_verified. Perhatikan bahwa kolom tersebut bertipe <lgl>, yaitu logis. Apakah pengguna terverifikasi lebih sering mengeluh?
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Muat paket
tidyverse, yang mencakupdplyrdanggplot2. - Saring data untuk hanya mempertahankan tweet yang merupakan keluhan.
- Hitung jumlah pengguna terverifikasi dan tidak terverifikasi yang mengeluh.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the tidyverse package
___(___)
twitter_data %>%
# Filter for just the complaints
___(___) %>%
# Count the number of verified and non-verified users
___(___)