Ringkasan berkelompok
Ternyata ada lebih banyak tweet yang bukan keluhan dibandingkan keluhan di twitter_data. Anda mungkin mulai meragukan apakah data ini benar-benar dari Twitter! Ada beberapa kolom lain yang menarik di twitter_data yang sebaiknya dieksplorasi sebelum Anda masuk ke isi tweet. Setiap tweet mencantumkan jumlah pengikut pengguna pada kolom usr_followers_count. Menurut Anda, apakah mereka yang mengeluh cenderung memiliki lebih banyak atau lebih sedikit pengguna, rata-rata, dibandingkan mereka yang tidak mengeluh? Anda dapat menggunakan ringkasan berkelompok untuk memberikan jawaban dengan cepat dan mudah.
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Kelompokkan data berdasarkan
complaint_label. - Hitung rata-rata, minimum, dan maksimum dari
usr_followers_count.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Start with the data frame
___ %>%
# Group the data by whether or not the tweet is a complaint
___(___) %>%
# Compute the mean, min, and max follower counts
summarize(
avg_followers = ___(___),
min_followers = ___(___),
max_followers = ___(___)
)