Gruplandırılmış özetler
twitter_data içinde şikâyet olmayanlar, şikâyetlerden daha fazla. Belki de bu verinin gerçekten Twitter'dan gelip gelmediğini sorgulamaya başlamışsındır! Tweet'lerin kendisine geçmeden önce keşfetmene yardımcı olacak birkaç ilgi çekici sütun daha var. Her tweet'te, kullanıcının kaç takipçisi olduğunu gösteren usr_followers_count sütunu bulunur. Sence şikâyet edenlerin ortalama takipçi sayısı, şikâyet etmeyenlere göre daha mı fazla yoksa daha mı az? Hızlı ve kolay bir yanıt için gruplandırılmış özetleri kullanabilirsin.
Bu egzersiz, kursun bir parçasıdır
R ile Metin Analizine Giriş
Egzersiz talimatları
- Verileri
complaint_labelile grupla. usr_followers_countiçin ortalama, minimum ve maksimum değerleri hesapla.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Start with the data frame
___ %>%
# Group the data by whether or not the tweet is a complaint
___(___) %>%
# Compute the mean, min, and max follower counts
summarize(
avg_followers = ___(___),
min_followers = ___(___),
max_followers = ___(___)
)