Gruplandırılmış özetler
twitter_data içinde şikâyet olmayanlar, şikâyetlerden daha fazla. Belki de bu verinin gerçekten Twitter'dan gelip gelmediğini sorgulamaya başlamışsındır! Tweet'lerin kendisine geçmeden önce keşfetmene yardımcı olacak birkaç ilgi çekici sütun daha var. Her tweet'te, kullanıcının kaç takipçisi olduğunu gösteren usr_followers_count sütunu bulunur. Sence şikâyet edenlerin ortalama takipçi sayısı, şikâyet etmeyenlere göre daha mı fazla yoksa daha mı az? Hızlı ve kolay bir yanıt için gruplandırılmış özetleri kullanabilirsin.
Bu egzersiz
R ile Metin Analizine Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Verileri
complaint_labelile grupla. usr_followers_countiçin ortalama, minimum ve maksimum değerleri hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Start with the data frame
___ %>%
# Group the data by whether or not the tweet is a complaint
___(___) %>%
# Compute the mean, min, and max follower counts
summarize(
avg_followers = ___(___),
min_followers = ___(___),
max_followers = ___(___)
)