Kullanıcı türlerini sayma
Sayım, kategorik veriler için temel özetlemedir. Metin kategorik olduğundan, sayım yapmaya alışmak önemlidir. twitter_data, complaint_label sütununda belirtildiği gibi şikayet ve şikayet olmayanlardan oluşur ve ayrıca kullanıcının doğrulanıp doğrulanmadığını (yani Twitter'da kişinin gerçekten söylediği kişi olduğunun onaylandığını) belirten usr_verified adlı bir sütun içerir. Bu sütunun türü <lgl> olup mantıksaldır. Doğrulanmış kullanıcılar daha mı çok şikayet ediyor?
Bu egzersiz
R ile Metin Analizine Giriş
kursunun bir parçasıdırEgzersiz talimatları
dplyrveggplot2'yi içerentidyversepaketini yükle.- Veriyi filtreleyerek yalnızca şikayet olan tweet'leri tut.
- Şikayet eden doğrulanmış ve doğrulanmamış kullanıcıların sayısını hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load the tidyverse package
___(___)
twitter_data %>%
# Filter for just the complaints
___(___) %>%
# Count the number of verified and non-verified users
___(___)