Havayolu tweet verileri
twitter_data veri çerçevesi, havayolları hakkında 7.000'in üzerinde tweet içeriyor. Tweet'ler, complaint_label sütununda şikayet veya şikayet değil olarak önceden sınıflandırılmış. Bu tweet'lerin kaç tanesinin şikayet olduğuna dair bir fikir edinelim.
Bunun Twitter'dan alınmış gerçek veri olduğunu unutma; bu nedenle küfür veya başka rahatsız edici içerik barındırma riski her zaman vardır (bu egzersizde ve gerçek Twitter verisi kullanan sonraki egzersizlerde).
Bu egzersiz
R ile Metin Analizine Giriş
kursunun bir parçasıdırEgzersiz talimatları
tidyversepaketini yükle.- Boyutu ve içeriği hakkında fikir edinmek için
twitter_data'yı yazdır. twitter_data'yı yalnızca şikayetler kalacak şekilde filtrele. Veri içinde kaç şikayet var?
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load the tidyverse packages
___(___)
# Print twitter_data
___
# Print just the complaints in twitter_data
twitter_data %>%
___(___ == ___)