1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do analizy tekstu w R

Connected

ćwiczenie

Pogrupowane podsumowania

Jak widać, w zbiorze twitter_data jest więcej tweetów niebędących skargami niż skarg. Zanim przejdziesz do analizy samych tweetów, warto przyjrzeć się kilku innym kolumnom. Każdy tweet zawiera informację o liczbie obserwujących danego użytkownika – znajdziesz ją w kolumnie usr_followers_count. Jak myślisz – czy osoby, które składają skargi, mają średnio więcej czy mniej obserwujących niż pozostałe? Pogrupowane podsumowania pozwolą ci szybko znaleźć odpowiedź.

Instrukcje

100 XP
  • Pogrupuj dane według kolumny complaint_label.
  • Oblicz średnią, minimum i maksimum wartości w kolumnie usr_followers_count.