1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do analizy tekstu w R

Connected

ćwiczenie

Dane z tweetów o liniach lotniczych

Ramka danych twitter_data zawiera ponad 7 000 tweetów dotyczących linii lotniczych. Tweety zostały już sklasyfikowane jako skargi lub nie-skargi w kolumnie complaint_label. Sprawdźmy, ile spośród tych tweetów to skargi.

Pamiętaj, że są to prawdziwe dane z Twittera – istnieje zatem ryzyko, że mogą zawierać wulgaryzmy lub inne nieodpowiednie treści (w tym ćwiczeniu i w kolejnych, które również korzystają z rzeczywistych danych z Twittera).

Instrukcje

100 XP
  • Załaduj pakiet tidyverse.
  • Wyświetl twitter_data, aby zorientować się w rozmiarze i zawartości zbioru danych.
  • Przefiltruj twitter_data tak, aby zostały tylko skargi. Ile skarg znajduje się w danych?