1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracja tekstu metodą Bag-of-Words w R

Connected

ćwiczenie

Wczytaj dane tekstowe

Eksploracja tekstu zaczyna się od wczytania danych do R – posłuży do tego funkcja read.csv().

Dobrą praktyką jest sprawdzenie wczytanego obiektu, aby wiedzieć, które kolumny są istotne. Funkcja str() pozwala to zrobić szybko i wygodnie.

Jeśli ramka danych zawiera kolumny inne niż tekstowe, warto utworzyć nowy obiekt zawierający tylko odpowiednią kolumnę tekstową (np. some_object$column_name).

Pamiętaj, że są to prawdziwe dane z Twittera – mogą zawierać wulgaryzmy lub inne treści nieodpowiednie (dotyczy to tego ćwiczenia oraz kolejnych, w których również wykorzystywane są rzeczywiste dane z Twittera).

Instrukcje

100 XP

Dane zostały już wczytane i są dostępne w zmiennej coffee_data_file.

  • Utwórz nowy obiekt tweets, używając funkcji read.csv() na pliku coffee_data_file, który zawiera tweety z wzmiankami o kawie.
  • Sprawdź obiekt tweets za pomocą funkcji str(), aby ustalić, która kolumna zawiera tekst przeznaczony do analizy.
  • Utwórz nowy obiekt coffee_tweets zawierający tylko zidentyfikowaną wcześniej kolumnę tekstową. Skorzystaj z operatora $ i nazwy tej kolumny.