1. Learn
  2. /
  3. Cursuri
  4. /
  5. Eksploracja tekstu metodą Bag-of-Words w R

Connected

exercițiu

Słowa stopu i chmury słów

Skoro jesteś już w trybie eksploracji tekstu, czas zagłębić się w temat. W poprzedniej chmurze słów dominowało słowo „chardonnay" – tak bardzo, że trudno było dostrzec inne interesujące wnioski.

Zmieńmy listę słów stopu i dodajmy do niej „chardonnay", żeby sprawdzić, jakie inne słowa są częste, lecz wcześniej ginęły w tle.

W obszarze roboczym masz już oczyszczoną wersję tweetów o chardonnay. Teraz usuniemy kilka mało znaczących słów. W tym ćwiczeniu użyjemy funkcji content(), aby wyświetlić konkretny tweet do porównania. Pamiętaj o podwójnych nawiasach kwadratowych podczas indeksowania listy korpusu.

Instrucțiuni

100 XP
  • Zastosuj content() do 24. dokumentu w chardonnay_corp.
  • Dodaj "chardonnay" do angielskich słów stopu i przypisz wynik do stops.
  • Sprawdź ostatnie sześć słów w stops.
  • Utwórz cleaned_chardonnay_corp za pomocą tm_map(), przekazując kolejno: chardonnay_corp, funkcję removeWords() i listę słów stopu stops.
  • Wyświetl ponownie zawartość (content) 24. tweetu i porównaj wyniki.