1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w R

Connected

ćwiczenie

Ćwiczenie z h2o

W R dostępnych jest wiele bibliotek do uczenia maszynowego. Biblioteka h2o jest jednak wyjątkowo prosta w użyciu i oferuje implementację word2vec. Można jej również używać do wielu innych zadań z zakresu uczenia maszynowego. Aby jednak skorzystać z biblioteki h2o, musisz wykonać dodatkowe kroki wstępnego przetwarzania danych. Masz do dyspozycji zbiór danych o nazwie left_right, który zawiera tweety automatycznie opublikowane podczas kampanii wyborczej w USA w 2016 roku.

Zamiast przygotowywać dane pod inne techniki analizy tekstu, przygotuj ten zbiór danych do użycia z biblioteką h2o.

Instrukcje

100 XP
  • Zaimportuj bibliotekę, a następnie zainicjuj sesję h2o.
  • Utwórz obiekt h2o.
  • Dokonaj tokenizacji tweetów zapisanych w kolumnie content.
  • Przekształć słowa na małe litery i usuń wszystkie słowa stopowe.