1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracja tekstu metodą Bag-of-Words w R

Connected

ćwiczenie

Krok 2: Identyfikacja źródeł tekstu

Opinie pracowników mogą pochodzić z różnych źródeł. Jeśli dział zasobów ludzkich dysponuje odpowiednimi zasobami, można zlecić zewnętrznej firmie przeprowadzenie grup fokusowych – zarówno wśród własnych pracowników, jak i pracowników konkurencji.

Forbes i inne serwisy publikują artykuły o „najlepszych miejscach pracy", które mogą wspominać o Amazonie i Google. Kolejnym źródłem informacji są anonimowe opinie zamieszczane w serwisach takich jak Indeed, Glassdoor czy CareerBliss.

W tym ćwiczeniu skupimy się na zbiorze anonimowych opinii online.

Instrukcje

100 XP
  • Wyświetl strukturę obiektu amzn za pomocą funkcji str(), aby poznać jego wymiary i uzyskać podgląd danych.
  • Utwórz zmienną amzn_pros na podstawie kolumny z pozytywnymi opiniami amzn$pros.
  • Utwórz zmienną amzn_cons na podstawie kolumny z negatywnymi opiniami amzn$cons.
  • Wyświetl strukturę obiektu goog za pomocą funkcji str(), aby poznać jego wymiary i uzyskać podgląd danych.
  • Utwórz zmienną goog_pros na podstawie kolumny z pozytywnymi opiniami goog$pros.
  • Utwórz zmienną goog_cons na podstawie kolumny z negatywnymi opiniami goog$cons.