Aan de slagGa gratis aan de slag

Stap 2: De tekstbronnen identificeren

Medewerkersreviews kunnen uit verschillende bronnen komen. Als je HR-afdeling de middelen had, zou je een externe partij focusgroepen kunnen laten organiseren om zowel je eigen medewerkers als die van je concurrent te interviewen.

Forbes en anderen publiceren artikelen over de "beste werkgevers", waarin Amazon en Google genoemd kunnen worden. Een andere bron zijn anonieme online reviews op websites zoals Indeed, Glassdoor of CareerBliss.

Hier richten we ons op een verzameling anonieme online reviews.

Deze oefening maakt deel uit van de cursus

Text mining met bag-of-words in R

Cursus bekijken

Oefeninstructies

  • Bekijk de structuur van amzn met str() om de afmetingen en een preview van de data te zien.
  • Maak amzn_pros op basis van de kolom met positieve reviews: amzn$pros.
  • Maak amzn_cons op basis van de kolom met negatieve reviews: amzn$cons.
  • Print de structuur van goog met str() om de afmetingen en een preview van de data te zien.
  • Maak goog_pros op basis van de kolom met positieve reviews: goog$pros.
  • Maak goog_cons op basis van de kolom met negatieve reviews: goog$cons.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print the structure of amzn
___

# Create amzn_pros
___ <- ___

# Create amzn_cons
___ <- ___

# Print the structure of goog
___(___)

# Create goog_pros
___ <- ___

# Create goog_cons
___ <- ___
Code bewerken en uitvoeren