Stap 2: De tekstbronnen identificeren
Medewerkersreviews kunnen uit verschillende bronnen komen. Als je HR-afdeling de middelen had, zou je een externe partij focusgroepen kunnen laten organiseren om zowel je eigen medewerkers als die van je concurrent te interviewen.
Forbes en anderen publiceren artikelen over de "beste werkgevers", waarin Amazon en Google genoemd kunnen worden. Een andere bron zijn anonieme online reviews op websites zoals Indeed, Glassdoor of CareerBliss.
Hier richten we ons op een verzameling anonieme online reviews.
Deze oefening maakt deel uit van de cursus
Text mining met bag-of-words in R
Oefeninstructies
- Bekijk de structuur van
amznmetstr()om de afmetingen en een preview van de data te zien. - Maak
amzn_prosop basis van de kolom met positieve reviews:amzn$pros. - Maak
amzn_consop basis van de kolom met negatieve reviews:amzn$cons. - Print de structuur van
googmetstr()om de afmetingen en een preview van de data te zien. - Maak
goog_prosop basis van de kolom met positieve reviews:goog$pros. - Maak
goog_consop basis van de kolom met negatieve reviews:goog$cons.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print the structure of amzn
___
# Create amzn_pros
___ <- ___
# Create amzn_cons
___ <- ___
# Print the structure of goog
___(___)
# Create goog_pros
___ <- ___
# Create goog_cons
___ <- ___