Étape 2 : Identifier les sources de texte
Les avis des employés peuvent provenir de diverses sources. Si votre service des ressources humaines en avait les moyens, vous pourriez faire animer par un prestataire des groupes de discussion pour interroger des employés en interne et chez votre concurrent.
Forbes et d’autres publient des articles sur les « meilleurs lieux de travail », qui peuvent mentionner Amazon et Google. Une autre source d’information pourrait être des avis anonymes en ligne sur des sites comme Indeed, Glassdoor ou CareerBliss.
Ici, nous allons nous concentrer sur une collection d’avis anonymes en ligne.
Cet exercice fait partie du cours
Text mining avec sac de mots en R
Instructions
- Affichez la structure de
amznavecstr()pour obtenir ses dimensions et un aperçu des données. - Créez
amzn_prosà partir de la colonne des avis positifsamzn$pros. - Créez
amzn_consà partir de la colonne des avis négatifsamzn$cons. - Imprimez la structure de
googavecstr()pour obtenir ses dimensions et un aperçu des données. - Créez
goog_prosà partir de la colonne des avis positifsgoog$pros. - Créez
goog_consà partir de la colonne des avis négatifsgoog$cons.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print the structure of amzn
___
# Create amzn_pros
___ <- ___
# Create amzn_cons
___ <- ___
# Print the structure of goog
___(___)
# Create goog_pros
___ <- ___
# Create goog_cons
___ <- ___