Paso 2: Identificar las fuentes de texto
Las reseñas de empleados pueden venir de varias fuentes. Si tu departamento de recursos humanos contara con los medios, podríais contratar a un tercero para organizar grupos focales y entrevistar a empleados internos y también de tu competidor.
Forbes y otros publican artículos sobre los "mejores lugares para trabajar", que pueden mencionar a Amazon y Google. Otra fuente de información podrían ser reseñas anónimas en línea de sitios como Indeed, Glassdoor o CareerBliss.
Aquí nos centraremos en un conjunto de reseñas anónimas en línea.
Este ejercicio forma parte del curso
Minería de texto con Bag-of-Words en R
Instrucciones del ejercicio
- Consulta la estructura de
amznconstr()para ver sus dimensiones y obtener una vista previa de los datos. - Crea
amzn_prosa partir de la columna de reseñas positivasamzn$pros. - Crea
amzn_consa partir de la columna de reseñas negativasamzn$cons. - Imprime la estructura de
googconstr()para ver sus dimensiones y obtener una vista previa de los datos. - Crea
goog_prosa partir de la columna de reseñas positivasgoog$pros. - Crea
goog_consa partir de la columna de reseñas negativasgoog$cons.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print the structure of amzn
___
# Create amzn_pros
___ <- ___
# Create amzn_cons
___ <- ___
# Print the structure of goog
___(___)
# Create goog_pros
___ <- ___
# Create goog_cons
___ <- ___