Etapa 2: Identificando as fontes de texto
Avaliações de funcionários podem vir de várias fontes. Se o seu departamento de recursos humanos tiver disponibilidade, você pode contratar uma empresa terceirizada para conduzir grupos focais e entrevistar funcionários internamente e também da sua concorrente.
A Forbes e outras publicações divulgam artigos sobre os "melhores lugares para trabalhar", que podem mencionar Amazon e Google. Outra fonte de informação são avaliações anônimas em sites como Indeed, Glassdoor ou CareerBliss.
Aqui, vamos focar em uma coleção de avaliações anônimas publicadas online.
Este exercício faz parte do curso
Mineração de Texto com Bag-of-Words em R
Instruções do exercício
- Veja a estrutura de
amzncomstr()para obter suas dimensões e uma prévia dos dados. - Crie
amzn_prosa partir da coluna de avaliações positivasamzn$pros. - Crie
amzn_consa partir da coluna de avaliações negativasamzn$cons. - Mostre a estrutura de
googcomstr()para obter suas dimensões e uma prévia dos dados. - Crie
goog_prosa partir da coluna de avaliações positivasgoog$pros. - Crie
goog_consa partir da coluna de avaliações negativasgoog$cons.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print the structure of amzn
___
# Create amzn_pros
___ <- ___
# Create amzn_cons
___ <- ___
# Print the structure of goog
___(___)
# Create goog_pros
___ <- ___
# Create goog_cons
___ <- ___