ComeçarComece de graça

Disputa acirrada, parte 2! Avaliações negativas

Em ambas as organizações, as pessoas mencionaram "culture" e "smart people", então há alguns aspectos positivos semelhantes entre as duas empresas. No entanto, com o gráfico de pirâmide, você pode começar a inferir diferentes graus de características positivas dos ambientes de trabalho.

Agora você decide voltar a atenção para as avaliações negativas e fazer a mesma visualização. Desta vez, você já tem o data frame common_words no seu workspace. No entanto, os bigramas comuns neste exercício vêm de avaliações de funcionários negativas.

Este exercício faz parte do curso

Mineração de Texto com Bag-of-Words em R

Ver curso

Instruções do exercício

  • Usando slice_max() em common_words, obtenha os 5 principais bigramas referindo-se à coluna diff. Os resultados do novo objeto serão impressos no seu console.
  • Crie um pyramid.plot(). Passe top5_df$AmazonNeg, top5_df$GoogleNeg e labels = top5_df$terms. Para melhor rotulagem, defina
    • gap como 12.
    • top.labels como c("Amzn", "Neg Words", "Goog")

Os argumentos main e unit já estão definidos para você.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Extract top 5 common bigrams
(top5_df <- ___ %>% ___(___, n = ___))

# Create a pyramid plot
___(
    # Amazon on the left
    top5_df$___,
    # Google on the right
    top5_df$___,
    # Use terms for labels
    labels = top5_df$___,
    # Set the gap to 12
    ___ = ___,
    # Set top.labels to "Amzn", "Neg Words" & "Goog"
    ___ = ___,
    main = "Words in Common", 
    unit = NULL
)
Editar e executar o código