Revisando os resultados do LDA

Você desenvolveu um modelo de tópicos, napoleon_model, com 5 tópicos para as frases do livro Animal Farm que fazem referência ao personagem principal, Napoleon. Você pediu a 5 autores locais que revisassem as principais palavras e as frases mais representativas de cada tópico, e eles forneceram temas para cada tópico.

Para finalizar seus resultados, prepare algumas estatísticas de resumo sobre os tópicos. Você apresentará esses valores de resumo junto com os temas para sua chefe revisar.

Este exercicio faz parte do curso

Introdução ao Processamento de Linguagem Natural em R

Ver curso

Instruções do exercicio

Extraia a matriz gamma do modelo de tópicos, napoleon_model.
Use funções do dplyr para criar um tibble com o principal tópico de cada frase, chamado grouped_gammas.
Use grouped_gammas para contar o número de frases mais similares a cada tópico.
Use grouped_gammas e calcule o valor médio de gamma para cada tópico.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Extract the gamma matrix 
gamma_values <- tidy(___, matrix = ___)
# Create grouped gamma tibble
grouped_gammas <- gamma_values %>%
  ___(document) %>%
  ___(desc(gamma)) %>%
  ___(1) %>%
  ___(topic)
# Count (tally) by topic
grouped_gammas %>% 
  ___(topic, sort=TRUE)
# Average topic weight for top topic for each sentence
grouped_gammas %>% 
  ___(avg=mean(gamma)) %>%
  ___(desc(avg))

Editar e Executar Código

Introdução ao Processamento de Linguagem Natural em R

IntermediárioNível de habilidade

4.8+

40 reviews

No Capítulo 4, cobrimos dois pilares do processamento de linguagem natural: análise de sentimentos e word embeddings. Essas são duas técnicas essenciais para quem está aprendendo os fundamentos de análise de texto. Além disso, você vai aprender brevemente sobre BERT, marcação de classe gramatical (part-of-speech tagging) e reconhecimento de entidades nomeadas. Quase 15 técnicas de análise diferentes foram abordadas neste curso, então o Capítulo 4 termina recapitulando todas as ótimas técnicas que você conhecerá aqui.

Exercise 1: Análise de sentimento Exercise 2: lexicons do tidytext Exercise 3: Scores de sentimento Exercise 4: Sentimento e emoção Exercise 5: Word embeddings Exercise 6: Prática com h2o Exercise 7: word2vec Exercise 8: Análises adicionais de NLP Exercise 9: Revisando métodos #1 Exercise 10: Revisão de métodos #2 Exercise 11: Conclusão