ComeçarComece de graça

Tibble TFIDF vs dtm

TFIDF pode ser usado para similaridade entre documentos, classificação de texto e outras tarefas. Considere o tibble left_right_tfidf e a matriz documento-termo left_right_matrix. Ambos já foram carregados no console.

Qual das afirmações a seguir é verdadeira?

  • A: O tibble contém uma linha por documento e uma coluna para cada palavra usada em todo o texto.
  • B: O tibble contém as contagens de palavras, tf, idf e pesos tfidf para cada palavra em cada documento.
  • C: O tibble e a matriz têm o mesmo número de linhas.
  • D: As colunas da matriz documento-termo podem ser usadas em modelos de classificação.

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em R

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício