Tibble TFIDF vs dtm
TFIDF pode ser usado para similaridade entre documentos, classificação de texto e outras tarefas. Considere o tibble left_right_tfidf e a matriz documento-termo left_right_matrix. Ambos já foram carregados no console.
Qual das afirmações a seguir é verdadeira?
- A: O tibble contém uma linha por documento e uma coluna para cada palavra usada em todo o texto.
- B: O tibble contém as contagens de palavras, tf, idf e pesos tfidf para cada palavra em cada documento.
- C: O tibble e a matriz têm o mesmo número de linhas.
- D: As colunas da matriz documento-termo podem ser usadas em modelos de classificação.
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em R
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício