Cálculos manuais
Dadas as 4 declarações limpas abaixo:
t1 <- "government turtle blue ocean"
t2 <- "crazy turtle ocean waves"
t3 <- "massive turtle washington lion"
t4 <- "lion pride massive ocean dinner"
O \(TFIDF\) para "lion" em t4 pode ser calculado assim:
\(TF = \frac{1}{5} = 0.2\)
\(IDF = log(4/2) = 0.693\)
\(TFIDF = .2 * 0.693\)
Calcule os pesos de \(TF\) e \(IDF\) para 'turtle' em t1. Use \(IDF = log \frac{N}{n_{t}}\)
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em R
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício