ComeçarComece de graça

Cálculos manuais

Dadas as 4 declarações limpas abaixo:

t1 <- "government turtle blue ocean"
t2 <- "crazy turtle ocean waves"
t3 <- "massive turtle washington lion"
t4 <- "lion pride massive ocean dinner"

O \(TFIDF\) para "lion" em t4 pode ser calculado assim:

  • \(TF = \frac{1}{5} = 0.2\)

  • \(IDF = log(4/2) = 0.693\)

  • \(TFIDF = .2 * 0.693\)

Calcule os pesos de \(TF\) e \(IDF\) para 'turtle' em t1. Use \(IDF = log \frac{N}{n_{t}}\)

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em R

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício