Cálculos manuales
Dadas las siguientes 4 frases ya limpiadas:
t1 <- "government turtle blue ocean"
t2 <- "crazy turtle ocean waves"
t3 <- "massive turtle washington lion"
t4 <- "lion pride massive ocean dinner"
El \(TFIDF\) para "lion" en t4 se puede calcular así:
\(TF = \frac{1}{5} = 0,2\)
\(IDF = log(4/2) = 0,693\)
\(TFIDF = 0,2 * 0,693\)
Calcula los pesos \(TF\) e \(IDF\) para 'turtle' en t1. Usa \(IDF = log \frac{N}{n_{t}}\)
Este ejercicio forma parte del curso
Introducción al procesamiento del lenguaje natural en R
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio