¿Qué es tf-idf?
Quieres calcular el peso tf-idf de la palabra "computer"
, que aparece cinco veces en un documento que contiene 100 palabras. Dado un corpus que contiene 200 documentos, con 20 documentos que mencionan la palabra "computer"
, el tf-idf puede calcularse multiplicando la frecuencia de términos por la frecuencia inversa de documentos.
Frecuencia del término = porcentaje de la palabra respecto a todos los tokens del documento Frecuencia inversa de documentos = logaritmo del número total de documentos de un corpus dividido por el número de documentos que contienen el término
¿Cuál de las siguientes opciones es correcta?
Este ejercicio forma parte del curso
Introducción al procesamiento de lenguaje natural en Python
Ejercicio interactivo práctico
Convierte la teoría en acción con uno de nuestros ejercicios interactivos
