¿Qué es tf-idf?
Quieres calcular el peso tf-idf para la palabra "computer", que aparece cinco veces en un documento que contiene 100 palabras. Dado un corpus con 200 documentos, de los cuales 20 mencionan la palabra "computer", tf-idf se puede calcular multiplicando la frecuencia del término por la frecuencia inversa de documento.
Frecuencia del término = proporción porcentual de la palabra respecto a todos los tokens del documento Frecuencia inversa de documento = logaritmo del número total de documentos en un corpus dividido entre el número de documentos que contienen el término
¿Cuál de las siguientes opciones es correcta?
Este ejercicio forma parte del curso
Introducción al Natural Language Processing en Python
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio