ComenzarEmpieza gratis

¿Qué es tf-idf?

Quieres calcular el peso tf-idf de la palabra "computer", que aparece cinco veces en un documento que contiene 100 palabras. Dado un corpus que contiene 200 documentos, con 20 documentos que mencionan la palabra "computer", el tf-idf puede calcularse multiplicando la frecuencia de términos por la frecuencia inversa de documentos.

Frecuencia del término = porcentaje de la palabra respecto a todos los tokens del documento Frecuencia inversa de documentos = logaritmo del número total de documentos de un corpus dividido por el número de documentos que contienen el término

¿Cuál de las siguientes opciones es correcta?

Este ejercicio forma parte del curso

Introducción al procesamiento de lenguaje natural en Python

Ver curso

Ejercicio interactivo práctico

Convierte la teoría en acción con uno de nuestros ejercicios interactivos

Empieza a hacer ejercicio