ComenzarEmpieza gratis

¿Qué es tf-idf?

Quieres calcular el peso tf-idf para la palabra "computer", que aparece cinco veces en un documento que contiene 100 palabras. Dado un corpus con 200 documentos, de los cuales 20 mencionan la palabra "computer", tf-idf se puede calcular multiplicando la frecuencia del término por la frecuencia inversa de documento.

Frecuencia del término = proporción porcentual de la palabra respecto a todos los tokens del documento Frecuencia inversa de documento = logaritmo del número total de documentos en un corpus dividido entre el número de documentos que contienen el término

¿Cuál de las siguientes opciones es correcta?

Este ejercicio forma parte del curso

Introducción al Natural Language Processing en Python

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio