O que é tf-idf?
Você quer calcular o peso tf-idf para a palavra "computer", que aparece cinco vezes em um documento com 100 palavras. Dado um corpus com 200 documentos, dos quais 20 mencionam a palavra "computer", o tf-idf pode ser calculado multiplicando a frequência do termo pela inversa da frequência de documentos.
Frequência do termo = participação percentual da palavra em relação a todos os tokens do documento Inversa da frequência de documentos = logaritmo do número total de documentos em um corpus dividido pelo número de documentos que contêm o termo
Qual das opções abaixo está correta?
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em Python
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício