O que é tf-idf?
Você quer calcular o peso tf-idf para a palavra "computer", que aparece cinco vezes em um documento com 100 palavras. Dado um corpus com 200 documentos, dos quais 20 mencionam a palavra "computer", o tf-idf pode ser calculado multiplicando a frequência do termo pela inversa da frequência de documentos.
Frequência do termo = participação percentual da palavra em relação a todos os tokens do documento Inversa da frequência de documentos = logaritmo do número total de documentos em um corpus dividido pelo número de documentos que contêm o termo
Qual das opções abaixo está correta?
Este exercicio faz parte do curso
Introdução ao Processamento de Linguagem Natural em Python
exercicio interativo prático
Transforme teoria em prática com um dos nossos exercicio interativos
Iniciar exercicio