ComeçarComece de graça

O que é tf-idf?

Você quer calcular o peso tf-idf para a palavra "computer", que aparece cinco vezes em um documento com 100 palavras. Dado um corpus com 200 documentos, dos quais 20 mencionam a palavra "computer", o tf-idf pode ser calculado multiplicando a frequência do termo pela inversa da frequência de documentos.

Frequência do termo = participação percentual da palavra em relação a todos os tokens do documento Inversa da frequência de documentos = logaritmo do número total de documentos em um corpus dividido pelo número de documentos que contêm o termo

Qual das opções abaixo está correta?

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em Python

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício