ComeçarComece de graça

Seu primeiro TfIdf

Neste exercício, você vai aplicar o método TfIdf ao pequeno conjunto de dados annak, que contém a primeira frase de Anna Karenina, de Liev Tolstói.

Sua tarefa é trabalhar com esse conjunto de dados e aplicar a função TfidfVectorizer(). Lembre-se de que realizar uma transformação numérica do texto é o primeiro passo para entender o sentimento expresso. O Tfidf vectorizer é outra forma de construir um vocabulário a partir da nossa coluna de sentimento.

Este exercício faz parte do curso

Análise de Sentimentos em Python

Ver curso

Instruções do exercício

  • Importe a função para construir um vectorizer TfIdf de sklearn.feature_extraction.text.
  • Chame a função TfidfVectorizer() e ajuste (fit) no conjunto de dados annak.
  • Transforme o vectorizer.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the required function
____

annak = ['Happy families are all alike;', 'every unhappy family is unhappy in its own way']

# Call the vectorizer and fit it
anna_vect = ____.___(annak)

# Create the tfidf representation
anna_tfidf = anna_vect.____(annak)

# Print the result 
print(anna_tfidf.toarray())
Editar e executar o código