Seu primeiro TfIdf
Neste exercício, você vai aplicar o método TfIdf ao pequeno conjunto de dados annak, que contém a primeira frase de Anna Karenina, de Liev Tolstói.
Sua tarefa é trabalhar com esse conjunto de dados e aplicar a função TfidfVectorizer(). Lembre-se de que realizar uma transformação numérica do texto é o primeiro passo para entender o sentimento expresso. O Tfidf vectorizer é outra forma de construir um vocabulário a partir da nossa coluna de sentimento.
Este exercício faz parte do curso
Análise de Sentimentos em Python
Instruções do exercício
- Importe a função para construir um vectorizer TfIdf de
sklearn.feature_extraction.text. - Chame a função
TfidfVectorizer()e ajuste (fit) no conjunto de dadosannak. - Transforme o vectorizer.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the required function
____
annak = ['Happy families are all alike;', 'every unhappy family is unhappy in its own way']
# Call the vectorizer and fit it
anna_vect = ____.___(annak)
# Create the tfidf representation
anna_tfidf = anna_vect.____(annak)
# Print the result
print(anna_tfidf.toarray())