Il tuo primo TfIdf
In questo esercizio applicherai il metodo TfIdf al piccolo dataset annak, che contiene la prima frase di Anna Karenina di Lev Tolstoj.
Il tuo compito è lavorare con questo insieme di dati e applicare la funzione TfidfVectorizer(). Ricorda che eseguire una trasformazione numerica del testo è il primo passo per riuscire a comprenderne il sentiment. Il vettorizzatore Tfidf è un altro modo per costruire un vocabolario a partire dalla nostra colonna del sentiment.
Questo esercizio fa parte del corso
Sentiment Analysis con Python
Istruzioni dell'esercizio
- Importa la funzione per creare un vettorizzatore TfIdf da
sklearn.feature_extraction.text. - Chiama la funzione
TfidfVectorizer()e fai il fit sul datasetannak. - Trasforma il vettorizzatore.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the required function
____
annak = ['Happy families are all alike;', 'every unhappy family is unhappy in its own way']
# Call the vectorizer and fit it
anna_vect = ____.___(annak)
# Create the tfidf representation
anna_tfidf = anna_vect.____(annak)
# Print the result
print(anna_tfidf.toarray())