IniziaInizia gratis

Il tuo primo TfIdf

In questo esercizio applicherai il metodo TfIdf al piccolo dataset annak, che contiene la prima frase di Anna Karenina di Lev Tolstoj.

Il tuo compito è lavorare con questo insieme di dati e applicare la funzione TfidfVectorizer(). Ricorda che eseguire una trasformazione numerica del testo è il primo passo per riuscire a comprenderne il sentiment. Il vettorizzatore Tfidf è un altro modo per costruire un vocabolario a partire dalla nostra colonna del sentiment.

Questo esercizio fa parte del corso

Sentiment Analysis con Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa la funzione per creare un vettorizzatore TfIdf da sklearn.feature_extraction.text.
  • Chiama la funzione TfidfVectorizer() e fai il fit sul dataset annak.
  • Trasforma il vettorizzatore.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the required function
____

annak = ['Happy families are all alike;', 'every unhappy family is unhappy in its own way']

# Call the vectorizer and fit it
anna_vect = ____.___(annak)

# Create the tfidf representation
anna_tfidf = anna_vect.____(annak)

# Print the result 
print(anna_tfidf.toarray())
Modifica ed esegui il codice