IniziaInizia gratis

Vettorializzazione del testo

Ora trasformerai la colonna desc dell'insieme di dati sugli UFO in vettori tf/idf, perché è probabile che questo campo contenga informazioni utili.

Questo esercizio fa parte del corso

Preprocessing per il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Stampa il .head() della colonna desc.
  • Istanzia un oggetto TfidfVectorizer().
  • Esegui fit e transform sulla colonna desc usando vec.
  • Stampa la .shape del vettore desc_tfidf, per dare un'occhiata al numero di colonne create.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Take a look at the head of the desc field
print(____)

# Instantiate the tfidf vectorizer object
vec = ____

# Fit and transform desc using vec
desc_tfidf = vec.____

# Look at the number of columns and rows
print(____.shape)
Modifica ed esegui il codice