Vettorializzazione del testo
Ora trasformerai la colonna desc dell'insieme di dati sugli UFO in vettori tf/idf, perché è probabile che questo campo contenga informazioni utili.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Stampa il
.head()della colonnadesc. - Istanzia un oggetto
TfidfVectorizer(). - Esegui fit e transform sulla colonna
descusandovec. - Stampa la
.shapedel vettoredesc_tfidf, per dare un'occhiata al numero di colonne create.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)