Vectorisation de texte
Vous allez maintenant transformer la colonne desc du jeu de données sur les ovnis en vecteurs tf/idf, car il y a probablement des informations utiles à en tirer.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Affichez le
.head()de la colonnedesc. - Instanciez un objet
TfidfVectorizer(). - Ajustez et transformez la colonne
descavecvec. - Affichez la propriété
.shapedu vecteurdesc_tfidfpour voir combien de colonnes cela a créé.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)