CommencerCommencer gratuitement

Vectorisation de texte

Vous allez maintenant transformer la colonne desc du jeu de données sur les ovnis en vecteurs tf/idf, car il y a probablement des informations utiles à en tirer.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Affichez le .head() de la colonne desc.
  • Instanciez un objet TfidfVectorizer().
  • Ajustez et transformez la colonne desc avec vec.
  • Affichez la propriété .shape du vecteur desc_tfidf pour voir combien de colonnes cela a créé.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Take a look at the head of the desc field
print(____)

# Instantiate the tfidf vectorizer object
vec = ____

# Fit and transform desc using vec
desc_tfidf = vec.____

# Look at the number of columns and rows
print(____.shape)
Modifier et exécuter le code