CommencerCommencez gratuitement

Vectoriser du texte

Vous allez maintenant transformer la colonne title du jeu de données volunteer en un vecteur de texte, que vous utiliserez dans une tâche de prédiction au prochain exercice.

Cet exercice fait partie du cours

<cours>Prétraitement pour le Machine Learning en Python</cours>
Voir le cours

Instructions de l’exercice

  • Stockez la colonne volunteer["title"] dans une variable nommée title_text.
  • Instanciez un TfidfVectorizer sous le nom tfidf_vec.
  • Transformez le texte de title_text en un vecteur tf-idf en utilisant tfidf_vec.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Take the title text
title_text = ____

# Create the vectorizer method
tfidf_vec = ____

# Transform the text into tf-idf vectors
text_tfidf = tfidf_vec.____(____)
Modifier et exécuter le code