CommencerCommencer gratuitement

Vectoriser du texte

Vous allez maintenant transformer la colonne title du jeu de données volunteer en un vecteur de texte, que vous utiliserez dans une tâche de prédiction au prochain exercice.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Stockez la colonne volunteer["title"] dans une variable nommée title_text.
  • Instanciez un TfidfVectorizer sous le nom tfidf_vec.
  • Transformez le texte de title_text en un vecteur tf-idf en utilisant tfidf_vec.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Take the title text
title_text = ____

# Create the vectorizer method
tfidf_vec = ____

# Transform the text into tf-idf vectors
text_tfidf = tfidf_vec.____(____)
Modifier et exécuter le code