Vectoriser du texte
Vous allez maintenant transformer la colonne title du jeu de données volunteer en un vecteur de texte, que vous utiliserez dans une tâche de prédiction au prochain exercice.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Stockez la colonne
volunteer["title"]dans une variable nomméetitle_text. - Instanciez un
TfidfVectorizersous le nomtfidf_vec. - Transformez le texte de
title_texten un vecteur tf-idf en utilisanttfidf_vec.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Take the title text
title_text = ____
# Create the vectorizer method
tfidf_vec = ____
# Transform the text into tf-idf vectors
text_tfidf = tfidf_vec.____(____)