Tekst vectoriseren
Je gaat nu de kolom title van de volunteer-gegevensset omzetten naar een tekstvector. Die gebruik je in de volgende oefening voor een voorspeltaak.
Deze oefening maakt deel uit van de cursus
Preprocessing voor Machine Learning in Python
Oefeninstructies
- Sla de kolom
volunteer["title"]op in een variabeletitle_text. - Instantieer een
TfidfVectorizeralstfidf_vec. - Zet de tekst in
title_textom naar een tf-idf-vector mettfidf_vec.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Take the title text
title_text = ____
# Create the vectorizer method
tfidf_vec = ____
# Transform the text into tf-idf vectors
text_tfidf = tfidf_vec.____(____)