Textvektorisierung
Jetzt wandelst du die Spalte desc im UFO-Datensatz in TF-IDF-Vektoren um, denn aus diesem Feld lässt sich vermutlich etwas lernen.
Diese Übung ist Teil des Kurses
<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>Übungsanweisungen
- Gib das
.head()der Spaltedescaus. - Erzeuge ein
TfidfVectorizer()-Objekt. - Fitte und transformiere die Spalte
descmitvec. - Gib die
.shapedes Vektorsdesc_tfidfaus, um dir die Anzahl der erzeugten Spalten anzusehen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Take a look at the head of the desc field
print(____)
# Instantiate the tfidf vectorizer object
vec = ____
# Fit and transform desc using vec
desc_tfidf = vec.____
# Look at the number of columns and rows
print(____.shape)