LoslegenKostenlos starten

Textvektorisierung

Jetzt wandelst du die Spalte desc im UFO-Datensatz in TF-IDF-Vektoren um, denn aus diesem Feld lässt sich vermutlich etwas lernen.

Diese Übung ist Teil des Kurses

<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Gib das .head() der Spalte desc aus.
  • Erzeuge ein TfidfVectorizer()-Objekt.
  • Fitte und transformiere die Spalte desc mit vec.
  • Gib die .shape des Vektors desc_tfidf aus, um dir die Anzahl der erzeugten Spalten anzusehen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Take a look at the head of the desc field
print(____)

# Instantiate the tfidf vectorizer object
vec = ____

# Fit and transform desc using vec
desc_tfidf = vec.____

# Look at the number of columns and rows
print(____.shape)
Code bearbeiten und ausführen