LoslegenKostenlos starten

BoW- und TF-IDF-Repräsentationen vergleichen

Du bist Teil des Analytics-Teams bei einem Wearable-Tech-Unternehmen. Dein Ziel ist es, Produktmanager dabei zu unterstützen, das Kundenfeedback zur neuen Smartwatch des Unternehmens zu verstehen. Du hast den Text bereits vorverarbeitet und zwei Repräsentationen erstellt: bow_matrix mit CountVectorizer() und tfidf_matrix mit TfidfVectorizer(). In dieser Übung visualisierst und vergleichst du beide, um besser zu verstehen, wie jede die Wortwichtigkeit erfasst.

Diese Übung ist Teil des Kurses

<Kurs>Natural Language Processing (NLP) in Python</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Convert BoW matrix to a DataFrame
df_bow = pd.DataFrame(
    ____,
    columns=vectorizer.____
)

# Plot the heatmap
plt.figure(figsize=(10, 6))
sns.heatmap(____, annot=True)
plt.title("BoW Scores Across Reviews")
plt.xlabel("Terms")
plt.xticks(rotation=45)
plt.ylabel("Documents")
plt.show()
Code bearbeiten und ausführen