LoslegenKostenlos loslegen

Sentiment-Analyse für Filmrezensionen

In dieser Übung untersuchst du die Wahrscheinlichkeiten, die die logistische Regression für einen Teil des Large Movie Review Dataset ausgibt.

Die Variablen X und y sind bereits in die Umgebung geladen. X enthält Merkmale basierend darauf, wie oft Wörter in den Filmrezensionen vorkommen, und y enthält Labels dafür, ob die Rezension positiv (+1) oder negativ (-1) ist.

Diese Übung ist Teil des Kurses

Lineare Klassifikatoren in Python

Kurs anzeigen

Anleitung zur Übung

  • Trainiere ein logistisches Regressionsmodell auf den Filmbewertungsdaten.
  • Sage die Wahrscheinlichkeiten für negativ vs. positiv für die beiden gegebenen Rezensionen voraus.
  • Schreib gern auch eigene Rezensionen und lass dir dafür die Wahrscheinlichkeiten ausgeben!

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Instantiate logistic regression and train
lr = ____
lr.fit(____)

# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])

# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])
Code bearbeiten und ausführen