Sentiment-Analyse für Filmrezensionen

In dieser Übung untersuchst du die Wahrscheinlichkeiten, die die logistische Regression für einen Teil des Large Movie Review Dataset ausgibt.

Die Variablen X und y sind bereits in die Umgebung geladen. X enthält Merkmale basierend darauf, wie oft Wörter in den Filmrezensionen vorkommen, und y enthält Labels dafür, ob die Rezension positiv (+1) oder negativ (-1) ist.

Diese Übung ist Teil des Kurses

Lineare Klassifikatoren in Python

Kurs anzeigen

Anleitung zur Übung

Trainiere ein logistisches Regressionsmodell auf den Filmbewertungsdaten.
Sage die Wahrscheinlichkeiten für negativ vs. positiv für die beiden gegebenen Rezensionen voraus.
Schreib gern auch eigene Rezensionen und lass dir dafür die Wahrscheinlichkeiten ausgeben!

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Instantiate logistic regression and train
lr = ____
lr.fit(____)

# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])

# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])

Code bearbeiten und ausführen