Sentiment-Analyse für Filmrezensionen
In dieser Übung untersuchst du die Wahrscheinlichkeiten, die die logistische Regression für einen Teil des Large Movie Review Dataset ausgibt.
Die Variablen X und y sind bereits in die Umgebung geladen. X enthält Merkmale basierend darauf, wie oft Wörter in den Filmrezensionen vorkommen, und y enthält Labels dafür, ob die Rezension positiv (+1) oder negativ (-1) ist.
Diese Übung ist Teil des Kurses
Lineare Klassifikatoren in Python
Anleitung zur Übung
- Trainiere ein logistisches Regressionsmodell auf den Filmbewertungsdaten.
- Sage die Wahrscheinlichkeiten für negativ vs. positiv für die beiden gegebenen Rezensionen voraus.
- Schreib gern auch eigene Rezensionen und lass dir dafür die Wahrscheinlichkeiten ausgeben!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Instantiate logistic regression and train
lr = ____
lr.fit(____)
# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])
# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])