Sentimentanalyse voor filmrecensies
In deze oefening ga je de waarschijnlijkheden verkennen die door logistic regression worden gegeven op een subset van de Large Movie Review Dataset.
De variabelen X en y zijn al in de omgeving geladen. X bevat features op basis van hoe vaak woorden in de filmrecensies voorkomen, en y bevat labels die aangeven of de sentiment van de recensie positief (+1) of negatief (-1) is.
Deze oefening maakt deel uit van de cursus
Lineaire classificatoren in Python
Oefeninstructies
- Train een logistic-regressionmodel op de filmrecensiedata.
- Voorspel de waarschijnlijkheden van negatief vs. positief voor de twee gegeven recensies.
- Schrijf gerust je eigen recensies en vraag daar ook de waarschijnlijkheden voor op!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Instantiate logistic regression and train
lr = ____
lr.fit(____)
# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])
# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])