Sentimentanalyse voor filmrecensies

In deze oefening ga je de waarschijnlijkheden verkennen die door logistic regression worden gegeven op een subset van de Large Movie Review Dataset.

De variabelen X en y zijn al in de omgeving geladen. X bevat features op basis van hoe vaak woorden in de filmrecensies voorkomen, en y bevat labels die aangeven of de sentiment van de recensie positief (+1) of negatief (-1) is.

Deze oefening maakt deel uit van de cursus

Lineaire classificatoren in Python

Bekijk cursus

Oefeninstructies

Train een logistic-regressionmodel op de filmrecensiedata.
Voorspel de waarschijnlijkheden van negatief vs. positief voor de twee gegeven recensies.
Schrijf gerust je eigen recensies en vraag daar ook de waarschijnlijkheden voor op!

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Instantiate logistic regression and train
lr = ____
lr.fit(____)

# Predict sentiment for a glowing review
review1 = "LOVED IT! This movie was amazing. Top 10 this year."
review1_features = get_features(review1)
print("Review:", review1)
print("Probability of positive review:", lr.predict_proba(____)[0,1])

# Predict sentiment for a poor review
review2 = "Total junk! I'll never watch a film by that director again, no matter how good the reviews."
review2_features = get_features(review2)
print("Review:", review2)
print("Probability of positive review:", lr.predict_proba(____)[0,1])

Code bewerken en uitvoeren