Logistic regression op filmrecensies
In de video heb je gezien dat logistic regression een veelgebruikte manier is om een classificatietaak te modelleren, zoals het classificeren van sentiment als positief of negatief.
In deze oefening werk je met de movies-gegevensset met recensies. De kolom label bevat het sentiment: 1 als de recensie positief is en 0 als die negatief is. De tekstrecensie is met BOW omgezet naar numerieke kolommen.
Jouw taak is om een logistic regression-model te bouwen met de movies-gegevensset en de nauwkeurigheid te berekenen.
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in Python
Oefeninstructies
- Importeer de logistic regression-functie.
- Maak en fit een logistic regression op de labels
yen de featuresX. - Bereken de nauwkeurigheid van het logistic regression-model met de standaardmethode
.score().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the logistic regression
from ____.____ import ____
# Define the vector of targets and matrix of features
y = movies.label
X = movies.drop('label', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____(X, y))