Logistische Regression von Filmkritiken
Im Video haben wir gelernt, dass die logistische Regression ein gängiger Ansatz ist, um Klassifikationsaufgaben zu modellieren, zum Beispiel um das Sentiment als positiv oder negativ zu klassifizieren.
In dieser Übung arbeitest du mit dem Datensatz movies mit Rezensionen. Die Spalte label enthält das Sentiment: 1 für eine positive und 0 für eine negative Rezension. Die Textrezension wurde mithilfe von BOW in numerische Spalten umgewandelt.
Deine Aufgabe ist es, ein logistisches Regressionsmodell mit dem Datensatz movies zu erstellen und seine Genauigkeit zu berechnen.
Diese Übung ist Teil des Kurses
Stimmungsanalyse in Python
Anleitung zur Übung
- Importiere die Funktion für die logistische Regression.
- Erstelle eine logistische Regression und fitte sie mit den Labels
yund den FeaturesX. - Berechne die Genauigkeit des logistischen Regressionsmodells mit der Standardmethode
.score().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the logistic regression
from ____.____ import ____
# Define the vector of targets and matrix of features
y = movies.label
X = movies.drop('label', axis=1)
# Build a logistic regression model and calculate the accuracy
log_reg = ____.____(X, y)
print('Accuracy of logistic regression: ', log_reg.____(X, y))