LoslegenKostenlos loslegen

Modell erstellen und bewerten: Produktrezensionsdaten

In dieser Übung baust du eine logistische Regression mit dem Datensatz reviews, der Kundenrezensionen zu Amazon-Produkten enthält. Das Array y enthält das Sentiment: 1 bei positiv, sonst 0. Das Array X enthält alle numerischen Merkmale, die mit einem BOW-Ansatz erstellt wurden. Schau sie dir gern in der IPython-Shell an.

Deine Aufgabe ist es, ein logistisches Regressionsmodell zu erstellen und die Accuracy und die Konfusionsmatrix mit dem Testdatensatz zu berechnen.

Die Funktion für die logistische Regression sowie die Funktionen zum Aufteilen in Train/Test wurden bereits für dich importiert.

Diese Übung ist Teil des Kurses

Stimmungsanalyse in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere die Funktionen für Accuracy-Score und Konfusionsmatrix.
  • Teile die Daten in Training und Test auf, verwende 30 % als Testmenge und setze den Zufallssamen auf 42.
  • Trainiere ein logistisches Regressionsmodell.
  • Gib den Accuracy-Score und die Konfusionsmatrix mit den Testdaten aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the accuracy and confusion matrix
____

# Split the data into training and testing
X_train, X_test, y_train, y_test = ____(____, ____, ____=0.3, ____=42)

# Build a logistic regression
log_reg = ____._____

# Predict the labels 
y_predict = log_reg.predict(X_test)

# Print the performance metrics
print('Accuracy score of test data: ', ____(____, ____))
print('Confusion matrix of test data: \n', ____(____, ____)/len(y_test))
Code bearbeiten und ausführen