Ein zweites Spielzeugmodell
In dieser Übung baust du einen weiteren Klassifikator mit logistischer Regression auf einem Datensatz von Bildern. Jedes Bild stellt eine Zahl von 0 bis 9 dar. Ziel ist es, jedes Bild als Zahl zu klassifizieren – zum Beispiel als 7 oder 9. Die verwendeten Features sind bestimmte Pixelwerte im Bereich 0–16, aus denen das Bild besteht. Anstatt die Genauigkeit per Hand zu berechnen, bewertest du die Genauigkeit des Modells mit accuracy_score() aus sklearn.
Beispieldaten sind als image_data geladen, außerdem sklearn und pandas als pd. LogisticRegression ist über sklearn.linear_model verfügbar.
Diese Übung ist Teil des Kurses
CTR-Vorhersage mit Machine Learning in Python
Anleitung zur Übung
- Ermittle die Zeilenanzahl von
X, um den Index zu bestimmen, an dem du Trainings- und Testdaten trennst. - Erstelle einen Klassifikator für logistische Regression.
- Erzeuge Vorhersagen mit dem Klassifikator und bewerte die Genauigkeit mit
accuracy_score()aussklearn.metrics.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define X and y
X = image_data.data
y = image_data.target
# Define training and testing
split = int(0.7 * ____(X))
X_train, X_test, y_train, y_test = \
X[:split], X[split:], y[:split], y[split:]
# Create logistic regression classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(X_train, y_train).____(X_test)
print(____(y_test, y_pred))