Einen Diabetes-Klassifikator bauen
Du verwendest den Pima-Indians-Diabetes-Datensatz, um mit logistischer Regression vorherzusagen, ob eine Person Diabetes hat. In diesem Datensatz gibt es 8 Merkmale und ein Ziel. Die Daten wurden in Trainings- und Testmenge aufgeteilt und für dich als X_train, y_train, X_test und y_test vorab geladen.
Eine Instanz von StandardScaler() wurde als scaler und eine von LogisticRegression() als lr vordefiniert.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in Python
Anleitung zur Übung
- Fitte den Scaler auf die Trainingsmerkmale und transformiere diese Merkmale in einem Schritt.
- Fitte das logistische Regressionsmodell auf die skalierten Trainingsdaten.
- Skaliere die Testmerkmale.
- Sage die Präsenz von Diabetes auf dem skalierten Testset voraus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)
# Fit the logistic regression model on the scaled training data
lr.____(____, ____)
# Scale the test features
X_test_std = scaler.____(____)
# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)
# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))