LoslegenKostenlos loslegen

Einen Diabetes-Klassifikator bauen

Du verwendest den Pima-Indians-Diabetes-Datensatz, um mit logistischer Regression vorherzusagen, ob eine Person Diabetes hat. In diesem Datensatz gibt es 8 Merkmale und ein Ziel. Die Daten wurden in Trainings- und Testmenge aufgeteilt und für dich als X_train, y_train, X_test und y_test vorab geladen.

Eine Instanz von StandardScaler() wurde als scaler und eine von LogisticRegression() als lr vordefiniert.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in Python

Kurs anzeigen

Anleitung zur Übung

  • Fitte den Scaler auf die Trainingsmerkmale und transformiere diese Merkmale in einem Schritt.
  • Fitte das logistische Regressionsmodell auf die skalierten Trainingsdaten.
  • Skaliere die Testmerkmale.
  • Sage die Präsenz von Diabetes auf dem skalierten Testset voraus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)

# Fit the logistic regression model on the scaled training data
lr.____(____, ____)

# Scale the test features
X_test_std = scaler.____(____)

# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)

# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))
Code bearbeiten und ausführen