LoslegenKostenlos starten

Einen Diabetes-Klassifikator bauen

Du verwendest den Pima-Indians-Diabetes-Datensatz, um mit logistischer Regression vorherzusagen, ob eine Person Diabetes hat. In diesem Datensatz gibt es 8 Merkmale und ein Ziel. Die Daten wurden in Trainings- und Testmenge aufgeteilt und für dich als X_train, y_train, X_test und y_test vorab geladen.

Eine Instanz von StandardScaler() wurde als scaler und eine von LogisticRegression() als lr vordefiniert.

Diese Übung ist Teil des Kurses

<Kurs>Dimensionsreduktion in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Fitte den Scaler auf die Trainingsmerkmale und transformiere diese Merkmale in einem Schritt.
  • Fitte das logistische Regressionsmodell auf die skalierten Trainingsdaten.
  • Skaliere die Testmerkmale.
  • Sage die Präsenz von Diabetes auf dem skalierten Testset voraus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)

# Fit the logistic regression model on the scaled training data
lr.____(____, ____)

# Scale the test features
X_test_std = scaler.____(____)

# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)

# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))
Code bearbeiten und ausführen