IniziaInizia gratis

Creare un classificatore per il diabete

Userai il dataset Pima Indians Diabetes per prevedere se una persona ha il diabete usando la regressione logistica. In questo insieme di dati ci sono 8 feature e un target. I dati sono stati suddivisi in un training set e in un test set e sono già stati pre-caricati come X_train, y_train, X_test e y_test.

Una istanza di StandardScaler() è stata predefinita come scaler e una di LogisticRegression() come lr.

Questo esercizio fa parte del corso

Riduzione della dimensionalità in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Esegui il fit dello scaler sulle feature di training e trasforma queste feature in un unico passaggio.
  • Adestra il modello di regressione logistica sui dati di training scalati.
  • Scala le feature di test.
  • Predici la presenza di diabete sul test set scalato.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)

# Fit the logistic regression model on the scaled training data
lr.____(____, ____)

# Scale the test features
X_test_std = scaler.____(____)

# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)

# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))
Modifica ed esegui il codice