Creare un classificatore per il diabete
Userai il dataset Pima Indians Diabetes per prevedere se una persona ha il diabete usando la regressione logistica. In questo insieme di dati ci sono 8 feature e un target. I dati sono stati suddivisi in un training set e in un test set e sono già stati pre-caricati come X_train, y_train, X_test e y_test.
Una istanza di StandardScaler() è stata predefinita come scaler e una di LogisticRegression() come lr.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in Python
Istruzioni dell'esercizio
- Esegui il fit dello scaler sulle feature di training e trasforma queste feature in un unico passaggio.
- Adestra il modello di regressione logistica sui dati di training scalati.
- Scala le feature di test.
- Predici la presenza di diabete sul test set scalato.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)
# Fit the logistic regression model on the scaled training data
lr.____(____, ____)
# Scale the test features
X_test_std = scaler.____(____)
# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)
# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))