Creando un clasificador de diabetes

Vas a usar el conjunto de datos de diabetes de los Pima Indians para predecir si una persona tiene diabetes mediante regresión logística. Este conjunto de datos tiene 8 características y un objetivo. Los datos se han dividido en entrenamiento y test y están precargados como X_train, y_train, X_test y y_test.

Se ha predefinido una instancia de StandardScaler() como scaler y otra de LogisticRegression() como lr.

Este ejercicio forma parte del curso

Reducción de dimensionalidad en Python

Ver curso

Instrucciones del ejercicio

Ajusta el escalador sobre las características de entrenamiento y transforma esas características de una sola vez.
Ajusta el modelo de regresión logística con los datos de entrenamiento escalados.
Escala las características de test.
Predice la presencia de diabetes en el conjunto de test escalado.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)

# Fit the logistic regression model on the scaled training data
lr.____(____, ____)

# Scale the test features
X_test_std = scaler.____(____)

# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)

# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))

Editar y ejecutar código