Creando un clasificador de diabetes
Vas a usar el conjunto de datos de diabetes de los Pima Indians para predecir si una persona tiene diabetes mediante regresión logística. Este conjunto de datos tiene 8 características y un objetivo. Los datos se han dividido en entrenamiento y test y están precargados como X_train, y_train, X_test y y_test.
Se ha predefinido una instancia de StandardScaler() como scaler y otra de LogisticRegression() como lr.
Este ejercicio forma parte del curso
Reducción de dimensionalidad en Python
Instrucciones del ejercicio
- Ajusta el escalador sobre las características de entrenamiento y transforma esas características de una sola vez.
- Ajusta el modelo de regresión logística con los datos de entrenamiento escalados.
- Escala las características de test.
- Predice la presencia de diabetes en el conjunto de test escalado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)
# Fit the logistic regression model on the scaled training data
lr.____(____, ____)
# Scale the test features
X_test_std = scaler.____(____)
# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)
# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))