ComenzarEmpieza gratis

Creando un clasificador de diabetes

Vas a usar el conjunto de datos de diabetes de los Pima Indians para predecir si una persona tiene diabetes mediante regresión logística. Este conjunto de datos tiene 8 características y un objetivo. Los datos se han dividido en entrenamiento y test y están precargados como X_train, y_train, X_test y y_test.

Se ha predefinido una instancia de StandardScaler() como scaler y otra de LogisticRegression() como lr.

Este ejercicio forma parte del curso

Reducción de dimensionalidad en Python

Ver curso

Instrucciones del ejercicio

  • Ajusta el escalador sobre las características de entrenamiento y transforma esas características de una sola vez.
  • Ajusta el modelo de regresión logística con los datos de entrenamiento escalados.
  • Escala las características de test.
  • Predice la presencia de diabetes en el conjunto de test escalado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)

# Fit the logistic regression model on the scaled training data
lr.____(____, ____)

# Scale the test features
X_test_std = scaler.____(____)

# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)

# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))
Editar y ejecutar código