ComeçarComece de graça

Construindo um classificador de diabetes

Você usará o conjunto de dados Pima Indians Diabetes para prever se uma pessoa tem diabetes usando regressão logística. Há 8 variáveis e um alvo nesse conjunto de dados. Os dados foram divididos em conjuntos de treino e teste e pré-carregados para você como X_train, y_train, X_test e y_test.

Uma instância de StandardScaler() foi predefinida como scaler e uma de LogisticRegression() como lr.

Este exercício faz parte do curso

Redução de Dimensionalidade em Python

Ver curso

Instruções do exercício

  • Ajuste o scaler nas variáveis de treino e transforme essas variáveis de uma vez só.
  • Ajuste o modelo de regressão logística nos dados de treino escalados.
  • Escalone as variáveis de teste.
  • Faça a predição da presença de diabetes no conjunto de teste escalado.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)

# Fit the logistic regression model on the scaled training data
lr.____(____, ____)

# Scale the test features
X_test_std = scaler.____(____)

# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)

# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))
Editar e executar o código