Construindo um classificador de diabetes
Você usará o conjunto de dados Pima Indians Diabetes para prever se uma pessoa tem diabetes usando regressão logística. Há 8 variáveis e um alvo nesse conjunto de dados. Os dados foram divididos em conjuntos de treino e teste e pré-carregados para você como X_train, y_train, X_test e y_test.
Uma instância de StandardScaler() foi predefinida como scaler e uma de LogisticRegression() como lr.
Este exercício faz parte do curso
Redução de Dimensionalidade em Python
Instruções do exercício
- Ajuste o
scalernas variáveis de treino e transforme essas variáveis de uma vez só. - Ajuste o modelo de regressão logística nos dados de treino escalados.
- Escalone as variáveis de teste.
- Faça a predição da presença de diabetes no conjunto de teste escalado.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit the scaler on the training features and transform these in one go
X_train_std = scaler.____(____)
# Fit the logistic regression model on the scaled training data
lr.____(____, ____)
# Scale the test features
X_test_std = scaler.____(____)
# Predict diabetes presence on the scaled test set
y_pred = lr.____(____)
# Prints accuracy metrics and feature coefficients
print(f"{accuracy_score(y_test, y_pred):.1%} accuracy on test set.")
print(dict(zip(X.columns, abs(lr.coef_[0]).round(2))))