ComeçarComece de graça

Violação da linha do tempo

Para ilustrar a importância da linha do tempo, considere um exemplo em que você a viola e usa informações do período do alvo para construir as variáveis preditivas.

Há duas colunas no dataframe do pandas basetable: "amount_2017" é o total de doações em 2017, e "target" é 1 se esse valor for maior que 30 e 0 caso contrário.

Construa um modelo de regressão logística que use "amount_2017" como única variável preditiva para prever o alvo e calcule a AUC.

Este exercício faz parte do curso

Análise Preditiva Intermediária em Python

Ver curso

Instruções do exercício

  • Crie um dataframe X que contenha a variável preditiva e um dataframe y que contenha o alvo.
  • Ajuste o modelo de regressão logística de modo que y seja previsto a partir de X. Construa um modelo de regressão logística que use amount_2017 como única variável preditiva e preveja target.
  • Faça previsões para os objetos em X.
  • Calcule e imprima a AUC desse modelo usando a função roc_auc_score.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Select the relevant predictors and the target
X = basetable[["____"]]
y = basetable[["____"]]

# Build the logistic regression model
logreg = linear_model.LogisticRegression()
logreg.____(____, ____)

# Make predictions for X
predictions = logreg.____(____)[:,1]

# Calculate and print the AUC value
auc = ____(____, ____)
print(round(auc, 2))
Editar e executar o código