Violação da linha do tempo
Para ilustrar a importância da linha do tempo, considere um exemplo em que você a viola e usa informações do período do alvo para construir as variáveis preditivas.
Há duas colunas no dataframe do pandas basetable: "amount_2017" é o total de doações em 2017, e "target" é 1 se esse valor for maior que 30 e 0 caso contrário.
Construa um modelo de regressão logística que use "amount_2017" como única variável preditiva para prever o alvo e calcule a AUC.
Este exercício faz parte do curso
Análise Preditiva Intermediária em Python
Instruções do exercício
- Crie um dataframe
Xque contenha a variável preditiva e um dataframeyque contenha o alvo. - Ajuste o modelo de regressão logística de modo que
yseja previsto a partir deX. Construa um modelo de regressão logística que useamount_2017como única variável preditiva e prevejatarget. - Faça previsões para os objetos em
X. - Calcule e imprima a AUC desse modelo usando a função
roc_auc_score.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Select the relevant predictors and the target
X = basetable[["____"]]
y = basetable[["____"]]
# Build the logistic regression model
logreg = linear_model.LogisticRegression()
logreg.____(____, ____)
# Make predictions for X
predictions = logreg.____(____)[:,1]
# Calculate and print the AUC value
auc = ____(____, ____)
print(round(auc, 2))