Zaman çizelgesi ihlali
Zaman çizelgesinin önemini göstermek için, zaman çizelgesini ihlal edip hedef dönemden gelen bilgiyi öngörücü değişkenleri oluşturmakta kullandığın bir örneği düşün.
basetable adlı pandas dataframe'inde iki sütun var: "amount_2017" 2017 yılındaki toplam bağış tutarı, "target" ise bu tutar 30'dan büyükse 1, değilse 0.
"amount_2017" değişkenini tek öngörücü olarak kullanan bir lojistik regresyon modeli kur ve hedefi tahmin et; ardından AUC'yi hesapla.
Bu egzersiz
Python ile Orta Düzey Öngörüsel Analitik
kursunun bir parçasıdırEgzersiz talimatları
- Öngörücü değişkeni içeren bir
Xdataframe'i ve hedefi içeren birydataframe'i oluştur. - Lojistik regresyon modelini,
yX'ten tahmin edilecek şekilde eğit.amount_2017değişkenini tek öngörücü olarak kullanıptarget'ı tahmin eden bir lojistik regresyon modeli kur. Xiçindeki gözlemler için tahmin yap.roc_auc_scorefonksiyonunu kullanarak bu modelin AUC değerini hesapla ve yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Select the relevant predictors and the target
X = basetable[["____"]]
y = basetable[["____"]]
# Build the logistic regression model
logreg = linear_model.LogisticRegression()
logreg.____(____, ____)
# Make predictions for X
predictions = logreg.____(____)[:,1]
# Calculate and print the AUC value
auc = ____(____, ____)
print(round(auc, 2))