sklearn ile çapraz doğrulama
Bölümde açıklandığı gibi, veri kümesini aşırı uyumlama (overfitting) analitikte yaygın bir sorundur. Bu, bir model veriyi gereğinden fazla ezberlediğinde olur: eğitim aldığı veri kümesinde çok iyi performans gösterir, ancak bunun dışına genelleyemez.
Bölümde öğrendiğin train/test ayrımı modeli eğitim setine aşırı uydurmamayı sağlasa da, hiperparametre ayarlama işlemi, modeli test setinde en iyi tahmini yapacak şekilde ayarladığın için test bileşenine aşırı uyuma yol açabilir. Bu nedenle modeli farklı test setlerinde doğrulamak önerilir. K-katlı çapraz doğrulama bunu sağlar:
- veri kümesini bir eğitim ve bir test setine böler
- modeli uydurur, tahmin yapar ve bir skor hesaplar (doğruluk, kesinlik, duyarlılık gibi metrikleri belirtebilirsin)
- bu süreci toplamda k kez tekrarlar
- 10 skorun ortalamasını çıktı olarak verir
Bu egzersizde, veri kümemizde Çapraz Doğrulama kullanacak ve sonuçlarımızı cross_val_score fonksiyonuyla değerlendireceksin.
Bu egzersiz
İK Analitiği: Python ile Çalışan Terkini (Churn) Tahmin Etme
kursunun bir parçasıdırEgzersiz talimatları
- Çapraz doğrulamayı uygulamak için
sklearn.model_selectionmodülündencross_val_score()fonksiyonunu içe aktar. cvhiperparametresini 10 olarak belirterek modelin için çapraz doğrulama skorunu yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the function for implementing cross validation
from sklearn.model_selection import ____
# Use that function to print the cross validation score for 10 folds
print(____(model,features,target,____=10))