sklearn ile çapraz doğrulama

Bölümde açıklandığı gibi, veri kümesini aşırı uyumlama (overfitting) analitikte yaygın bir sorundur. Bu, bir model veriyi gereğinden fazla ezberlediğinde olur: eğitim aldığı veri kümesinde çok iyi performans gösterir, ancak bunun dışına genelleyemez.
Bölümde öğrendiğin train/test ayrımı modeli eğitim setine aşırı uydurmamayı sağlasa da, hiperparametre ayarlama işlemi, modeli test setinde en iyi tahmini yapacak şekilde ayarladığın için test bileşenine aşırı uyuma yol açabilir. Bu nedenle modeli farklı test setlerinde doğrulamak önerilir. K-katlı çapraz doğrulama bunu sağlar:

veri kümesini bir eğitim ve bir test setine böler
modeli uydurur, tahmin yapar ve bir skor hesaplar (doğruluk, kesinlik, duyarlılık gibi metrikleri belirtebilirsin)
bu süreci toplamda k kez tekrarlar
10 skorun ortalamasını çıktı olarak verir

Bu egzersizde, veri kümemizde Çapraz Doğrulama kullanacak ve sonuçlarımızı cross_val_score fonksiyonuyla değerlendireceksin.

Bu egzersiz, kursun bir parçasıdır

İK Analitiği: Python ile Çalışan Terkini (Churn) Tahmin Etme

Kursa Göz Atın

Egzersiz talimatları

Çapraz doğrulamayı uygulamak için sklearn.model_selection modülünden cross_val_score() fonksiyonunu içe aktar.
cv hiperparametresini 10 olarak belirterek modelin için çapraz doğrulama skorunu yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import the function for implementing cross validation
from sklearn.model_selection import ____

# Use that function to print the cross validation score for 10 folds
print(____(model,features,target,____=10))

Kodu Düzenle ve Çalıştır