R-kare için çapraz doğrulama
Çapraz doğrulama, bir modeli değerlendirmek için çok önemli bir yaklaşımdır. Model yalnızca eğitilmekle kalmayıp eldeki tüm veriler üzerinde test edildiği için, modele sunulan veri miktarını en üst düzeye çıkarır.
Bu egzersizde bir doğrusal regresyon modeli kuracak, ardından sosyal medya reklam harcamalarına göre satış tahmini yapmadaki doğruluğunu değerlendirmek için 6 katlı çapraz doğrulama uygulayacaksın. Altı katın her biri için tek tek skoru görüntüleyeceksin.
sales_df veri kümesi, hedef değişken için y ve özellikler için X olarak ayrıldı ve senin için önceden yüklendi. LinearRegression da sklearn.linear_model içinden içe aktarıldı.
Bu egzersiz, kursun bir parçasıdır
scikit-learn ile Supervised Learning
Egzersiz talimatları
KFoldvecross_val_scoreöğelerini içe aktar.- Altı parçaya bölmek için
n_splitsdeğerini altı yaparak,shuffledeğeriniTrueayarlayarak ve tohum değerini5vererekKFold()çağrısıylakfoluştur. regmodeliniXveyüzerinde kullanarak çapraz doğrulama yap;cvparametresinekfgeçir.cv_scoresçıktısını yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import the necessary modules
from ____.____ import ____, ____
# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)
reg = LinearRegression()
# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)
# Print scores
print(____)