Eğitim veri kümesi boyutunu değiştirmek
Eğitim ve test kümelerinin boyutu, model performansını etkiler. Modeller, daha fazla eğitim verisi olduğunda daha iyi öğrenir. Ancak eğitim verisine aşırı uyum sağlama (overfit) ve yeni veriye iyi genelleşememe riski vardır; bu yüzden modelin genelleme yeteneğini doğru değerlendirebilmek için yeterli miktarda test verisine ihtiyacın var. Sonuç olarak, eğitim için ne kadar kullandığın ve test için ne kadar ayırdığın arasında önemli bir denge ve ödünleşim bulunur.
Şimdiye kadar verinin %70’ini eğitim, %30’unu test için kullandın. Şimdi verinin %80’ini eğitim için kullanıp modelin performansının nasıl değiştiğini değerlendirelim.
Bu egzersiz
Pazarlama Analitiği: Python ile Müşteri Terkini Tahmin Etme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import train_test_split
from sklearn.model_selection import train_test_split
# Create feature variable
X = telco.drop('Churn', axis=1)
# Create target variable
y = telco['Churn']
# Create training and testing sets
X_train, X_test, y_train, y_test = ____