Eğitim veri kümesi boyutunu değiştirmek
Eğitim ve test kümelerinin boyutu, model performansını etkiler. Modeller, daha fazla eğitim verisi olduğunda daha iyi öğrenir. Ancak eğitim verisine aşırı uyum sağlama (overfit) ve yeni veriye iyi genelleşememe riski vardır; bu yüzden modelin genelleme yeteneğini doğru değerlendirebilmek için yeterli miktarda test verisine ihtiyacın var. Sonuç olarak, eğitim için ne kadar kullandığın ve test için ne kadar ayırdığın arasında önemli bir denge ve ödünleşim bulunur.
Şimdiye kadar verinin %70’ini eğitim, %30’unu test için kullandın. Şimdi verinin %80’ini eğitim için kullanıp modelin performansının nasıl değiştiğini değerlendirelim.
Bu egzersiz, kursun bir parçasıdır
Pazarlama Analitiği: Python ile Müşteri Terkini Tahmin Etme
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import train_test_split
from sklearn.model_selection import train_test_split
# Create feature variable
X = telco.drop('Churn', axis=1)
# Create target variable
y = telco['Churn']
# Create training and testing sets
X_train, X_test, y_train, y_test = ____