İki holdout kümesi oluştur
Kısa süre önce patronun için, parametre ayarı yapmadan basit bir random forest modeli kurup Tic-Tac-Toe oyununda kazanımları tahmin etmiştin. Ne yazık ki modelin genel doğruluğu onun standartlarının altında kaldı. Bu kez senden model performansına odaklanmanı istiyor.
Farklı modelleri ve parametre kümelerini denemeye başlamadan önce veriyi eğitim, doğrulama ve test veri kümelerine ayırman gerekiyor. Unutma: Veriyi önce eğitim ve test olarak böldükten sonra, doğrulama veri kümesi eğitim veri kümesinin tekrar bölünmesiyle oluşturulur.
X ve y veri kümeleri senin için yüklendi.
Bu egzersiz
Python'da Model Doğrulama
kursunun bir parçasıdırEgzersiz talimatları
- Geçici veri kümelerini ve test veri kümelerini (
X_test,y_test) oluştur. Test için toplam verinin %20'sini kullan. - Geçici veri kümelerini (
X_temp,y_temp) kullanarak eğitim (X_train,y_train) ve doğrulama (X_val,y_val) veri kümelerini oluştur. - Doğrulama veri kümeleri için geçici verinin %25'ini kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create temporary training and final testing datasets
X_temp, ____, y_temp, ____ =\
train_test_split(X, y, ____=____, random_state=1111)
# Create the final training and validation datasets
____, ____, ____, ____ =\
train_test_split(X_temp, y_temp, ____=____, random_state=1111)