Tek bir holdout kümesi oluştur
Patronun senden tic_tac_toe veri kümesi üzerinde basit bir random forest modeli kurmanı istedi. Parametre seçimine fazla zaman harcamanı istemiyor; onun yerine modelin gelecekteki veride ne kadar iyi performans göstereceğini bilmek istiyor. Gelecekteki Tic-Tac-Toe oyunları için, modelinin hangi oyuncunun kazanacağını tahmin edip edemeyeceğini bilmek güzel olurdu.
tic_tac_toe veri kümesi senin için yüklendi.
Python'da =\ ifadesi, kodun tek satıra sığmayacak kadar uzun olduğunu ve iki satıra bölündüğünü belirtir.
Bu egzersiz
Python'da Model Doğrulama
kursunun bir parçasıdırEgzersiz talimatları
- Tüm kategorik sütunlar için sahte değişkenler oluşturarak
Xveri kümesini oluştur. Xvey'yi eğitim (X_train,y_train) ve test (X_test,y_test) veri kümelerine ayır.- Veri kümelerini, test için %10 kullanarak böl.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create dummy variables using pandas
X = ____.____(tic_tac_toe.iloc[:,0:9])
y = tic_tac_toe.iloc[:, 9]
# Create training and testing datasets. Use 10% for the test set
____, ____, ____, ____ = ____(X, y, ____=____, random_state=1111)