KFold indekslerini kullanma
splits değişkenini zaten oluşturdun; bu değişken, candy-data veri kümesi için 5-katlı çapraz doğrulamayı tamamlamak üzere indeksleri içeriyor. Bir iş arkadaşının random forest modelinin yeni bir veri üzerinde ne kadar iyi performans göstereceğine dair daha iyi bir tahmin almak için, bu modeli az önce oluşturduğun beş farklı eğitim ve doğrulama indeksinde çalıştırmak istiyorsun.
Bu egzersizde, bu indeksleri kullanarak modelin doğruluğunu beş farklı bölünmede kontrol edeceksin. Bu sürece yardımcı olması için bir for döngüsü sağlandı.
Bu egzersiz
Python'da Model Doğrulama
kursunun bir parçasıdırEgzersiz talimatları
- Eğitim ve doğrulama verilerini oluştururken
Xveyiçinde doğru indeksleri çağırmak içintrain_indexveval_indexkullan. - Eğitim veri kümesini kullanarak
rfcmodelini eğit - Doğrulama veri kümesi için
rfcile tahminler üret ve doğrulama doğruluğunu yazdır
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
rfc = RandomForestRegressor(n_estimators=25, random_state=1111)
# Access the training and validation indices of splits
for train_index, val_index in splits:
# Setup the training and validation data
X_train, y_train = X[____], y[____]
X_val, y_val = X[____], y[____]
# Fit the random forest model
rfc.____(____, ____)
# Make predictions, and print the accuracy
predictions = rfc.____(____)
print("Split accuracy: " + str(mean_squared_error(y_val, predictions)))