BaşlayınÜcretsiz Başlayın

KFold indekslerini kullanma

splits değişkenini zaten oluşturdun; bu değişken, candy-data veri kümesi için 5-katlı çapraz doğrulamayı tamamlamak üzere indeksleri içeriyor. Bir iş arkadaşının random forest modelinin yeni bir veri üzerinde ne kadar iyi performans göstereceğine dair daha iyi bir tahmin almak için, bu modeli az önce oluşturduğun beş farklı eğitim ve doğrulama indeksinde çalıştırmak istiyorsun.

Bu egzersizde, bu indeksleri kullanarak modelin doğruluğunu beş farklı bölünmede kontrol edeceksin. Bu sürece yardımcı olması için bir for döngüsü sağlandı.

Bu egzersiz

Python'da Model Doğrulama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Eğitim ve doğrulama verilerini oluştururken X ve y içinde doğru indeksleri çağırmak için train_index ve val_index kullan.
  • Eğitim veri kümesini kullanarak rfc modelini eğit
  • Doğrulama veri kümesi için rfc ile tahminler üret ve doğrulama doğruluğunu yazdır

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

rfc = RandomForestRegressor(n_estimators=25, random_state=1111)

# Access the training and validation indices of splits
for train_index, val_index in splits:
    # Setup the training and validation data
    X_train, y_train = X[____], y[____]
    X_val, y_val = X[____], y[____]
    # Fit the random forest model
    rfc.____(____, ____)
    # Make predictions, and print the accuracy
    predictions = rfc.____(____)
    print("Split accuracy: " + str(mean_squared_error(y_val, predictions)))
Kodu Düzenle ve Çalıştır