BaşlayınÜcretsiz Başlayın

scikit-learn'in KFold() yöntemi

Az önce bir meslektaşının, rastgele orman modeli kurup örneklem dışı doğruluğu hesaplayan kodunu çalıştırdın. Meslektaşının kodunda random_state olmadığını ve bulduğun hataların onun rapor ettiklerinden tamamen farklı olduğunu fark ettin.

Bu rastgele orman modelinin yeni veride ne kadar doğru olacağına dair daha iyi bir tahmin elde etmek için KFold çapraz doğrulama için kullanılacak bazı indeksler üretmeye karar verdin.

Bu egzersiz

Python'da Model Doğrulama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Veriyi beş kat, karıştırma etkin, random_state=1111 olacak şekilde bölmek için KFold() metodunu çağır.
  • KFold nesnesinin split() metodunu X üzerinde kullan.
  • Eğitim ve doğrulama indeks listelerindeki indeks sayısını yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

from sklearn.model_selection import KFold

# Use KFold
kf = KFold(____, ____, ____)

# Create splits
splits = kf.____(____)

# Print the number of indices
for train_index, val_index in splits:
    print("Number of training indices: %s" % len(____))
    print("Number of validation indices: %s" % len(____))
Kodu Düzenle ve Çalıştır