BaşlayınÜcretsiz başlayın

scikit-learn'in KFold() yöntemi

Az önce bir meslektaşının, rastgele orman modeli kurup örneklem dışı doğruluğu hesaplayan kodunu çalıştırdın. Meslektaşının kodunda random_state olmadığını ve bulduğun hataların onun rapor ettiklerinden tamamen farklı olduğunu fark ettin.

Bu rastgele orman modelinin yeni veride ne kadar doğru olacağına dair daha iyi bir tahmin elde etmek için KFold çapraz doğrulama için kullanılacak bazı indeksler üretmeye karar verdin.

Bu egzersiz, kursun bir parçasıdır

Python'da Model Doğrulama

Kursa Göz Atın

Egzersiz talimatları

  • Veriyi beş kat, karıştırma etkin, random_state=1111 olacak şekilde bölmek için KFold() metodunu çağır.
  • KFold nesnesinin split() metodunu X üzerinde kullan.
  • Eğitim ve doğrulama indeks listelerindeki indeks sayısını yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

from sklearn.model_selection import KFold

# Use KFold
kf = KFold(____, ____, ____)

# Create splits
splits = kf.____(____)

# Print the number of indices
for train_index, val_index in splits:
    print("Number of training indices: %s" % len(____))
    print("Number of validation indices: %s" % len(____))
Kodu Düzenle ve Çalıştır