scikit-learn'in KFold() yöntemi
Az önce bir meslektaşının, rastgele orman modeli kurup örneklem dışı doğruluğu hesaplayan kodunu çalıştırdın. Meslektaşının kodunda random_state olmadığını ve bulduğun hataların onun rapor ettiklerinden tamamen farklı olduğunu fark ettin.
Bu rastgele orman modelinin yeni veride ne kadar doğru olacağına dair daha iyi bir tahmin elde etmek için KFold çapraz doğrulama için kullanılacak bazı indeksler üretmeye karar verdin.
Bu egzersiz
Python'da Model Doğrulama
kursunun bir parçasıdırEgzersiz talimatları
- Veriyi beş kat, karıştırma etkin,
random_state=1111olacak şekilde bölmek içinKFold()metodunu çağır. KFoldnesnesininsplit()metodunuXüzerinde kullan.- Eğitim ve doğrulama indeks listelerindeki indeks sayısını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
from sklearn.model_selection import KFold
# Use KFold
kf = KFold(____, ____, ____)
# Create splits
splits = kf.____(____)
# Print the number of indices
for train_index, val_index in splits:
print("Number of training indices: %s" % len(____))
print("Number of validation indices: %s" % len(____))