scikit-learn'in KFold() yöntemi
Az önce bir meslektaşının, rastgele orman modeli kurup örneklem dışı doğruluğu hesaplayan kodunu çalıştırdın. Meslektaşının kodunda random_state olmadığını ve bulduğun hataların onun rapor ettiklerinden tamamen farklı olduğunu fark ettin.
Bu rastgele orman modelinin yeni veride ne kadar doğru olacağına dair daha iyi bir tahmin elde etmek için KFold çapraz doğrulama için kullanılacak bazı indeksler üretmeye karar verdin.
Bu egzersiz, kursun bir parçasıdır
Python'da Model Doğrulama
Egzersiz talimatları
- Veriyi beş kat, karıştırma etkin,
random_state=1111olacak şekilde bölmek içinKFold()metodunu çağır. KFoldnesnesininsplit()metodunuXüzerinde kullan.- Eğitim ve doğrulama indeks listelerindeki indeks sayısını yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
from sklearn.model_selection import KFold
# Use KFold
kf = KFold(____, ____, ____)
# Create splits
splits = kf.____(____)
# Print the number of indices
for train_index, val_index in splits:
print("Number of training indices: %s" % len(____))
print("Number of validation indices: %s" % len(____))