Çapraz doğrulama istatistikleri
Rastgele orman sınıflandırıcını ayarlamak için grid search CV kullandın ve şimdi aşırı uyum yapmadığından emin olmak için çapraz doğrulama sonuçlarını incelemek istiyorsun. Özellikle, her kat için ortalama test skorundan ortalama eğitim skorunu çıkarmak istiyorsun. Veri kümesi X_train ve y_train olarak, boru hattı pipe olarak mevcut; ayrıca pandas pd adıyla ve GridSearchCV() dahil olmak üzere bazı modüller önceden yüklü.
Bu egzersiz
Python'da Machine Learning İş Akışları Tasarlama
kursunun bir parçasıdırEgzersiz talimatları
- Üç katlı bir çapraz doğrulama ile bir grid search nesnesi oluştur ve hem eğitim hem de test istatistiklerini döndürmesini sağla.
- Grid search nesnesini eğitim verisine uygula.
- Uygulanan CV nesnesinin
cv_results_özniteliğinde bulunan çapraz doğrulama sonuçlarını bir dataframe'e kaydet. - Ortalama test skorunu içeren sütun ile ortalama eğitim skorunu içeren sütun arasındaki farkı yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Fit your pipeline using GridSearchCV with three folds
grid_search = GridSearchCV(
pipe, params, ____=3, return_train_score=____)
# Fit the grid search
gs = grid_search.____(____, ____)
# Store the results of CV into a pandas dataframe
results = pd.____(gs.____)
# Print the difference between mean test and training scores
print(
results[____]-results['mean_train_score'])