BaşlayınÜcretsiz Başlayın

Çapraz doğrulama istatistikleri

Rastgele orman sınıflandırıcını ayarlamak için grid search CV kullandın ve şimdi aşırı uyum yapmadığından emin olmak için çapraz doğrulama sonuçlarını incelemek istiyorsun. Özellikle, her kat için ortalama test skorundan ortalama eğitim skorunu çıkarmak istiyorsun. Veri kümesi X_train ve y_train olarak, boru hattı pipe olarak mevcut; ayrıca pandas pd adıyla ve GridSearchCV() dahil olmak üzere bazı modüller önceden yüklü.

Bu egzersiz

Python'da Machine Learning İş Akışları Tasarlama

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Üç katlı bir çapraz doğrulama ile bir grid search nesnesi oluştur ve hem eğitim hem de test istatistiklerini döndürmesini sağla.
  • Grid search nesnesini eğitim verisine uygula.
  • Uygulanan CV nesnesinin cv_results_ özniteliğinde bulunan çapraz doğrulama sonuçlarını bir dataframe'e kaydet.
  • Ortalama test skorunu içeren sütun ile ortalama eğitim skorunu içeren sütun arasındaki farkı yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Fit your pipeline using GridSearchCV with three folds
grid_search = GridSearchCV(
  pipe, params, ____=3, return_train_score=____)

# Fit the grid search
gs = grid_search.____(____, ____)

# Store the results of CV into a pandas dataframe
results = pd.____(gs.____)

# Print the difference between mean test and training scores
print(
  results[____]-results['mean_train_score'])
Kodu Düzenle ve Çalıştır