Örneklem boyutunu sınırlama
Aşırı öğrenmeyi önlemenin bir diğer yolu, Decision Tree içinde bir yaprak (veya düğüm) oluşturmak için gerekli minimum gözlem sayısını belirtmektir.
Bu egzersizde şunları yapacaksın:
- bu minimum sınırı 100 olarak ayarla
- yeni modeli çalışan verilerine uygula
- hem eğitim hem de test setindeki tahmin sonuçlarını incele
features_train, target_train, features_test ve target_test değişkenleri çalışma alanında zaten mevcut.
Bu egzersiz
İK Analitiği: Python ile Çalışan Terkini (Churn) Tahmin Etme
kursunun bir parçasıdırEgzersiz talimatları
DecisionTreeClassifier'ı başlat ve yaprak için minimum sınırı 100 gözlem olarak ayarla- Karar ağacı modelini eğitim verisine uygula.
- Hem eğitim hem de test setlerindeki tahminlerin doğruluğunu kontrol et.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Initialize the DecisionTreeClassifier while limiting the sample size in leaves to 100
model_sample_100 = DecisionTreeClassifier(____, random_state=42)
# Fit the model
____.fit(features_train,____)
# Print the accuracy of the prediction (in percentage points) for the training set
print(____.score(features_train,target_train)*100)
# Print the accuracy of the prediction (in percentage points) for the test set
print(____.____(features_test,target_test)*100)