Ağacı budama
Aşırı uyum (overfitting), özellikle karar ağacı algoritması için analitik dünyasında klasik bir problemdir. Ağaç tamamen büyütüldüğünde, eğitim örneği için çok yüksek doğrulukta tahminler verebilir; ancak test setinde aynı doğruluğu sağlayamayabilir. Bu nedenle, karar ağacının büyümesi genellikle şu yollarla kontrol edilir:
- Ağacı “budamak” ve sahip olabileceği maksimum derinliğe bir sınır koymak.
- Ağacın bir yaprağındaki minimum gözlem sayısını sınırlamak.
Bu egzersizde şunları yapacaksın:
- ağacı budayıp büyümesini 5 derinlik seviyesinde sınırlamak
- modeli çalışan verilerine uydurmak
- tahmin sonuçlarını hem eğitim hem de test setlerinde sınamak.
features_train, target_train, features_test ve target_test değişkenleri çalışma alanında hazır durumda.
Bu egzersiz
İK Analitiği: Python ile Çalışan Terkini (Churn) Tahmin Etme
kursunun bir parçasıdırEgzersiz talimatları
DecisionTreeClassifier'ı başlatırken ağacın derinliğini 5 ile sınırla.- Eğitim setindeki
featuresvetarget'ı kullanarak Karar Ağacı modelini eğit. - Hem eğitim hem de test setlerindeki tahminlerin doğruluğunu kontrol et.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Initialize the DecisionTreeClassifier while limiting the depth of the tree to 5
model_depth_5 = DecisionTreeClassifier(____=5, random_state=42)
# Fit the model
____.fit(features_train,target_train)
# Print the accuracy of the prediction for the training set
print(____.____(features_train,target_train)*100)
# Print the accuracy of the prediction for the test set
print(model_depth_5.score(____,____)*100)