Varsayılan eşikleme
DecisionTreeClassifier()'ın, önceki derste bahsedilen varsayılan sınıflandırma eşiği olan 0.5'i kullandığını doğrulamak istiyorsun. Tüm sınıflandırıcıların aynı eşiği kullanması sana garip geliyor. Hadi kontrol edelim! Senin için eğitilmiş bir karar ağacı sınıflandırıcısı clf önceden yüklendi; ayrıca eğitim ve test verileri de her zamanki adlarıyla hazır: X_train, X_test, y_train ve y_test. Sınıflandırıcıdan olasılık skorlarını .predict_proba() yöntemiyle çıkarman gerekecek.
Bu egzersiz
Python'da Machine Learning İş Akışları Tasarlama
kursunun bir parçasıdırEgzersiz talimatları
- Önceden yüklenmiş
clfsınıflandırıcısını kullanarak test örnekleri için skorlar üret. - Şimdi bu skorlardan etiketleri çıkar. Unutma, her örnek için tek bir skor değil, bir skor çifti var ve ikinci eleman pozitif sınıfın olasılığıdır.
- Şimdi test verilerini standart
.predict()yöntemiyle etiketle. - Son olarak, az önce elde ettiğin tahminlerle karşılaştır. Aynılar mı?
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Score the test data using the given classifier
scores = clf.____(____)
# Get labels from the scores using the default threshold
preds = [s[____] > ____ for s in scores]
# Use the predict method to label the test data again
preds_default = clf.____(____)
# Compare the two sets of predictions
____(preds == preds_default)