F1 skoru
Gördüğün gibi, precision ve recall arasında bir ödünleşim (trade-off) var. İkisi de önemli ölçütler ve işletmenin churn’ü nasıl modellemek istediğine bağlı olarak birini diğerine göre iyileştirmeye odaklanmak isteyebilirsin. Çoğu zaman paydaşlar, model performansını sayısallaştıran tek bir ölçüte ilgi duyar. Bu durumlarda kullanabileceğin ölçütlerden biri AUC, bir diğeri ise aşağıdaki gibi hesaplanan F1 skorudur:
2 * (precision * recall) / (precision + recall)
F1 skorunun avantajı, precision ve recall’ı tek bir ölçütte birleştirmesidir; yüksek bir F1 skoru, sınıfların dengesiz olduğu durumlarda bile iyi performans gösteren bir modelin işaretidir. scikit-learn’de f-1 skorunu f1_score fonksiyonuyla hesaplayabilirsin.
Bu egzersiz
Pazarlama Analitiği: Python ile Müşteri Terkini Tahmin Etme
kursunun bir parçasıdırEgzersiz talimatları
sklearn.metricsiçindenf1_scorefonksiyonunu içe aktar.- Eğitilmiş rastgele ormanın F1 skorunu yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Instantiate the classifier
clf = RandomForestClassifier()
# Fit to the training data
clf.fit(X_train, y_train)
# Predict the labels of the test set
y_pred = clf.predict(X_test)
# Import f1_score
# Print the F1 score
print(____)