Sınıflandırma tahminleri
Model doğrulamada, çoğu zaman yalnızca nihai sınıflandırmadan daha fazlasını bilmek önemlidir. Bir oyunu kimin kazanacağını tahmin ederken, çoğu kişi bir takımın kazanma olasılığının ne kadar yüksek olduğunu da merak eder.
| Probability | Prediction | Meaning |
|---|---|---|
| 0 < .50 | 0 | Team Loses |
| .50 + | 1 | Team Wins |
Bu egzersizde, tic_tac_toe veri kümesini kullanarak .predict() ve .predict_proba() metotlarına bakacaksın. İlk metot, Birinci Oyuncu’nun oyunu kazanıp kazanmayacağına dair bir tahmin verir; ikinci metot ise Birinci Oyuncu’nun kazanma olasılığını döndürür. Rastgele orman sınıflandırma modeli olarak rfc’yi kullan.
Bu egzersiz
Python'da Model Doğrulama
kursunun bir parçasıdırEgzersiz talimatları
- İki tahmin dizisi oluştur: biri sınıflandırma değerleri, diğeri ise tahmin edilen olasılıklar için.
- Her sınıfa atanan gözlem sayılarını yazdırmak için pandas Series üzerinde
.value_counts()metodunu kullan. - Olasılıkların nasıl yapılandığını görmek için
probability_predictionsdizisinin ilk gözlemini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Fit the rfc model.
rfc.fit(X_train, y_train)
# Create arrays of predictions
classification_predictions = rfc.____(X_test)
probability_predictions = rfc.____(X_test)
# Print out count of binary predictions
print(pd.Series(____).____())
# Print the first value from probability_predictions
print('The first predicted probabilities are: {}'.format(____[____]))