MulaiMulai sekarang secara gratis

Ambang bawaan (default thresholding)

Anda ingin memastikan bahwa DecisionTreeClassifier() menggunakan ambang klasifikasi bawaan yang sama seperti disebutkan pada pelajaran sebelumnya, yaitu 0,5. Menurut Anda, aneh jika semua classifier menggunakan ambang yang sama. Mari kita periksa! Sebuah decision tree classifier terlatih clf sudah dimuat untuk Anda, begitu juga data latih dan uji dengan nama yang biasa: X_train, X_test, y_train, dan y_test. Anda harus mengekstrak skor probabilitas dari classifier menggunakan metode .predict_proba().

Latihan ini adalah bagian dari kursus

Merancang Alur Kerja Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Hasilkan skor untuk contoh uji menggunakan classifier clf yang sudah dimuat.
  • Sekarang ekstrak label dari skor tersebut. Ingat bahwa Anda memiliki sepasang skor untuk setiap contoh, bukan satu skor, dan elemen kedua adalah probabilitas kelas positif.
  • Sekarang beri label data uji menggunakan metode standar .predict()
  • Terakhir, bandingkan dengan prediksi yang Anda peroleh sebelumnya. Apakah keduanya identik?

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Score the test data using the given classifier
scores = clf.____(____)

# Get labels from the scores using the default threshold
preds = [s[____] > ____ for s in scores]

# Use the predict method to label the test data again
preds_default = clf.____(____)

# Compare the two sets of predictions
____(preds == preds_default)
Edit dan Jalankan Kode