Mengagregasi dan menetapkan ambang pada probabilitas
Ada banyak metode agregasi saat menggunakan ansambel. Yang paling populer adalah mean aritmetika dan median.
Anda hampir selalu dapat menggunakan mean, sementara median dapat Anda gunakan ketika Anda memiliki setidaknya tiga atau lebih pengklasifikasi dalam estimators.
Gunakan perataan aritmetika untuk menyaring pencilan dari himpunan data apple. probability_scores dan apple tersedia dari latihan sebelumnya. NumPy juga sudah dimuat.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Cari mean dari
probability_scoressepanjang baris. - Buat mask boolean yang mengembalikan True ketika probabilitas di atas 0.75.
- Gunakan mask
is_outlieruntuk menyaring pencilan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Find the mean across rows
mean_probs = ____
# Create a boolean mask that uses a 75% threshold
is_outlier = ____
# Use the mask to filter outliers from apple
outliers = ____
print(len(outliers))