Mendeteksi outlier dengan IForest
IForest adalah estimator yang andal dan hanya memerlukan beberapa baris kode untuk mendeteksi outlier dari himpunan data apa pun. Anda mungkin merasa sintaks ini sudah familiar karena sangat mirip dengan sintaks sklearn.
Versi lengkap data Big Mart Sales telah dimuat untuk Anda sebagai big_mart, yang dapat Anda jelajahi di konsol.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Impor estimator
IForestdaripyod. - Inisialisasi
IForest()dengan parameter bawaan. - Latih estimator dan hasilkan prediksi pada
big_martsecara bersamaan, lalu simpan hasilnya kelabels. - Gunakan penyaringan
pandasuntuk memfilter outlier daribig_mart.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import IForest from pyod
from pyod.____ import ____
# Initialize an instance with default parameters
iforest = ____
# Generate outlier labels
labels = ____
# Filter big_mart for outliers
outliers = ____
print(outliers.shape)