Menemukan pencilan dengan tabel silang
Sekarang Anda perlu menemukan dan menghapus pencilan yang Anda curigai ada dalam data. Untuk latihan ini, Anda dapat menggunakan tabel silang dan fungsi agregasi.
Perhatikan kolom person_emp_length. Anda sebelumnya telah menggunakan argumen aggfunc = 'mean' untuk melihat rata-rata kolom numerik, tetapi untuk mendeteksi pencilan Anda dapat menggunakan fungsi lain seperti min dan max.
Tidak masuk akal jika masa kerja seseorang kurang dari 0 atau lebih dari 60. Anda dapat menggunakan tabel silang untuk memeriksa data dan melihat apakah ada kasus seperti ini!
Himpunan data cr_loan telah dimuat di workspace.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the cross table for loan status, home ownership, and the max employment length
print(pd.____(cr_loan[____],cr_loan[____],
values=cr_loan[____], aggfunc=____))