MulaiMulai sekarang secara gratis

Menemukan pencilan dengan tabel silang

Sekarang Anda perlu menemukan dan menghapus pencilan yang Anda curigai ada dalam data. Untuk latihan ini, Anda dapat menggunakan tabel silang dan fungsi agregasi.

Perhatikan kolom person_emp_length. Anda sebelumnya telah menggunakan argumen aggfunc = 'mean' untuk melihat rata-rata kolom numerik, tetapi untuk mendeteksi pencilan Anda dapat menggunakan fungsi lain seperti min dan max.

Tidak masuk akal jika masa kerja seseorang kurang dari 0 atau lebih dari 60. Anda dapat menggunakan tabel silang untuk memeriksa data dan melihat apakah ada kasus seperti ini!

Himpunan data cr_loan telah dimuat di workspace.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create the cross table for loan status, home ownership, and the max employment length
print(pd.____(cr_loan[____],cr_loan[____],
        values=cr_loan[____], aggfunc=____))
Edit dan Jalankan Kode