MulaiMulai sekarang secara gratis

Sensitivitas terhadap pencilan

Saat menganalisis hubungan lebih dari satu variabel, korelasi adalah langkah awal yang bagus. Namun, bagaimana ketahanan korelasi terhadap himpunan data yang lebih menarik? Seberapa baik korelasi bertahan terhadap pencilan (outlier)?

Dalam latihan ini, Anda akan membuat plot dan menghitung korelasi untuk sebuah himpunan data yang memiliki pencilan, lalu menghapusnya dan melihat apa yang berubah. Pada akhirnya, Anda ingin melihat bagaimana performa korelasi dan menyimpulkan kapan dan di mana Anda sebaiknya menggunakannya.

Contoh himpunan data dari Anscombe's quartet yang terkenal telah diimpor untuk Anda sebagai variabel df, bersama semua paket yang digunakan sebelumnya di bab ini.

Latihan ini adalah bagian dari kursus

Berlatih Pertanyaan Wawancara Statistik dengan Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()
Edit dan Jalankan Kode