Sensitivitas terhadap pencilan
Saat menganalisis hubungan lebih dari satu variabel, korelasi adalah langkah awal yang bagus. Namun, bagaimana ketahanan korelasi terhadap himpunan data yang lebih menarik? Seberapa baik korelasi bertahan terhadap pencilan (outlier)?
Dalam latihan ini, Anda akan membuat plot dan menghitung korelasi untuk sebuah himpunan data yang memiliki pencilan, lalu menghapusnya dan melihat apa yang berubah. Pada akhirnya, Anda ingin melihat bagaimana performa korelasi dan menyimpulkan kapan dan di mana Anda sebaiknya menggunakannya.
Contoh himpunan data dari Anscombe's quartet yang terkenal telah diimpor untuk Anda sebagai variabel df, bersama semua paket yang digunakan sebelumnya di bab ini.
Latihan ini adalah bagian dari kursus
Berlatih Pertanyaan Wawancara Statistik dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()