Mengidentifikasi pencilan (outlier)
Mari lanjutkan dengan himpunan data laptops kita dan tangani beberapa pencilan yang tersembunyi. Pada latihan ini, kita akan berpegang pada teknik pertama yang dibahas di slide, yaitu menggunakan simpangan baku untuk mengidentifikasi nilai ekstrem, karena metode ini lebih umum digunakan dalam praktik.
Anda akan menghitung statistik deskriptif dan batas pencilan, lalu mengidentifikasi baris-baris yang termasuk pencilan sebelum menghapusnya dari himpunan data. Di sini Anda akan bekerja terutama dengan kolom Price.
Latihan ini adalah bagian dari kursus
Berlatih Pertanyaan Wawancara Statistik dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate the mean and std
mean, std = ____, ____