Menghilangkan pencilan
Sekarang mari gunakan himpunan data student_data untuk membandingkan sebaran nilai akhir ("G3") antara siswa yang memiliki akses internet di rumah dan yang tidak. Untuk itu, kita akan menggunakan variabel "internet", yaitu indikator biner (ya/tidak) apakah siswa memiliki akses internet di rumah.
Karena internet mungkin kurang tersedia di daerah pedesaan, kita akan menambahkan subkelompok berdasarkan tempat tinggal siswa. Untuk ini, kita dapat menggunakan variabel "location", yang merupakan indikator apakah siswa tinggal di wilayah perkotaan ("Urban") atau pedesaan ("Rural").
Seaborn sudah diimpor sebagai sns dan matplotlib.pyplot sudah diimpor sebagai plt. Sebagai pengingat, Anda dapat menghilangkan pencilan pada box plot dengan menetapkan showfliers=False.
Latihan ini merupakan bagian dari kursus
Pengantar Visualisasi Data dengan Seaborn
Instruksi latihan
- Gunakan
sns.catplot()untuk membuat box plot dengan DataFramestudent_data, menempatkan"internet"pada sumbu x dan"G3"pada sumbu y. - Tambahkan subkelompok sehingga setiap box plot diberi warna berdasarkan
"location". - Jangan tampilkan pencilan.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a box plot with subgroups and omit the outliers
# Show plot
plt.show()