MulaiMulai sekarang secara gratis

Menghilangkan pencilan

Sekarang mari gunakan himpunan data student_data untuk membandingkan sebaran nilai akhir ("G3") antara siswa yang memiliki akses internet di rumah dan yang tidak. Untuk itu, kita akan menggunakan variabel "internet", yaitu indikator biner (ya/tidak) apakah siswa memiliki akses internet di rumah.

Karena internet mungkin kurang tersedia di daerah pedesaan, kita akan menambahkan subkelompok berdasarkan tempat tinggal siswa. Untuk ini, kita dapat menggunakan variabel "location", yang merupakan indikator apakah siswa tinggal di wilayah perkotaan ("Urban") atau pedesaan ("Rural").

Seaborn sudah diimpor sebagai sns dan matplotlib.pyplot sudah diimpor sebagai plt. Sebagai pengingat, Anda dapat menghilangkan pencilan pada box plot dengan menetapkan showfliers=False.

Latihan ini adalah bagian dari kursus

Pengantar Visualisasi Data dengan Seaborn

Lihat Kursus

Petunjuk latihan

  • Gunakan sns.catplot() untuk membuat box plot dengan DataFrame student_data, menempatkan "internet" pada sumbu x dan "G3" pada sumbu y.
  • Tambahkan subkelompok sehingga setiap box plot diberi warna berdasarkan "location".
  • Jangan tampilkan pencilan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a box plot with subgroups and omit the outliers






# Show plot
plt.show()
Edit dan Jalankan Kode