Aykırı değerleri hariç tutma
Şimdi student_data veri kümesini kullanarak evde internet erişimi olan öğrenciler ile olmayanların final notları ("G3") dağılımını karşılaştıralım. Bunu yapmak için, öğrencinin evde internet erişimi olup olmadığını evet/hayır (ikili) gösteren "internet" değişkenini kullanacağız.
İnternetin kırsal bölgelerde daha az erişilebilir olabileceğini düşünerek, öğrencinin yaşadığı yere göre alt gruplar ekleyeceğiz. Bunun için, öğrencinin kentsel ("Urban") ya da kırsal ("Rural") bir yerde yaşadığını belirten "location" değişkenini kullanabiliriz.
Seaborn zaten sns olarak ve matplotlib.pyplot da plt olarak içe aktarıldı. Anımsatma: Kutu grafiğinde aykırı değerleri showfliers=False ayarlayarak hariç tutabilirsin.
Bu egzersiz
Seaborn ile Veri Görselleştirmeye Giriş
kursunun bir parçasıdırEgzersiz talimatları
student_dataDataFrame'ini kullanarak, x eksenine"internet", y eksenine"G3"gelecek şekildesns.catplot()ile bir kutu grafiği oluştur.- Her bir kutu grafiğinin
"location"değişkenine göre renklendirileceği alt gruplar ekle. - Aykırı değerleri gösterme.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a box plot with subgroups and omit the outliers
# Show plot
plt.show()