Aykırı değerleri hariç tutma
Şimdi student_data veri kümesini kullanarak evde internet erişimi olan öğrenciler ile olmayanların final notları ("G3") dağılımını karşılaştıralım. Bunu yapmak için, öğrencinin evde internet erişimi olup olmadığını evet/hayır (ikili) gösteren "internet" değişkenini kullanacağız.
İnternetin kırsal bölgelerde daha az erişilebilir olabileceğini düşünerek, öğrencinin yaşadığı yere göre alt gruplar ekleyeceğiz. Bunun için, öğrencinin kentsel ("Urban") ya da kırsal ("Rural") bir yerde yaşadığını belirten "location" değişkenini kullanabiliriz.
Seaborn zaten sns olarak ve matplotlib.pyplot da plt olarak içe aktarıldı. Anımsatma: Kutu grafiğinde aykırı değerleri showfliers=False ayarlayarak hariç tutabilirsin.
Bu egzersiz, kursun bir parçasıdır
Seaborn ile Veri Görselleştirmeye Giriş
Egzersiz talimatları
student_dataDataFrame'ini kullanarak, x eksenine"internet", y eksenine"G3"gelecek şekildesns.catplot()ile bir kutu grafiği oluştur.- Her bir kutu grafiğinin
"location"değişkenine göre renklendirileceği alt gruplar ekle. - Aykırı değerleri gösterme.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create a box plot with subgroups and omit the outliers
# Show plot
plt.show()