Birçok değişkeni görselleştirme
Daha fazla değişkeni düşünmeye başladığında, hepsini aynı anda çizmek giderek zorlaşır. İki sayısal değişken için x ve y eksenlerini kullanmanın yanında, üçüncü bir sayısal değişken için rengi, kategorik değişkenler içinse bölümlendirmeyi (faceting) kullanabilirsin. Grafikler yorumlaması zor hale gelmeden önce sınırın aşağı yukarı burasıdır. Korelasyon ısı haritaları ve paralel koordinatlar gibi daha fazla değişkeni kaldıran özel grafik türleri de vardır, ancak bunlar her bir değişken hakkında çok daha az bilgi sunar ve model tahminlerini görselleştirmede pek iyi değildir.
Burada saçılım grafiğinin sınırlarını zorlayarak, tek bir grafikte hem ev fiyatını, MRT istasyonuna uzaklığı, yakındaki büfe sayısını hem de ev yaşını birlikte göstereceksin.
taiwan_real_estate hazır; ggplot2 yüklü.
Bu egzersiz
R'de Orta Düzey Regresyon
kursunun bir parçasıdırEgzersiz talimatları
taiwan_real_estateveri kümesini kullanarak, karekökü alınmışdist_to_mrt_mdeğişkenine karşın_conveniencesaçılım grafiğini çiz ve noktalarıprice_twd_msqile renklendir.- Sürekli viridis plasma renk skalasını kullan.
- Grafiği
house_age_yearsdeğişkenine göre sardı (wrap) olacak şekilde bölümlendir (facet).
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Using taiwan_real_estate, no. of conv. stores vs. sqrt of dist. to MRT, colored by plot house price
___ +
# Make it a scatter plot
___ +
# Use the continuous viridis plasma color scale
___ +
# Facet, wrapped by house age
___