Aşırı çizim 1: büyük veri kümeleri
Saçılım grafikleri (geom_point() kullanarak) sezgiseldir, kolay anlaşılır ve çok yaygındır; ancak özellikle aşağıdaki dört durumda aşırı çizimi her zaman dikkate almalıyız:
- Büyük veri kümeleri
- Tek bir eksende hizalanmış değerler
- Düşük kesinlikli veri
- Tamsayı verisi
Genellikle, dolu şekiller kullanıldığında alfa harmanlama (yani saydamlık ekleme) önerilir. Alternatif olarak, opak, içi boş şekiller de kullanabilirsin.
Yoğunluğun yüksek olduğu (çok fazla örtüşmenin bulunduğu) büyük veri kümeleri için küçük noktalar uygundur.
Büyük veri kümesi durumunu ele almayı pratiğe dökmek için diamonds veri kümesini kullanalım.
Bu egzersiz, kursun bir parçasıdır
ggplot2 ile Veri Görselleştirmeye Giriş
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))
# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___