Aşırı çizim 1: büyük veri kümeleri
Saçılım grafikleri (geom_point() kullanarak) sezgiseldir, kolay anlaşılır ve çok yaygındır; ancak özellikle aşağıdaki dört durumda aşırı çizimi her zaman dikkate almalıyız:
- Büyük veri kümeleri
- Tek bir eksende hizalanmış değerler
- Düşük kesinlikli veri
- Tamsayı verisi
Genellikle, dolu şekiller kullanıldığında alfa harmanlama (yani saydamlık ekleme) önerilir. Alternatif olarak, opak, içi boş şekiller de kullanabilirsin.
Yoğunluğun yüksek olduğu (çok fazla örtüşmenin bulunduğu) büyük veri kümeleri için küçük noktalar uygundur.
Büyük veri kümesi durumunu ele almayı pratiğe dökmek için diamonds veri kümesini kullanalım.
Bu egzersiz
ggplot2 ile Veri Görselleştirmeye Giriş
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Plot price vs. carat, colored by clarity
plt_price_vs_carat_by_clarity <- ggplot(diamonds, aes(carat, price, color = clarity))
# Add a point layer with tiny points
plt_price_vs_carat_by_clarity + ___