1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do vizualizace dat s ggplot2

Connected

cvičení

Overplotting 1: velké datové sady

Bodové grafy (pomocí geom_point()) jsou intuitivní, snadno srozumitelné a velmi rozšířené – musíme ale vždy myslet na overplotting (překrývání bodů), zejména v těchto čtyřech situacích:

  1. Velké datové sady
  2. Zarovnané hodnoty na jedné ose
  3. Data s nízkou přesností
  4. Celočíselná data

Pokud používáš plné tvary, obvykle se doporučuje průhlednost (alpha blending). Alternativně můžeš použít neprůhledné, duté tvary.

Malé body se hodí pro velké datové sady s oblastmi vysoké hustoty (kde se hodně bodů překrývá).

Pojďme si práci s velkými datovými sadami procvičit na datasetu diamonds.

Instrukce 1/2

undefined XP
  • 1

    Přidej do základního grafu vrstvu bodů.

    • Nastav průhlednost bodů na 0.5.
    • Nastav shape = ".", což odpovídá velikosti bodu 1 pixel.
  • 2

    Uprav tvar bodů tak, aby neměly obrysovou linku – nastav shape na 16.