1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în vizualizarea datelor cu ggplot2

Connected

exercițiu

Suprapunerea punctelor 1: seturi mari de date

Diagramele de dispersie (realizate cu geom_point()) sunt intuitive, ușor de înțeles și foarte frecvent utilizate, însă trebuie să ții întotdeauna cont de suprapunerea punctelor (overplotting), în special în următoarele patru situații:

  1. Seturi mari de date
  2. Valori aliniate pe o singură axă
  3. Date cu precizie scăzută
  4. Date de tip întreg

De obicei, se recomandă utilizarea transparenței alpha (adică adăugarea de transparență) atunci când folosești forme solide. Ca alternativă, poți folosi forme goale (hollow), opace.

Punctele mici sunt potrivite pentru seturi mari de date cu zone de densitate ridicată (unde există multe suprapuneri).

Hai să folosim setul de date diamonds pentru a exersa tratarea cazului cu seturi mari de date.

Instrucțiuni 1/2

undefined XP
  • 1

    Adaugă un strat de puncte la graficul de bază.

    • Setează transparența punctelor la 0.5.
    • Setează shape = ".", dimensiunea punctului de 1 pixel.
  • 2

    Actualizează forma punctelor pentru a elimina contururile, setând shape la 16.