1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do vizualizace dat s ggplot2

Connected

cvičení

Overplotting 4: Celočíselná data

Podívejme se na poslední případ řešení overplottingu:

  1. Celočíselná data

Jde o proměnné typu integer (tedy 1, 2, 3…) nebo kategorické proměnné třídy factor. factor je jen speciální třída typu integer.

Překryvy mezi dvěma proměnnými bývají v takovém případě podobné jako v situaci 3 – tedy malý, přesně definovaný počet průsečíků. Snadno to ale přehlédneš, pokud si neuvědomíš, že celočíselná data a data typu factor mají nízkou přesnost.

Dataset Vocab obsahuje počty let vzdělání a skóre z testu slovní zásoby respondentů amerického General Social Survey z let 1972–2004.

Instrukce 1/4

undefined XP
  • 1
    • Prozkoumej dataset Vocab pomocí str().
    • Pomocí dat Vocab vykresli graf závislosti vocabulary na education.
    • Přidej bodovou vrstvu.
  • 2
    • Nahraď bodovou vrstvu vrstvou s jitterem.
  • 3
    • Nastav průhlednost jitteru na 0.2.
  • 4
    • Nastav tvar jitterovaných bodů na prázdné kruhy (shape 1).