1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Data Visualization with ggplot2

Connected

Cvičení

Použití stat_sum

V datasetu Vocab jsou proměnné education a vocabulary celočíselného typu. V úvodním kurzu jsi viděl/a, že to je jedna ze čtyř příčin přeplotování. Výsledkem by byl jediný bod v každém průsečíku mezi oběma proměnnými.

Jedno řešení, ukázané v kroku 1, je jitter s průhledností. Další možností je použít stat_sum(), které spočítá celkový počet překrývajících se pozorování a namapuje ho na estetiku size.

stat_sum() podporuje speciální proměnnou ..prop.., která zobrazuje podíl hodnot v rámci datasetu.

Pokyny 1/4

undefined XP
  • 1
    • Spusť kód a podívej se, jak jitter a průhlednost řeší přeplotování.
    • Nahraď roztřesené body součtovou statistikou pomocí stat_sum().
  • 2

    Uprav estetiku velikosti pomocí příslušné funkce pro škálování.

    • Přidej funkci scale_size() a nastav range od 1 do 10.
  • 3

    Uvnitř stat_sum() nastav size na ..prop.., aby velikost kružnice odpovídala podílu z celého datasetu.

  • 4

    Uprav graf tak, aby seskupoval podle education, a velikost kružnice tak vyjadřovala podíl v rámci skupiny.